计算广告与京东快车推荐广告位系统有哪些区别

solidworks | PHP | c4d | 细胞生物学 | HTML | 冬奥会 | 基因 | 营销策划 | 扫地机器人 | 武侠 | 大学生就业 | 电学 | 国航 | 电子技术研发 | 几何学 | 外星人 | 语言学 | 秦时明月之天行九歌 | 金融数学 | 三国人物 | 休学 | 小店区 | 杨紫 | 植保无人机 | CSS | 陶渊明 | 少数民族 | AutoCAD | 3d打印机 | 香港购物 | 日语语法 | 对联 | matlab | 按键精灵 | 粉丝（Fans） | 语言学习 | 总决赛 | 驾驶经验 | Spss数据分析 | 日本漫画 | 数学建模 | 道德 | 项目管理 | 背景音乐（bgm） | 云主机 | 3D Max | onenote | 游戏原画 | 科学 | 网站建设 | 热血传奇（游戏） | 身高 | 网站运营 | 道教 | 社会学 | 迅雷（软件） | 爬虫（计算机网络） | O2O | 运载火箭 | 遗传学 | 率土之滨 | 百度输入法 | 极限挑战(综艺节目) | 电梯 | 女性主义 | Adobe After Effects | mysql | 办公软件 | 法国 | ps3 | 化学实验 | QQ群 | 中国中央电视台 | 前女友 | 性格 | 免费软件 | 分子生物学 | 金庸小说 | 留学生 | Microsoft SQL Server | 龙珠 | 设计院 | C#编程 | 虚拟机 | 字幕 | 微信群 | 创业项目 | 祛痘 | 图形处理器（gpu） | Microsoft Visual Studio | 动物保护 | C/C++ | facebook | 秦岭 | 燕窝 | 人性 | 下载 | 驾驶技术 | 大学数学 | 封神演义 | 整容 | 西装 | 马克思主义哲学 | 计算机专业 | pdf | thinkpad | 代理 | 参考文献 | 江苏大学 | 游戏手柄 | 城市规划 | 黑洞 | 旅行 | CAD制图 | 风水 | 直播 | 快捷键 | 编辑器 | 机器学习 | 暴走大事件 | 球球大作战 | unity（游戏引擎） | 永恒之塔 | DJI大疆创新 | 传统文化 | wordpress | 仙剑奇侠传（游戏） | 国际物流 | 安徽 | 配音 | 猎头公司 | 在线教育 | 欧洲冠军联赛 | ios游戏 | 洛奇英雄传 | 暗恋 | 网盘 | 星座爱情 | 剧场版 | 面相 | 讯飞输入法 | 记忆力 | 超级战队 | stm32 | 亚马逊中国 | Apple ID | 服装设计 | 网络主播 | 品牌营销 | 情侣 | 新加坡 | 调酒 | 雷欧奥特曼 | 花样姐姐 | 物联网 | 任天堂3ds | 易经 | 户型 | 流氓软件 | 圣经 | 进化 | 垃圾分类 | 函数 | 星际穿越（电影） | 山东工艺美术学院 | 优酷视频 | github | 舰队 Collection | 流行音乐 | 进击的巨人 | playstation vita | 科学研究 | 欢乐麻将 | 史莱姆 | 海关 | Internet Explorer | 刑事案件 | 取名 | 江苏银行 | eDonkey网络 | 表情包 | mfc | 大学军训 | 诸葛亮 | Apple WATCH | 嵌入式系统 | 私募证券投资基金 | iOS应用 | 对外经贸大学 | 最强大脑（电视节目） | 青蛙 | 日本代购 | 巧克力 | 天涯明月刀ol（游戏） | 食用油 | 曹操 | SEO | 生命 | 乌贼 | 我的英雄学院 |

你的位置：网站首页 >> 频道首页 >>商业 >>计算广告与京东快车推荐广告位系统有哪些区别

计算广告与京东快车推荐广告位系统有哪些区别

来源：蜘蛛抓取(WebSpider) 时间：2017-07-12 09:23 标签：广告推荐系统

计算广告与推荐系统有哪些区别_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
计算广告与推荐系统有哪些区别
上传于|0|0|文档简介
&&计算广告与推荐系统有哪些区别
阅读已结束，如果下载本文需要使用1下载券
想免费下载本文？
定制HR最喜欢的简历
你可能喜欢推荐系统是计算广告的一部分？谁说的，过来我保证不打死你
我的图书馆
推荐系统是计算广告的一部分？谁说的，过来我保证不打死你
出处：知乎_宋一松
在Facebook工作的时候做的是newsfeed ranking （新鲜事排序），算是一种推荐系统吧，而且newsfeed中也包含了广告（Feed Ads）。说说我的理解。
结论：推荐系统和计算广告是不同维度上的概念。推荐系统是一种技术，广告是一项业务。个性化推荐可以用在广告中，更可以用在别的产品层面。同时，个性化推荐只是计算广告的一个环节，一个完整的广告系统还需要其他很多重要的技术组件。
0. 个性化推荐在广告之外的很多产品层面都有应用
几个常见的应用领域：
有机内容(organic content)的筛选与排序: Facebook，知乎，今日头条的新鲜事都是个性化排序的结果。Spotify也是类似的例子。个性化推荐做的好不好直接影响产品的活跃度(engagement)和存留(retention)。
一些Growth Hack也极为依赖个性化推荐的质量：最为常见的例子就是Facebook/知乎上“你可能认识/感兴趣的人”。关注的人越多质量越好，用户存留的可能性就越大。
Amazon和Netflix的推荐购买/观看：这个就比较接近广告了。
1. 广告系统也不仅仅只有个性化推荐
一个完整的广告系统，从广告商投放广告到用户看到广告，需要以下几个重要组件：
[面向广告商的工具] 广告商可以根据自己的需要定制投放人群：年龄，性别，地理位置，职业，兴趣等等。
[算法] 个性化推荐：在众多符合条件的广告中选择最合适的一个。
[算法] 决定在哪里放广告：这在以前其实不是个事，因为就几个能放广告的固定位置（banner，页面右侧）。然而随着Facebook发明了Feed Ads，在新鲜事里放原生广告成了社交类产品的标配。以微信为例，在朋友圈里的第几个位置放广告其实是个挺有学问的事。放高了影响用户正常体验，放低了没人看得到。这大该就是微信口中的“实时社交混排算法”吧。
[算法] 定价：放的这个广告该跟广告商要多少钱。这受很多因素影响：放的位置高低，有多少个其他广告一起竞价，等等。
所以，个性化推荐只是整个广告流程的一个小部分。不过，好的个性化推荐可以提高广告的点击率，从而增加产品营收。
2. 个性化推荐不一定非要是机器学习
很多人把个性化推荐等同于机器学习，甚至deep learning。这在严格意义上其实是不准确的。个性化推荐本质上是一组算法。这些算法可以是基于机器学习的，也可以是基于其他信号或者策略。比如说：
Amazon和Netflix最早的推荐系统就是item-item的算法。本质上是基于用户评价计算任何两件商品的相似度，生成一个巨大的二维矩阵。很难说这是机器学习。
Facebook最早的新鲜事排序就是基于一些人工制定的规则，表现也挺不错，以至于基于机器学习的实现在很久之后才在A/B test中击败人工规则。
Pandora的曲库是人工打标签，基于此生成个性化推荐。连机器都没怎么用。
不过广告系统中的个性化推荐一般都是机器学习，Supervise learning对广告这方面有极为成熟的方案。
举个栗子：
Edgerank 是几年前外界对Facebook Newsfeed上的新鲜事排序算法的称呼。
至于是怎么算的，这其实可以出成一道面试题，不妨以知乎为例。题目就是，你觉得应如何对知乎的新鲜事排序？
具体问题描述：
知乎用户刘看山，他关注了100个人，30个专栏，10个话题。在他打开知乎的一瞬间，将有100个最新动态等着他，你要怎么给这100个新鲜事排序？
当然，作为知乎官方，你掌握着几乎所有知乎用户的信息，包括刘看山的。他经常给谁点赞，经常关注哪个话题下面的问题，这些你都知道。哦，对了，你只有50毫秒时间。超过50毫秒刘看山就会不耐烦了。
你该怎么办？
0. 这些新鲜事对用户而言质量各有高低
如果你让刘看山自己看一遍这100个新鲜事，他大概能说出自己更喜欢哪个，更不喜欢哪个。比如，他更喜欢张佳玮的答案，张公子的回答他基本都会点开看。他不太喜欢抖机灵的回答，即使赞同数很高他也只是扫一眼就过去。
我们要做的，就是用模型化的语言描述这件事。
1. 确定一个变量作为优化目标
这个变量，要能反映新鲜事的质量。一组常用的变量就是互动数：点开，赞同，感谢。好的新鲜事应该能吸引到更多的互动，这样的新鲜事也更应该排在前面。
当然另一方面，用什么变量来定义成功其实不是一个简单的问题。Twitter的创始人之一 Evan Williams 就曾发文警告用单一变量定义成功的危险性。我们在这里也可以考虑其他信号，比如说，被很多用户点选“没有帮助”的新鲜事很可能质量不高，又或者用户花了很长时间在上面的新鲜事很可能质量不错。于是，“没有帮助”数和阅读时长也可以成为我们的优化目标之一。
2. 预测用户在哪个新鲜事上更可能触发我们的目标变量
或者说，在哪个新鲜事上刘看山更可能点开/赞同/收藏/分享/长时间阅读，在哪个新鲜事上更可能选不再显示/没有帮助，前者要排高点，后者排低点。
这就是机器学习(Machine Learning)派上用场的时候了。具体用什么算法是个开放性问题。可以是Logistic Regression，可以是SVM，还可以是别的，各有各的特点。（真要是做ML的面试题，这里会和选手展开讨论一下）
算法不重要，那什么重要？Feature。这就是知乎数据库里的那些数据的作用了。刘看山之前赞过张公子几次，这个回答被总共看了几次并赞了几次，这些都是feature。从历史看未来。Feature是强大的模型的关键。
3. 故事还没有结束
学术上，这个模型已经差不多成型了。然而在实际应用中，很多问题还应付不了。比如说：
刘看山看到张公子赞了别人的一个回答，大概读了下，没意思，就过去了。后来刘看山所关注的张小北也赞了这个回答。这时候这个新鲜事要怎么排序？
刘看山出远门一周没上知乎，回来一上知乎1000个新鲜事可以排序。好不容易排完了，刘看山看了10个就关浏览器了。一个小时之后刘看山再上知乎的时候，之前剩下的990个新鲜事你要怎么办？
你会发现，这个问题，与其说是算法，不如说是涉及产品本身的决策。所以说，好的ranking engineer都是半个PM (还有半个Data Scientist和半个Growth Hacker）。
TA的最新馆藏实时推荐系统的3种方式 - 简书
实时推荐系统的3种方式
推荐系统介绍
自从1992年施乐的科学家为了解决信息负载的问题，第一次提出协同过滤算法，个性化推荐已经经过了二十几年的发展。1998年，林登和他的同事申请了“item-to-item”协同过滤技术的专利，经过多年的实践，亚马逊宣称销售的推荐占比可以占到整个销售GMV（Gross Merchandise Volume，即年度成交总额）的30%以上。随后Netflix举办的推荐算法优化竞赛，吸引了数万个团队参与角逐，期间有上百种的算法进行融合尝试，加快了推荐系统的发展，其中SVD（Sigular Value Decomposition，即奇异值分解，一种正交矩阵分解法）和Gavin Potter跨界的引入心理学的方法进行建模，在诸多算法中脱颖而出。其中，矩阵分解的核心是将一个非常稀疏的用户评分矩阵R分解为两个矩阵：User特性的矩阵P和Item特性的矩阵Q，用P和Q相乘的结果R'来拟合原来的评分矩阵R，使得矩阵R'在R的非零元素那些位置上的值尽量接近R中的元素，通过定义R和R'之间的距离，把矩阵分解转化成梯度下降等求解的局部最优解问题。Netflix最新的实时推荐系统如图9-5所示。
图9-5 NetFlix的实时推荐系统系统架构图（来源：）与此同时，Pandora、LinkedIn、Hulu、Last.fm等一些网站在个性化推荐领域都展开了不同程度的尝试，使得推荐系统在垂直领域有了不少突破性进展，但是在全品类的电商、综合的广告营销上，进展还是缓慢，仍然有很多的工作需要探索。特别是在全品类的电商中，单个模型在母婴品类的效果还比较好，但在其他品类就可能很差，很多时候需要根据品类、推荐栏位、场景等不同，设计不同的模型。同时由于用户、SKU不停地增加，需要定期对数据进行重新分析，对模型进行更新，但是定期对模型进行更新，无法保证推荐的实时性，一段时间后，由于模型训练也要相当时间，可能传统的批处理的Hadoop的方法，无法再缩短更新频率，最终推荐效果会因为实时性问题达到一个瓶颈。推荐算法主要有基于人口统计学的推荐、基于内容的推荐、基于协同过滤的推荐等，而协同过滤算法又有基于邻域的方法（又称基于记忆的方法）、隐语义模型、基于图的随机游走算法等。基于内容的推荐解决了商品的冷启动问题，但是解决不了用户的冷启动问题，并且存在过拟合问题（往往在训练集上有比较好的表现，但在实际预测中效果大打折扣），对领域知识要求也比较高，通用性和移植性比较差，换一个产品形态，往往需要重新构建一套，对于多媒体文件信息特征提取难度又比较大，往往只能通过人工标准信息。基于邻域的协同过滤算法，虽然也有冷启动问题和数据稀疏性等问题，但是没有领域知识要求，算法通用性好，增加推荐的新颖性，并且对行为丰富的商品，推荐准确度较高。基于模型的协同过滤算法在一定程度上解决了基于邻域的推荐算法面临的一些问题，在RMSE（Root Mean Squared Error，即均方根误差）等推荐评价指标上更优，但是通常算法复杂，计算开销大，所以目前基于邻域的协同过滤算法仍然是最为流行的推荐算法。基于邻域的协同过滤主要分为User CF和Item CF，根据以下条件不同，各自又有不同的使用场景。计算量大小不同。基于邻域的协同过滤的时间复杂度为
, 其中n为用户数，m为产品数，应用SVD等降维方法可以降低算法复杂度，但是分解矩阵又会花费一定的时间。数据稀疏性倾斜度不同。例如，User CF主要基于用户对共同项目的评分，如果用户远远多于物品，没有足够评分将导致两个用户很少有共同评分的项目，找最近邻用户非常的不准确，虽然通过基于BP神经网络、朴素贝叶斯分类、基于内容的预测等方法可以填充矩阵，但是都会不同程度地带来的计算时间。对于用户数量远远大于产品，并且产品相对稳定的电商系统，计算产品相似度计算量小，适用Item CF，否则用户量大，并且如果用户购买频繁，计算用户相似度计算量很大，极端情况下，100个用户对应2个产品，一个要计算C1002次相似度，一个只要计算C22，即一次相似度；反之，对于更新频繁，物品数量海量的新闻、博客、微博等系统，User CF效果更好。当然，虽然SVD在分解矩阵上花费了一定时间，同时降维也会导致用户-项目矩阵中的信息丢失，但是用户-项目矩阵降维后, 运算复杂度大大降低，同时矩阵稀疏性问题得到了较好地解决，作为Netflix比赛中最终提升效果较好的两个方法之一，被众多网站采用。用户-项目矩阵中的信息丢失问题可以通过选取合适的保留维数k在一定程度上得到缓解。在一个电商系统中，有商品、类目、品牌、团购、闪购、搜索、店铺、广告、促销活动、抵用券等诸多实体；有首页的大轮播、猜你喜欢栏位，详情页的看了还看、看了还买、推荐品牌等栏位，购物车页面的买了还买、凑单免邮等栏位。如何在不同的栏位融入不同的推荐算法给用户推荐相应的实体，构建出属于电商自己的场景引擎，实现全站精准化，让网站的GMV或者利润达到最高，是每一个电商需要思考的问题。在实际中，很多推荐算法不一定要求实时，实时推荐在哪些场景下能带给栏位更高的GMV转化率，也是需要一定时间摸索和试错的。目前基于用户画像的推荐，主要用在基于内容的推荐，从最近的RecSys大会（ACM Recommender Systems）上来看，不少公司和研究者也在尝试基于用户画像做Context-Aware的推荐（情境感知，又称上下文感知）。利用用户的画像，结合时间、天气等上下文信息，给用户做一些更加精准化的推荐是一个不错的方向。9.2.2 实时推荐系统的方法目前的商用推荐系统，当用户数和商品数达到一定数目时，推荐算法都面临严重的可扩展性问题，推荐的实效性变得非常差，如何在算法和架构上提高推荐速度是很多公司不得不思考的问题。目前，在算法上主要通过引入聚类技术和改进实时协同过滤算法提高推荐速度；在架构上，目前实时推荐主要有基于Spark、Kiji框架和Storm的流式计算3种方法。1．聚类技术和实时协同过滤算法在算法上，一般采用EM（Expectation-Maximization）、K-means、吉布斯（Gibbs Sampling）、模糊聚类等聚类技术提高推荐速度。因为使用聚类技术可以大大缩小用户或项目的最近邻居搜索范围，从而提高推荐的实时性，如表9-1所示。
除此之外，实时协同过滤算法本身一直是人们研究的热点，早在2003年，Edward F. Harrington就第一次提出了基于感知器的实时协同过滤算法，但是这种方法需要所有用户的偏好，实用性较差；2010年，杨强等提出了实时进化的协同过滤算法，给予新得分更高的权重来增量更新User和Item的相似度；2011年，UC Berkeley的Jacob Abernethy等人提出了OCF-SGD算法，我们知道传统的矩阵分解把用户评分矩阵R分解成多个矩阵，比如R≈P*Q，该方法提出当新来一个User到Item的得分，把更新R矩阵的问题转换成更新P和Q矩阵，从而达到实时协同过滤；近几年的RecSys大会上，实时协同过滤也是讨论的热点，OCF-SGD算法每次只考虑一个用户，忽略了用户之间的关系，Jialei Wang等人提出了基于多任务学习的实时协同过滤算法，把每一个用户当做一个任务，定义一个表示各个任务间相似性和交互程度的矩阵A，当新来一个User到Item的得分，通过矩阵A来更新其他用户的得分。2．基于Spark的方式在架构上，第一种是使用Spark把模型计算放在内存中，加快模型计算速度，Hadoop中作业的中间输出结果是放到硬盘的HDFS中，而Spark是直接保存在内存中，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的模型计算，如表9-2所示。
（来源：）3．基于Kiji框架的方式第二种是使用Kiji，它是一个用来构建大数据应用和实时推荐系统的开源框架，本质上是对HBase上层的一个封装，用Avro来承载对象化的数据，使得用户能更容易地用HBase管理结构化的数据，使得用户姓名、地址等基础信息和点击、购买等动态信息都能存储到一行，在传统数据库中，往往需要建立多张表，在计算的时候要关联多张表，影响实时性。Kiji与HBase的映射关系如表9-3所示。
Kiji提供了一个KijiScoring模块，它可以定义数据的过期策略，如综合产品点击次数和上次的点击时间，设置数据的过期策略把数据刷新到KijiScoring服务器中，并且根据自己定义的规则，决定是否需要重新计算得分。如用户有上千万浏览记录，一次的行为不会影响多少总体得分，不需要重新计算，但如果用户仅有几次浏览记录，一次的行为，可能就要重新训练模型。Kiji也提供了一个Kiji模型库，使得改进的模型部署到生产环境时不用停掉应用程序，让开发者可以轻松更新其底层的模型。4．基于Storm的方式最后一种基于 Storm 的实时推荐系统。在实时推荐上，算法本身不能设计的太复杂，并且很多网站的数据库是TB、PB级别，实时读写大表比较耗时。可以把算法分成离线部分和实时部分，利用Hadoop离线任务尽量把查询数据库比较多的、可以预先计算的模型先训练好，或者把计算的中间数据先计算好，比如，线性分类器的参数、聚类算法的群集位置或者协同过滤中条目的相似性矩阵，然后把少量更新的计算留给Storm实时计算，一般是具体的评分阶段。基于Storm的实时推荐系统基于本章前面的学习，我们可以设计图9-6所示的实时推荐系统。
图9-6 实时推荐系统（图片来源PRANAB GHOSH，Big Data Cloud meetup。版权归原书作者所有）用HBase或HDFS存储历史的浏览、购买行为信息，用Hadoop基于User CF的协同过滤，先把用户的相似度离线生成好，用户到商品的矩阵往往比较大，运算比较耗时，把耗时的运行先离线计算好，实时调用离线的结果进行轻量级的计算有助于提高产品的实时性。我们来简单回顾一下协同过滤算法（如图9-7所示）：首先程序获取用户和产品的历史偏好，得到用户到产品的偏好矩阵，利用Jaccard相似系数（Jaccard coefficient）、向量空间余弦相似度（Cosine similarity）、皮尔逊相关系数（Pearson correlation coefficient）等相似度计算方法，得到相邻的用户（User CF）或相似商品（Item CF）。在User CF中，基于用户历史偏好的相似度得到邻居用户，将邻居用户偏好的产品推荐给该用户；在Item CF中，基于用户对物品的偏好向量得到相似产品，然后把这款产品推荐给喜欢相似产品的其他用户。
图9-7 协同过滤算法过程
然后通过Kafka或者Redis队列，保存前端的最新浏览等事件流，在Storm的Topology中实时读取里面的信息，同时获取缓存中用户topN个邻居用户，把邻居用户喜欢的商品存到缓存中，前端从缓存中取出商品，根据一定的策略，组装成推荐商品列表。当然除了相似性矩阵，其他模型大体实现也相似，比如实际的全品类电商中不同的品类和栏位，往往要求不同的推荐算法，如母婴产品，如图9-8所示，如果结合商品之间的序列模式和母婴年龄段的序列模式，效果会比较好，可以把模型通过Hadoop预先生成好，然后通过Storm实时计算来预测用户会买哪些产品。
图9-8 序列模式在母婴类目推荐中的应用
本文摘自，点击阅读原文可以购买。
程序员书屋公众号：programmer-book
程序员书屋QQ群：
联系我qq：
出版圈里混混一名，没事给大家推推技术书，分享分享第一手干货样章，偶尔来个赠书，发点福利。刘鹏：不了解计算广告就难以真正理解大数据
发表于 06:27|
作者周建丁
摘要：大数据、人工智能技术变现的模式，当前首推在线广告。《计算广告》作者刘鹏（北冥乘海生）近日接受了CSDN记者的专访，介绍了技术从业者需要如何响应计算广告的发展。
大数据、人工智能技术变现的模式，当前首推在线广告。《计算广告》一书作者刘鹏（）近日接受了CSDN记者的专访，介绍了技术从业者需要如何响应计算广告的发展。刘鹏表示，不了解计算广告，就不可能深入地了解互联网，也不太容易真正理解大数据。技术从业者需要从行业、宏观的角度认识这个领域，进而掌握相应的思考方法和技术，包括商业产品的思路和工作方法，信息检索、机器学习、最优化、博弈论等基础数学工具，以及Hadoop、Spark和其他开源工具为核心的大数据基础设施等。他认为，在计算广告中人工智能/机器学习应用的挑战更加巨大：面对的是有千万网民的反馈形成的、快速变化的数据空间，并没有确定的ground truth，也无法通过均匀地对总体空间进行采样构建鲁棒的训练集，更为严重的是，由于建模的是人的行为，而人的行为又极大程度地受到系统输出的影响。刘鹏360商业产品首席架构师刘鹏现任360商业产品首席架构师，负责 360 商业化变现的产品和技术。曾任微软亚洲研究院研究员、雅虎北京研究院高级科学家 ( 负责全球搜索广告、受众定向广告、个性化内容等项目 ) 、 MediaV 首席科学家 ( 负责算法和数据平台 ) 、以及搜狐集团研究院负责人。以下为采访文字实录：CSDN：您的新作《计算广告》，宣传是“世界第一本关于计算广告的书籍”，也就是说计算广告是一门比较新的课题，首先请简单介绍您在这个领域所做的工作。刘鹏：如果出于宣传的目的，称此书为“世界第一本关于计算广告的书籍”，我现在是不拒绝的，毕竟咱们也得向一些年轻的创业者们学一点儿吹牛的皮毛。关上门来说，这当然不是第一本与计算广告相关的书籍。不过我们写此书的动力，确实是看到市场上全面介绍这一领域的商业逻辑与产品技术的出版物太稀缺了，而“计算广告”这个问题对于互联网企业来说又太重要了。互联网在风口上，计算广告在风口上，但为这个领域写一本全面的入门读物不在风口上，不在风口上的事，才有真正的社会增量价值。于是，当然而不让，我们整理了这本书，希望起到抛砖引玉的作用。其实我在这个领域也只能算是个小学生，因为这也是一个新兴的工业界问题，没有什么真正的专家和权威，只有无限的未来和发展。由于我在过去的工作中，深入参与过的广告产品比较多：从搜索广告到显示广告、从需求放到供给方，都有过一些一线的经验，近年来又深入接触了很多用户产品的运营者和创业者，了解了一些他们对于变现的困惑与渴望，这些经验是本书写作的基础。CSDN：能否从计算广告形成的背景、发展的趋势出发，分享计算广告对当今技术从业者带来的影响？刘鹏：首先，不了解计算广告，就不可能深入地了解互联网，因为广告之成了全世界互联网行业的大部分收入；其次，不了解计算广告，也不太容易真正理解大数据，因为大数据最早的应用，也是到目前为止唯一获得规模化营收的应用，就是在线广告。对于技术从业者而言，我们特别希望大家从行业的、宏观的视角去了解这一领域，进而掌握相应的思考方法和技术，而不是一上来就纠结于“点击率模型应该用什么比较好”这样形而下的问题。CSDN：基于大数据，目前很多互联网公司的都采用了机器学习来做各种预测分析，那么为了实现更精准高效的效果，计算广告必然要走向与人工智能、机器学习尤其是深度学习的结合吗？刘鹏：谈到人工智能，我的看法是，人工智能领域发展的一个的重点方向，将会从认知和模拟自然世界，向认知和响应社会现象进发。在传统的语音识别、人脸识别这样的人工智能应用中，我们是在对一个基本确定的、变化不快的数据空间进行建模；而在计算广告这样的应用中，我们面对的是有千万网民的反馈形成的、快速变化的数据空间。在后者这样的问题中，并没有确定的ground truth，也无法通过均匀地对总体空间进行采样构建鲁棒的训练集，并且更为严重的是，由于建模的是人的行为，而人的行为又极大程度地受到系统输出的影响。因此，面向社会现象的的人工智能问题，将会更加有挑战，也更加令人兴奋。从工具上来说，除了基本的机器学习（包括近年来兴起的深度学习）、信息检索，更多博弈论和强化学习的手段在这类问题中才会真正找到用武之地，从而真正成熟起来。CSDN：面对计算广告的任务，技术人员需要掌握哪些方面的技能和工具？有没有比较好的学习路径以及职业发展规划可以推荐？另外，您的团队在相关的工作中又是使用了哪些工具？刘鹏：计算广告是个相当综合的问题，对于每个技术人员来说，需要对整体框架和关键产品技术有所了解，但是很难、也并不见得需要对其中的每个方面都做到精通。总体而言，我认为目前最为稀缺的，是掌握了商业产品的思维方式、有实战经验和运营落地思路的产品经理，以及对广告系统全貌有把握能力的架构师，关于这两个大方向，可以要结合自己的兴趣和特长做些职业规划。从学习路径上来看，我反对以工具为中心，支持以问题为中心的学习方法，换句话说，我真心希望大家在看我们的书时以通读和理解问题为主、以精读和解决问题为辅——毕竟对于工业界来说，将问题形式化地描述出来，就解决了一大半。如果说到具体的基础技能，我觉得一方面是商业产品的思路和工作方法，这一点与用户产品用巨大的不同；另一方面是信息检索、机器学习、最优化、博弈论这些基础数学工具；再有就是以Hadoop、Spark和其他开源工具为核心的大数据基础设施。有关哪些人需要掌握哪些基础知识，以及这些知识在整个计算广告产品体系中的作用和位置，我们在书中有相应的介绍（微信号：Comp_Ad）。CSDN：您的这本书既有商业逻辑，也深入到广告技术和算法，总体还是偏向技术，能否介绍您写这本书的初衷是什么？打算写给哪些人阅读？他们能从中获得什么？刘鹏：关于本书的初衷，我已经写在书的后勒口上了。既然您提到，我就附在这里：用计算的力量改变世界是每一个程序员的梦想，而本书的主题正是用计算将数据和流量变成财富。这样的后向变现使得许多对用户有价值、但直接利润微薄的信息产品，在互联网时代找到了爆发式成长的机会。从这个角度来看，我们希望本书能够成为一本启示录，帮助每一个互联网人真正理解后向变现对于互联网生产力的巨大解放，真正理解数据资产的巨大价值。对于已经开启商业化进程的企业，洞悉广告市场复杂的交易结构和产品特点，并选择合理高效的产品方案和技术架构，是商业化必须面对的第一步。从这个意义上说，我们还希望本书成为一本操作指南，辅助您的商业化团队更顺利地认知和践行技术驱动的营销与变现。由于需要综合用到计算机科学、经济学、心理学等多学科的知识，并需要相当的工业实践基础，因此计算广告的人才相当稀缺。从这个目的出发，本书还希望成为一本特殊的教科书，帮助那些具备扎实基础知识的同学们形成从问题出发的思考方法和分析能力，迅速成长为工业界的中流砥柱。CSDN：这本书是您和您的“学生”合作的，能否谈谈两位作者是如何分工的？刘鹏：王超是我以前的同事，他说是我的学生不过是一句谦辞，大家不要当真。书的主体框架是由我搭建，王超负责其中一些章节的写作，并且主要负责了产品案例和算法示例代码的部分。书的主体内容是我写为主的，这样讲不是为了争功，而是希望大家发现问题和发生不满时，应该把我当成主要责任人。CSDN：您在微博中还提到这本书成书经过不少波折，能否分享一下，写这本书的困难，是因为时间的平衡、技术实验的挑战还是别的原因？刘鹏：最大的一个困难，就是我们确实意识到自己的能力有限，说句形象的话，有点拿不动。实际上这本书的起意已经过去了两年多，中间一直对自己能否完成一本基本靠谱的领域指南信心不足，再加上这两年在线广告市场本身的突飞猛进，我们一直试图将最新的内容综合呈现在大家面前，所以前前后后花了很多时间。另外，在书的出版过程中，由于我个人的经验缺乏，可能也走了一些的弯路。例如，因为公式的原因，我一直坚持用Latex排版（实际上，明确表示不能用Latex排版的出版社，我一开始是无法接受的），但是国内的排版公司对Latex熟悉程度比我想象的差得多，这个过程就耽误了不少时间。现在回过头来看，是不是可能采用其他的排版工具（例如InDesign）呢？我还不知道，但是确实应该研究一下，做到兼听则明。在这里要特别感谢本书的责任编辑、人邮社的杨海玲老师，在书的编辑、排版过程中付出的巨大心血和耐心。（最后顺便吐个槽，用Word排版是我绝对无法接受的，那样的话宁可不出。珍爱生命，远离Word是我的人生原则。）CSDN：您认为目前计算广告现在还有哪些需要解决的问题？能否分享您下一步的研究计划？刘鹏：这个问题太大了，谈到本领域需要解决的问题，一般都是商业公司在PR宣传中提到，并进而引出他们自己的产品。我没有这个目的，因此只好说，对于计算广告而言，其实现在不是要谈论有哪些需要解决的问题，而是还远远没有成熟，因此这个领域的变化实在是太快了。我们还是一起“stay hungry，stay foolish”，跟上业界的发展节奏，在实践中发现和解决问题。要说明一点，我不是一个学术研究者，只是一个工业实践者，所以也谈不到什么研究计划。如果说希望真正的学术界如何参与到这个领域当中来，我希望大家能真正放下论文和冗长繁复的引用链条，先黑手黑脚地深入到工业界的实际问题中，了解真正的学术痛点和实施约束在哪里。说句大言不惭的话，不妨从本书开始，做个入门性的了解。CSDN：作为一位技术管理者，您有余力著书，对工作时间和业余时间的安排有哪些经验可以分享？刘鹏：我可以直言不讳地表达我的观点：对于大多数技术人员来说，家庭应该被放在比工作更重要的位置上。这倒不是号召大家不要加班，抗议血汗老板，而是希望大家真正能用心去感受渐渐老去的父母对你的关怀，咿呀学语的孩子对你的期盼。对于我来说，工作上获得的，无论是金钱、名誉还是其他，支持我的唯一动力就是将它们与我的家人分享，让他们过上舒适的生活，并且满意于我的努力与现状。再从技术管理的角度来说，我同样认为，加班虽然不可避免，并且在互联网快速迭代的常态下是一项重要的武器，但是常态化的加班，实际上对生产力的贡献可以忽略不计。更加严重的是，部分中层甚至高层管理者，由于自恃于常态化加班的公司文化，形成了盲目上线、乱枪打鸟的决策风格，这甚至会使加班带来了负生产力。
推荐阅读相关主题：
CSDN官方微信
扫描二维码,向CSDN吐槽
微信号：CSDNnews
相关热门文章

计算广告与京东快车推荐广告位系统有哪些区别

我要回帖

更多关于广告推荐系统的文章

随机推荐

计算广告与京东快车推荐广告位系统有哪些区别

我要回帖

更多关于 广告推荐系统 的文章

随机推荐

更多关于广告推荐系统的文章