我的魅族GPS位置信息手机(丢失时GPS和移动流量网络都没有开)被偷了,怎么利用EMEI码定位丢失手机?

中国数据驱动型互联网企业大数 据产品研究报告 2016年 . cn

内容综述 聚焦网络媒体大数据,研究其体系架构及相关产品 大数据 互联网大数据 网络媒体大数据 Data Internet Media ? 发展阶段:从信息驱动向数据智能驱动 ? 优势体现:互联网基因有利于大数据的 ? 海外发展:1)企业技术探索先行, 进阶; 获取与处理; 政策推动产业发展进程;2)将自 ? 产业结构:由数据源、技术服务及应用 ? 现状分析:互联网行业是大数据应用的 主研发与投资收购相结合,技术推 类型共同构成; 领跑者。1)已上市互联网企业中,以 动企业发展; ? 数据来源:企业自有数据是主流数据源, BAT为首的数据驱动型媒体整体表现较 ? 优势体现:具有强媒体属性的网络 数据的流通和共享将成趋势; 好;2)未上市互联网企业中,数据驱动 服务的发展策略相对成熟; ? 数据管理:数据挖掘与可视化成行业热 型企业成为领跑者; ? 现状分析:中国网络媒体的数据生 点,数据管理向垂直行业分化; ? 机遇:1)手机网民持续增长,可采集群 态系统雏形已成,多维度输出大数 ? 分析处理:文本、图像、语音分析相对 体更加广泛;2)移动端使用时长占比超 据能力; 成熟,视频分析存在探索空间; 77%,信息采集更加丰富连贯;3)场景 ? 发展策略:大媒体以流量+广告服 ? 应用类型:从独立数据产品向完整行业 化特征为大数据发展带来新契机; 务为起点,推进产业生态形成。 解决方案发展,定制化将成趋势。 ? 挑战:屏幕变小、行为碎片化对大数据 本报告将聚焦于中国网络媒体,研 的应用提出更高要求。 究其大数据体系架构及相关产品, 来源:艾瑞咨询研究院自主研究及绘制。 探讨大数据发展趋势。 ?.cn 2

中国大数据产业现状分析 1 中国网络媒体大数据产业分析 2 中国网络媒体大数据企业分析 3 中国网络媒体大数据的机遇与挑战 4 3

大数据定义与特征 4V:数据规模大,数据流转快,数据类型多,价值密度低 大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。为了适应数据量的爆发式增长, 数据处理方式正逐步向全量性、混沌性及相关性发展。为了避免信息损失,越来越多的场景倾向于对全量数据进行挖掘与 分析,其中,只有一小部分数据是结构化的,而非结构化数据中同样蕴含着大量信息,因此,能够处理各式各样的混杂数 据的大数据技术得到了广泛应用和迅速发展。其中,占据着重要地位的大数据预测分析,也从主要基于因果关系进行分析 发展成了建立在相关关系的基础上的分析模式。 Volume Velocity 数据规模大 数据流转快 ————————— ————————— 抽样数据 >> 全量数据 IDC预计,到2020年,全球新建 1秒定律:要在秒级时间范围内 和复制的信息量将达到44ZB, 给出分析结果,超出这个时间, 中国数据量将超过8ZB。 数据就失去价值了。 Variety Value 精确数据 >> 混杂数据 数据类型多 价值密度低 ————————— ————————— 除了以文本为主的结构化数据、 海量数据中,如何通过强大的机 以网页数据为代表的半结构数据, 器算法,更迅速有效地完成数据 也存在大量网络日志、音频、视 的价值“提纯”,已成为目前大 因果关系 >> 相关关系 频、图片、地理位置信息等非结 数据背景下亟待解决的难题。 构化数据。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 4

大数据集成与存储 数据仓库基于企业整体建立,是大数据集成和存储的基础 作为大数据集成与挖掘的基础,数据仓库是在企业范围内共享准确一致的集成数据、针对分析需求进行数据重组的工具, 基于整个企业的数据模型建立。而数据集市基于单个部门或业务主题建立,为部门业务运行提供数据服务,可以根据仓库 建设也可以独立建设,形成从属数据集市和独立数据集市。所有的从属数据集市都从属于同一个数据仓库,各子系统的数 据均能保持一致。而每个独立数据集市都从各源应用环境中单独提取数据,独立拥有硬件平台、软件平台、数据和应用程 序,彼此没有任何约束,无法保证数据的一致性,从长远来看,既不稳定也不可行。 数据仓库能够对海量数据进行集成,满足大数据发展对数据存储的需求,为企业提供局部解决方案和全面解决方案。 数据仓库与数据集市工作原理示意 面向主题、集成、不可 按照某一特定部门的 数据仓库 更新且随时间不断变化 数据集市 决策支持需求而组织 Data Warehouse 的数据集合,用来支持 Data Mart 起来的、针对一组主 管理人员的决策。 题的应用系统。 源应用环境 从属数据集市 独立数据集市 大数据处理的数据价值流转过程 数据 数据 终端 数据源 ETL 仓库 集市 用户 注释: ETL是指从源系统中提取数据,清洗、转换数据为一个标准的格式,并加载数据到目标数据存储区(通常是数据仓库)的工具。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 5

大数据产业生态 产业结构由数据源、技术服务及应用类型共同构成 大数据产业结构示意图 大数据 Big Data 数据源 Data Source 官方数据 行业数据 企业数据 第三方数据 技术服务 Technical Services 数据准备 存储管理 计算处理 分析技术 数据挖掘 可视化 应用类型 Application Types 解决方案 工具/产品化服务 行业应用 如:精准化营销 智慧城市 如:智慧农场 精准营销 电信行业 如:互联网金融 ————————— —————————— —————————— 智慧政务 个性化推荐 生长监测 搜索引擎精准营销 金融行业 高频交易 智慧社区 舆情监测 医疗行业 产量预测 RTB实时竞价广告 社交情绪分析 智慧旅游 网站/App分析工具 电商行业 农业预警 重定向精准营销 信贷风险分析 …… …… …… 来源:艾瑞咨询研究院自主研究及绘制。 …… …… …… ?.cn 6

大数据产业图谱 工具/产品化服务 解决方案 个性化推荐 精准营销 舆情监测 网站/App分析工具 智慧城市 … (城管) (社区) 行业应用 数 电信 金融 征信 房地产 (农业) 据 智慧政务 应 用 交通 旅游 物流 地图服务 天气 农业 医疗 娱乐 体育 教育 人力资源 能源 智慧公安 … … 数据集成 数据存取 云存储 按应用类型 按数据类型 AI 图像分析 数 数 据 计算处理 数据挖掘 据 BI 文本分析 视频分析 管 数 分 理 据 析 全技术支持 安 可视化 语音分析 全 官方数据 行业联盟 第三方数据服务 数 地理、水利、卫星、气象等 据 数 企业数据 据 来 基础数据 信息类 关系类 交易类 交贵阳、上 源 按类型 易海、东湖 等大数据 按行业 金融 医疗 交通 物流 旅游 体育 娱乐 能源 建筑 农业 … 交易中心 注释:此大数据产业链地图为示意图,未将所有企业标出,举例企业顺序不涉及排名,按企业中文名称首字母排列。如有分类不当,请联系:aixin@。 7

大数据产业图谱 大数据应用广泛,价值升级来源于数据流通及共享 概述:本报告的大数据产业图谱以大数据产品的角度出发,对产业链角色进行划分。其中,数据管理与数据 应 分析部分包括了大数据基础架构及相关分析技术,能够实现大数据的存储、分析、挖掘、可视化等环节。而 数 用 应 在数据源与数据应用方面,从功能和流程角度来看具有高度的关联性及一致性,涉及行业极其广泛。 据 类 用 应 型 用 数据应用 大数据应用已渗透电信、金融、医疗、人力资源、物流、天气等多个行业,从产品角度来看,除传统的工具/ 存 分 产品化服务、行业应用及解决方案外,大数据应用也包括商业智能等分析服务。 储 ? 应用情况:目前大数据应用的主要输出形式是可视化报表,未来将在功能方面进一步融合提升。 数 析 、 ? 典型大数据行业应用: 据 技 分 ? 物流:优化整体运输流程,实现实时查询把控。 分 术 析 ? 营销:应用形式成熟落地,既提高了用户对目标商品的获取效率,又改善了商家的投放效果。 析 、 挖 数据管理与分析 掘 大数据基础架构包括多种数据库及相关分析计算技术,能够支持数据的采集、清洗、集成、存取、分析、挖掘 基 、 数 等环节,从功能角度来看,除传统的数据处理过程外,可视化分析等分析服务也是基础架构的一环。 础 可 据 ? 应用情况:企业(含互联网企业)的数据相关部门(如数据中心/数据分析平台/数据商业部等),主要通 架 视 管 过对数据的管理、分析及整合,服务于自有业务,同时不断拓展应用类型和范围。 构 化 理 ? 价值体现:大数据处理过程中流转的数据形态可划分为静态数据和动态数据,主要通过计算过程实现其价 … 值,其中,模型算法为数据深度挖掘的核心,能够实现预测等功能。 收 数据来源 数 数 集 据 目前数据来源已较为多元,维度也越加丰富,尤其是互联网行业,在数据深度与广度方面具有天然优势,而物 据 / 来 联网、车联网等的出现丰富了数据的采集方式与采集范围。 源 采 ? 源 应用情况:目前企业内部的数据打通已成行业趋势,未来将进一步实现行业内外的数据流通乃至共享。 集 ? 价值体现:1)大数据能够对人群进行细化管理,并提高对特定人群的覆盖率;2)数据价值的实现与其鲜 活度相关;3)大数据的核心价值不在于数据量大,而在于通过数据的沉淀与应用产生价值,其价值升级来 产品 功能 流程 源于数据的流通和共享。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 8

产业链:数据来源 企业自有数据是主流数据源,数据的流通和共享将成趋势 行业数据 第三方数据 企业自有数据 外部企业数据 ? 官方数据,包括国家统计局、工信部等及国家地 ? 运营商数据 包括CRM、ERP数据等企 主要通过企业合作、数据 理、水利、卫星、气象等部门发布的公开数据 ? 第三方机构数据 业内部数据,以及投资并 交易等方式获取,形式多 ? 行业联盟数据等 ? … 购企业的相关数据 样,来源广泛 数据交易 伴随着数据资源价值逐步得到认可,数据流通的需求不断上升,除企业直接合作外,数据交易市场开始出现,建立数据需求方与供给 方之间成规模化的联系。而数据的开放需要多方助力,数据的流通与分享能够为大数据的价值提升赋能,尤其在经济价值和社会价值 方面会有较大提升。 Data Sources 数据来源 近年来,官方数据开放程度提高,行业联盟兴起,第三方数据服务蓬勃发展,各大企业(以互联网核心 1)发展现状 企业为主)也开始逐步开放群体画像数据,单一数据的跨界融合放大了其价值。但目前大数据应用的数 据源仍以企业自有数据为主。整体来看,数据产生量爆炸式增长,可分析的数据维度越来越丰富。 尚未形成完善统一的监管政策与行业规则,企业之间的数据孤岛情况仍然存在。数据交易方面,数据交 2)主要困局 易模式与数据资产定价标准有待建立,发展程度尚不成熟。 艾瑞分析认为,大数据行业的发展将在政策法规和行业自律的约束下,从探索期步入高速发展的成熟期; 3)前瞻视点 在市场客观需求的驱动下,数据的流通和共享将成为趋势。 注释:企业数据的数据类型主要可以分为四类,分别是基础类(LBS/设备等),信息类(搜索/浏览数据),交易类(网购/O2O),关系类(社交等)。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 9

产业链:数据管理(1/2) 数据管理囊括从数据收集到应用的全过程,且外延仍在拓展 数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,经历了人工管理、文件系统、 数据库系统三个发展阶段。狭义的数据管理包括数据准备、存储管理、计算处理及数据安全等环节,伴随着非结构化数据 的爆发式增长,对数据的处理和管控提出了更高的要求,因此将数据挖掘和可视化也纳入广义数据管理过程,以满足更深 入的数据处理需要,在此过程中,数据管理的外延还将持续拓展。 数据准备 存储管理 计算处理 数据安全 包括数据采集、清洗、转换、 包括数据存取、云存储等方面。 包括大数据查询分析计算、批 伴随着数据量的增加,数据 集成等环节,从业务过程中提 数据量爆发式增长,数据存储由 处理计算、流式计算等多种计 安全的重要性越发凸显,既 取多数据类型的数据信息,转 集中式向分布式发展,提高存取 算需求。此外,云计算极大提 包括外来黑客攻击防护,也 化为便于计算和存储的形式。 效率,同时易于扩展。 升了对大数据的处理能力。 包括用户个人信息管理。 数据挖掘 可视化 基于不同的数据类型和格式提出的数据挖掘算法能够更科学地呈现 以可读形式展现数据结果,在人与大数据系统间传递、交换信息。 数据本身的特点,实现预测等更深入的分析需求。 交互形式越发丰富,降低了大数据的使用门槛。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 10

产业链:数据管理(2/2) 数据挖掘与可视化成行业热点,数据管理向垂直行业分化 大数据的数据管理环节 数据 存储 计算 数据 数据 可视 准备 管理 处理 安全 挖掘 化 Data Management 技术服务 数据挖掘和可视化成为行业热点,一方面,数据挖掘算法渐趋成熟,数据洞察深度提升,另一方面,可 1)发展现状 视化工具种类越来越多,应用需求的多样化催生了从场景衍生出来的定制化服务。 技术方面,大数据的运作效率始终是行业发展的痛点之一,基础设施尚不完善。此外,在信息泄露事故 2)主要困局 频发的情况下,数据安全领域还有待进一步深耕,以应对越发丰富复杂的大数据应用场景。 艾瑞分析认为,云环境下的大数据存储和计算是未来数据管理的发展方向,大数据存储与计算效率将不 3)前瞻视点 断提高;数据管理整体将向更垂直、更贴合具体行业特征的方向发展。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 11

产业链:数据分析 文本、图像、语音分析相对成熟,视频分析存在探索空间 文本分析 图像分析 语音分析 视频分析 技术 应用 技术 应用 技术 应用 技术 应用 —————— —————— —————— —————— —————— —————— —————— —————— ? 关键词检索 ? 舆情评估 ? 图像识别 ? 人脸建模 ? 语音识别 ? 语音听写 ? 运动目标检索 ? 活体检测 ? 机器翻译 ? 态度追踪 ? 人脸识别 ? 身份认证 ? 语音理解 ? 情绪洞察 ? 目标路径追踪 ? 交通监测 ? 语义洞悉 ? 口碑管理 ? 相似图像对比 ? 摄影测量 ? 语音合成 ? 人声模拟 ? 侦察预警 ? 场景布控 Data Analysis 分析处理 文本和图像的分析技术已相对成熟,可以达到较高精度,应用也相对落地。语音分析技术取得突破,可将 1)发展现状 非结构化的语音信息(语义、语调、语速、音量等)转换为结构化的索引,实现对海量音频文件的的知识 挖掘和快速检索。而伴随着视频类应用的盛行和监控摄像头的普及,视频分析的需求也在逐年上涨。 语音分析整体发展相对成熟,但在自然语言处理方面还存在难点;视频形成的多维非结构化数据的存储与 2)主要困局 挖掘技术仍不成熟,视频内容分析还存在优化空间。 艾瑞分析认为,视频分析和语音分析的需求将继续增大,在机器学习的基础上,未来将不断提高智能程度, 3)前瞻视点 进一步解放人工劳动,如应用于直播行业的内容监测工作。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 12

产业链:数据应用 从独立数据产品向完整行业解决方案发展,定制化将成趋势 解决方案 将基础设施和信息资源联合起来,结合政 务、公安、旅游等领域的典型行业特征, 工具/产品化服务 共同为对应产业提供智慧解决方案。 正逐步从通用型产品向更加场景化的方向 拓展,应用层面也更加落地,尤以智能分 行业应用 析类软件的快速发展为代表。 越来越多的行业开始探索利用大数据提升产 业效能。互联网化程度较高的行业转变得更 快,较早开始转型的领域积淀得更深。 Data Application 应用类型 大数据应用从独立的工具产品向完整的行业解决方案发展,相关产品和企业的数量大量增加,涉及领域 1)发展现状 越来越广。 各行业的数字化发展程度并不均匀,行业智慧解决方案所涉及的各领域数据的关联程度和挖掘深度还有 2)主要困局 待继续加强。此外,各行各业的数据应用需求具有较大差别,难以通过一类或几类数据产品全面覆盖。 艾瑞分析认为,产业赋能方面,未来智慧城市领域的政企合作将进一步延伸;工具属性方面,具体的大 3)前瞻视点 数据产品/服务将向轻量级、定制化方向发展,满足多样的需求。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 13

中国大数据产业发展 宏观政策环境不断完善,大数据已上升为国家战略 2012年-2015年中国大数据政策梳理 2015 强化 【国务院】推动移动互联网、云计算、大数据、物联网等与现代制 2013 推动 造业结合,促进电子商务、工业互联网和互联网金融健康发展。 【发改委】运用互联网与大数据的技术来创新监管的方式。 【国务院】推动商业企业加快信息 【工信部】大数据产业将纳入“十三五”规划。 基础设施演进升级,增强信息产品 【工信部】加快云计算与物联网、移动互联网、现代制造业的融合 2012 支持 供给能力,形成行业联盟,制定行 发展与创新应用,积极培育新业态、新产业,加快推进云计算与大 业标准,构建大数据产业链,促进 【国务院】支持海量数据存 数据标准体系建立。 创新链与产业链有效嫁接。 储、处理相关软件的研发和 【国务院】运用大数据加强对市场主体服务和监管。 【工信部】定义个人信息范围,提 产业化,推进信息安全关键 【国务院】推动政府信息系统和公共数据互联共享,建立市场化应 出个人信息收集和使用规则、安全 产品研发和产业化。 用机制,深化大数据在各行业的创新应用,强化信息安全保障,顺 保障等要求。 应潮流引导支持大数据产业发展。 国家对大数据产业的重视程度不断上升,从数据存储、软件研发到信息安全,从产业链、行业联盟到跨行业融合的新 业态,不断完善宏观政策,推动数据互联共享和标准体系建立,引导支持大数据产业健康发展。 一些地方政府也已开始着力发展大数据产业,自2013 年以来陆续出台了推进计划,强调研发及公共领域应用,促进相 关政策法规的完善;重视通过大数据引领产业转型升级,与企业合作共建地区大数据生态;建立大数据基地,吸纳优 秀企业落户扎根。伴随着宏观政策环境的逐步完善,我国大数据产业茁壮发展。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 14

中国大数据产业发展 从信息驱动向数据智能驱动进阶 中国大数据产业的发展正在从信息技术驱动向数据驱动方向进阶,未来在数据挖掘、机器学习、人工智能等技术的基础上, 还将以智能化的形式赋能各行各业。大数据趋势正从互联网向各个领域延展,各行各业的决策正在向“数据智能驱动”转 变。 中国大数据产业发展阶段的演变 IT DT “IT” 信息驱动 数据驱动 智能驱动 Information Technology Data Technology Intelligence Technology IT时代以自我控制、自我管 DT时代以服务大众、激发生 “IT”时代通过智能技术为 理为主。信息技术驱动生产, 产力为主。数据驱动业务, 产业智能提供解决方案、解 以信息流为核心,通过传感 以数据流为中心,注重开放、 放劳动力。智能驱动决策, 技术、通信技术和计算机技 透明、体验和分享,基于产 在数据挖掘、机器学习、人 术等实现占有、掌握、传输 业协同关系以及云计算等技 工智能等技术逐渐成熟的基 和控制。数据作为“附加产 术,通过数据整合打通数据 础上,赋能产业,改变人与 物”,碎片化严重。 链路,加快产业升级。 场景的交互方式。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 15

中国大数据产业发展 互联网基因有利于大数据的获取与处理 大数据结合互联网行业的发展相较于其他行业而言,发展速度更快,应用更加落地。其优势在于:1)数据获取:互联网 形式更有利于与用户发生交互,能够采集到连续数据;2)数据处理:互联网的形态更有利于海量数据的存储和分析,特 别是将大数据与云计算的结合,改变了传统的高成本低效率的数据存取方式。 在此基础上,互联网大数据能够结合大数据技术在金融、医疗等传统行业的发展经验,助力互联网+金融、互联网+医疗等 互联网大数据的应用高效健康地发展。同时,互联网大数据各应用类型的高速发展,也推动了传统行业对数据资产的重视 程度,加快了其数字化进程。 中国互联网大数据的核心优势 数据获取 互 互联网形式更有利于与用户发生 交互,能够采集到连续数据。 联 推动数字化进程 传 网 统 大 行 数据处理 数 提供行业经验 业 互联网的形态更有利于海量数据 据 的存储和分析。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 16

中国大数据产业发展 从互联网大数据向各领域延展 根据中国信息通信研究所统计,2014年中国大数据市场规模约为84亿元,预计2015年中国大数据市场规模将达到.cn 金融 互联网 各行业的数字化进程并不均 衡,部分传统行业的大数据 电信 制造 技术与应用的渗透率还较 低,仍有较大增长空间。 能源 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 17

中国互联网大数据产业发展 已上市互联网企业:以BAT为首的数据驱动型媒体整体表现好 .cn 广告营收 .cn

中国互联网大数据产业发展 未上市互联网企业:数据驱动型企业成为领跑者 .cn 数据驱动型 企业估值Top3均为数据驱动型企业 数据驱动型企业,通常自有完整大数 据系统,以数据为支撑进行各环节分 析决策,从而实现企业运营管理。相 较于传统企业,数据驱动型企业在企 业数据的时间纬度、颗粒度及覆盖度 方面都趋于精细化,并通过与实际运 增长指数较高的均为数据驱动型企业 营流程的结合,实现其数据价值。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 19

中国大数据产业现状分析 1 中国网络媒体大数据产业分析 2 中国网络媒体大数据企业分析 3 中国网络媒体大数据的机遇与挑战 4 20

海外数据驱动型网络媒体的大数据奠基 企业技术探索先行,政策推动产业发展进程 2003年-2015年海外网络媒体大数据政策及技术发展历程 美国政府发布 《大数据研究和 ? 2009年美国政 发展倡议》,并 美国白宫发布 府开始开放政 向大数据领域投 了2014年全球 府数据 资2亿美元,是 “大数据”白 麦肯锡发布第 大数据技术从商 英国政府宣布 皮书研究报 2010年德国 一份大数据报 业行为上升到国 注资.cn 21

海外数据驱动型网络媒体的大数据奠基 自主研发与投资收购相结合,技术推动企业发展 大数据已成海外网络媒体标配,其大数据发展历程与技术的迭代紧密相关,一方面,根据业务需求自主研发尖端技术,为 数字化发展奠定基础;另一方面,通过投资或收购大数据技术相关公司,整合业务,提高整体效能。无论是大数据的存储 形式还是运行机制的优化,都给产业带来了深远的影响。这对中国互联网媒体的大数据产业发展起到了示例作用。 2016H1国外主要媒体营收情况 ? 从2003年起,分别发布GFS、Map Reduce、Big Table、BigQuery及Dremel等先进技术产品。 ? 投资或收购云商务公司Orbitera、图像识别技术公司 Google .cn

中国数字信息量快速膨胀 中国数字量在世界总数字量中的占比预计达到40% 2015年底,全球网民数量达到.cn 23

网民规模不断扩大,增速持续放缓 手机网民持续增长,可采集群体更加广泛 2015年,中国整体网民规模已达.cn 24

PC端与移动端月度使用时长继续攀升 移动端使用时长占比超77%,信息采集更加丰富连贯 根据艾瑞网民行为监测系统iUserTracker以及移动网民行为监测系统mUserTracker的监测数据显示,2016年8月,整体上 网时长已突破500亿小时,其中,移动端总体使用时长达392亿小时,占整体上网时长超过77%。PC端月度使用时长趋于 平稳,而移动端月度使用时长呈现较大幅度增长。伴随着流量从PC端向移动端的迁徙,网民对移动设备的依赖性不断增 强,为互联网行业大数据产业在更长、更连贯的时间跨度上实现更加多元的信息采集提供了契机。 600 iUserTracker&mUserTracker-2006年7月-2016年8月 PC端网页、手机端App、Pad端App月度使用时长情况 500 500 PC端 400

移动互联网时代的大数据挑战与机遇 屏幕变小、行为碎片化提出更高要求,场景化带来新的契机 在移动互联网时代,用户的注意力从大屏转移向小屏,上网行为更加碎片化,产生的非结构化数据的类型更多,量级也更 大,因而相较于PC端,移动互联网产品对互联网企业的大数据能力要求更高。 而伴随着移动互联网的发展,用户的触网场景愈加丰富,通过移动设备能够更方便地获取用户地理位置等场景信息,进而 判断其所处场景,并进行相应的内容推送,提高个性化精度,获得更好的点击转化效果。 移动互联网时代的大数据挑战与机遇 屏幕小 碎片化 场景化 移动端比之PC端,屏幕变 移动端的用户行为更碎片 通过移动设备能够获取用 小,单位展示空间也相应减 化,也更具有实时性。移 户的场景信息,判断用户 少(整体展示并未减少,如 动设备覆盖了用户更完整 当下场景,并结合其偏好 原生信息流广告的应用), 的上网时间,产生了更丰 进行信息推送。 因而要更加注重用户体验, 富数据。 更精准地提供内容或服务。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 26

移动互联网时代的产品发展策略 具有强媒体属性的网络服务的发展策略相对成熟 mUserTracker-2016年8月中国移动App 大类别月独立设备数 实用工具 .cn 27

中国数据驱动型网络媒体的大数据战略 媒体间的数据联动提升其数据使用价值 媒体数据对外开放的程度正在逐步提高,同时应用范围渐趋丰富,除指导广告投放、实现精准触达外,还将向产品优化指 导、运营决策支持、舆情监测分析等方向拓展;此外,媒体数据还将进一步支持智能技术的发展和实现。而外部数据获取 和使用的行业标准,将伴随着加密技术的发展而加速形成;同时,外部数据也将对来源广泛的多维数据进行数据联动的方 式和价值进行进一步探索。伴随着媒体数据的开放程度进一步提高,甚至形成企业间的战略联动,媒体数据的使用价值将 提升,在数据话语权上占据主导地位。 媒体数据与外部数据对比分析 完备程度( ) 完备程度( ) 开放程度( ) 开放程度( ) 媒体数据 商用程度( ) 外部数据 商用程度( ) Media External 挖掘程度( ) 挖掘程度( ) 媒体自有数据主要由用户数据组成,通过打通企业内部 外部数据的来源广泛且维度多样,通过第三方、数据交 数据链路,主要服务于自身的数据洞察。 易等途径进行跨企业跨行业的流动。 目前大媒体数据的使用较为封闭,中小媒体的数据重视 由于统计口径及数据形态不一,数据整合难度较大;且 度不高,数据价值有待挖掘。 数据融汇贯通的程度不足,联动效果的发挥尚不明显。 注释:外部数据包括媒体以外的wifi、路由等数据。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 28

中国数据驱动型网络媒体的大数据战略 大媒体以流量+广告服务为起点,推进数据生态形成 2016年中国Top级网络媒体流量梯队分布 月度用户覆盖量 5亿+ 3亿+ 2亿+ 360、阿里巴巴、 爱奇艺、网易、 凤凰、乐视等 百度、搜狐、腾讯 新浪、优酷土豆 数据驱动型网络媒体的大数据战略以流量+广告服务为起点,逐步推进形成生态 媒体属性为网络媒体带来了巨大流量,产生了海量数据,为加快企业数字化建设进程,以BAT为首的互联网媒 体纷纷布局大数据,作为输出,其广告服务能力也伴随着大数据的发展和应用而快速成长。在流量快速持续增 长、广告规模增长以及广告形式多元化过程中,互联网媒体的大数据能力逐渐增强,开始布局多种多样的数据 链条,深耕大数据采集、清洗、集成、存储、分析、挖掘、可视化及安全等各个领域,探索可行的大数据落地 形式,推进产业生态形成。 注释:按企业中文名称拼音首字母排列。 来源:.cn 29

中国数据驱动型网络媒体的大数据战略 数据生态系统雏形已成,多维度输出大数据能力 网络媒体的大数据业务正处于初级阶段,但与整个互联网行业的大数据应用情况相比,其应用相对较为成熟,发展速度极 快。目前各家数据生态系统的基本雏形已然形成,数据产品向“面向用户端”与“面向商业端”分化,接下来的发展将趋 向于根据业务模式和应用场景对系统内部角色进行细分。网络媒体属性增强了企业获取大数据的能力,未来还将继续探寻 数据资产的商业化出口。 艾瑞分析认为,目前国内数据驱动型互联网媒体的大数据输出主要可以分为技术能力输出与数据服务输出两种类型,其 中,技术能力以“大数据工具/产品”形式输出,而数据服务的输出则主要可以划分为“提升内容质量”和“提升内容触 达效率”两个主体方向,其中,前者通过内容积淀实现,而后者则通过用户洞察和精准投放实现,同时,后者还成为了大 数据在网络媒体中应用的主要形式。国内网络媒体的大数据输出目前主要服务于自有业务,包括指导产品优化和实现个性 化推荐(含精准营销)等,主要客户来自互联网化程度较高、数据敏感度较高的行业,如电商、金融等。 2016年中国网络媒体大数据输出类型划分 技术能力输出 数据服务输出 工具 内容 用户 精准 产品 积淀 洞察 + 投放 通过标签库等形式对人 主要用于广告精准投放 主要应用包括网站/App 主要应用类型包括反垃圾 群进行细分管理,主要 和新闻、音乐等的个性 分析、数据统计、可视化 云、病毒特征库等,降低 服务于企业内的业务相 化推荐等,实现信息与 等方面,在大数据发展早 噪音,提升内容质量。 期,是大数据能力输出的 关人员。 人群的智能匹配。 主要形式。 提升内容触达效率 提升内容质量 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 30

中国数据驱动型网络媒体的大数据战略 中国网络媒体大数据应用地图 腾讯万象优图、腾讯智能语音服务、360天眼、 网站分析工具 数据服务输出(内容积淀) 网易易盾… 百度统计/移动统计、腾讯移动分析/网 站数据分析/HTML5数据分析… ③用户端产品支持 大数据处理 腾讯大数据处理套件、网易猛犸… 百度联盟、百度凤巢、百度SSP、阿里妈妈、芒果移动(阿里)、腾讯社交 ② 广告、腾讯智赢销、腾讯SSP、360点睛实效平台、新浪龙渊、新浪扶翼、 推荐/搜索 广 网易有道智选DSP、凤凰凤羽DSP、搜狐汇算… 百度推荐、阿里巴巴推荐引擎、腾讯推荐… 告 平 流量交易 创意投放 可视化 台 Tanx Ad Exchange(阿里)、腾讯Ad Exchange 百度霓裳、新浪轩辕 百度Echarts、阿里巴巴DataV、阿里 巴巴Quick BI、网易有数… ① 市场研究 营销指导 机器学习 舆情 数 百度指数… 百度灵犀、阿里御膳房、新浪洞察系统、360商易… 百度机器学习、腾讯机器学 新浪微 据 习、阿里巴巴机器学习… 舆情… 支 数据管理 效果评估 持 百度方物(DMP)、阿里达摩盘、腾讯 云服务 百度精益、360分析、 产 DMP、360DMP、凤凰凤眼、搜狐DMP… 搜狐品算… 百度云、阿里云、腾讯云、网易云… 品 营销过程数据解决方案 解决方案 百度思维、ACE腾讯广告开放平台、360精准营销闭环、阿里妈妈精准数据营销… 百度大数据+、数加(阿里云)… 技术能力输出(工具产品) 数据服务输出(用户洞察+精准投放) 注释:此中国网络媒体大数据应用地图为示意图,未将所有企业及其产品标出,举例顺序不涉及排名。如有分类不当,请联系:aixin@。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。

中国大数据产业现状分析 1 中国网络媒体大数据产业分析 2 中国网络媒体大数据企业分析 3 中国网络媒体大数据的机遇与挑战 4 32

案例综述 选取月度覆盖量2亿以上的部分企业进行案例分析 企业出现的先后以企 本报告所选取企业不 业2015年网络广告市 含视频类及社交类企 案例背景 场媒体营收规模排名 业,视频类及社交类 为序。 企业相关分析请参见 《iResearch-2016年 为更完整的介绍行业 中国在线视频企业创 情况,艾瑞以充分展 LOREM IPSUM LOREM IPSUM 新营销研究报告LOREM IPSUM》 现每一家企业的特色 《iResearch-2016年 和优势为出发点,选 DOLOR SIT DOLOR核心企业 SIT 中国社交网络创新营DOLOR SIT 取了月度覆盖量2亿 销报告》。 以上的部分AMET SITM企业进行 AMET SITM AMET SITM 详细分析; 由于时间和篇幅的限 案例企业包括: 制,未能将所有优秀 百度、腾讯、360、新 相关报告 企业及旗下优秀产品 浪、网易和凤凰网。 呈现在报告当中,敬 请谅解。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 33

百度 以人工智能为战略核心,与应用场景建立动态关联 2014年4月,百度发布大数据引擎,全面对外开放自身的大数据平台,将开放云、数据工厂和百度大脑等核心大数据能力 开放,向外界提供大数据存储、分析和挖掘技术,并提供行业洞察、营销决策、客群分析、舆情监控、店铺分析和推荐引 擎等服务,在医疗、交通、金融等诸多领域有了广泛的运用。 百度大数据发展历程 百度深度学习研究院 .cn 34

百度 大数据+云计算+人工智能:百度大脑 百度大脑是百度人工智能技术研究的重要成果,主要由三部分组成,即算法、计算能力以及大数据。其中,算法包括了模 拟人的神经元组成的网络、万亿级参数和千亿样本,计算能力则由数十万台的服务器提供支持,其中很大一部分不是基于 传统CPU,而是基于GPU集群,而在数据源方面,百度能够获取海量网页内容、搜索数据、图像视频数据和定位数据等。 围绕着这三个核心部分,百度大脑的能力主要分为四个方向,分别是语音、图像、自然语言处理和用户画像。 百度大脑所涉技术与应用概况 语音技术 语音 人脸 全景图 合成 可分为语音识别与语音合成两个部分,目前已经应用在语音搜索、语 识别 制作 音输入、智能家电语音遥控和小说有声阅读领域,如可以帮助客服、 无人 销售人员,通过对客户语音进行实时识别,推荐最合适的销售方案。 语音 图像 车 语音 识别 技术 计算 技术 图像技术 能力 AR 应用方向包括人脸识别、全景图制作、无人驾驶汽车以及AR等,通过 获取场景数据(图片中出现的景物环境等),可以进行拍照翻译、刷 脸身份验证、色情度识别等。 百度 自然语言处理技术 大脑 能够支持机器翻译和实时解说,能够实现搜索知识问答、搜索推荐、 算法 数据 新闻摘要生成、会话翻译、评论分析等,能够支持27种语言互译,并 助力打造了百度人工智能产品——度秘。 机器 个性化 翻译 自然语 用户 画像 用户画像技术 言处理 画像 从个性化特征和垂直行业特征两个维度对用户进行刻画,前者展现用 户的人口学特征、短期意图、位置属性等通用信息,后者根据用户在 垂直行 各领域的习惯偏好实现新闻精准推荐和个性化推广过程设计。目前已 实时 业画像 解说 应用于个性化营销、用户群分析等方面。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 35

百度 商业生态大数据生态架构 百度拥有的数据类型主要是搜索数据,通过全面复杂的产品矩阵,百度能够获取以搜索数据为核心、来源广泛且维度丰富 的海量数据,并实现广告主CRM、广告主自有ID、到店/站数据、注册数据以及统计监测/Cookie等的数据接入,形成完 善的数据体系。结合第一方数据和第三方数据,百度通过其严谨统一的指标体系对数据进行分析,从数据产权、底层数据 标准和应用标准三个方面进行定义,支持各数据产品的运营和发展。百度商业生态大数据输出主要可分为百度投放产品和 对外提供产品及服务两类,助力百度生态圈(包括其客户、合作方及百度联盟等)高速发展,一方面优化用户和客户的使 用体验,增加用户粘性及百度的品牌影响力,另一方面,提升产品运营效率,巩固生态圈,促进数据价值的商业化实现。 百度商业生态大数据生态架构 百度DSP、百度网盟、移动DSP… 配置化DMP Cloud DMP、数据营销模型共建 百度投放产品 对外提供产品 对外提供定制服务 数据产权界定 底层数据标准建立 应用标准制定 第一方数据 百度数据源 第三方数据 网站数据/搜索广告/展示广告/API上传 第三方DMP/运营商/WIFI类/… /CRM/… 广告 广告主 到店/站 注册 统计监测/ 网页 线下 线下 搜索 LBS 电商 社交 金融 CRM 自有ID 数据 数据 Cookie 浏览 到访 消费 … … 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 36

百度 营销数据产品体系-百度思维 百度思维是百度营销数据产品体系的总称,与营销相关的百度大数据产品主要包括营销决策指导(包括市场趋势洞察,品 牌竞争分析,营销活动规划) 、受众管理和评估分析三类,其代表产品分别为灵犀、方物和精益,它们共同构成营销过程 数据解决方案。贯通了百度指数、营销过程数据解决方案、数据管理平台以及数据服务接口API,百度思维分别从营销决 策指导、受众管理和评估分析三个维度支持营销产业链的各角色如广告主、广告代理公司的营销过程。 百度启动了以营销数据产品驱动的品牌营销生态战略,通过百度思维深耕营销领域,攻关技术难题,累积行业经验,未来 还将在此基础上继续向其他领域拓展,将营销领域的经验结合其他行业特点复刻到金融、生活服务等各个行业,实现各行 各业的商业赋能。 百度营销数据产品体系(百度思维)结构 营销过程数据解决方案 百度 数据服务接口 灵犀 方物 精益 指数 (DMP) API 数据管理平台 基础建模 知识库 数据接入 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 37

百度思维 营销数据产品驱动的品牌营销业务流程 百度营销数据产品体系的业务流程包括了市场行业研究、营销决策支持、数据资产管理及效果监测评估四个环节,分别通 过百度指数、百度灵犀、百度方物以及百度精益实现,既满足了大客户和代理公司关于市场监测和营销决策支持的需求, 也能帮助效果类客户对人群进行定义并提供投放指导。此外,百度也与政府、高校及相关研究机构建立合作,共同进行趋 势探索、热度分析等相关项目。 百度品牌营销业务流程 指数:市场行业研究 灵犀:营销决策支持 方物:数据资产管理 精益:效果监测评估 指数:市场行业研究 灵犀:营销决策支持 在广告投放前对行业、市场进行宏观研 包括品牌策略制定和传播策略与传播方案 究,对品牌、产品、消费者表现进行评估 制定两个部分,通过市场及行业研究、品 分析,从而了解市场态势,制定相应投放 牌竞争分析、数字消费者洞察、营销活动 策略,总结整体发展趋势。 规划等环节,助力广告主制定营销决策。 方物:数据资产管理 精益:效果监测评估 接入广告主第一方、百度第二方和客户合 通过人群转化、流动、对比分析和多渠道 作的第三方数据源,通过多维度灵活定 归因分析,多维度综合评估投放效果。一 制、多人群交叉组合、多角度人群画像和 方面,总结市场规律与行业趋势,量化广 种子人群不同灰度扩展、多渠道分发,帮 告效果,另一方面,根据投放结果调整投 助广告主提高投放精度,提升投放效果。 放目标,指导下次投放。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 38

腾讯 大数据的发展与应用 伴随着互联网的发展和网民对内容需求的转变,腾讯通过大数据,推动其内容的生产和分发走向个性化。在内容的产生方 面,为了满足网民越来越个性化的内容需求,腾讯对用户进行了多元立体的洞察,继而创造或寻找对用户更有价值的内 容;而在内容的分发方面,网民获取信息的方式已从过去千人一面的版位式阅读发展到越来越便捷智能的个性化推送,腾 讯从用户需求和用户体验出发,高效精准地为用户提供个性化新闻、歌曲、广告等等。 大数据作为企业发展的助推力,已深入到腾讯的方方面面,推动着其整个产品体系的前进,一方面指导产品优化,提升用 户体验,另一方面实现精准人群定向,助力个性化推荐。借助其数据洞察的广度和深度优势,未来腾讯还将在数据安全的 基础上进一步赋能商业。 腾讯大数据发展方向梳理 覆盖90%以上网民,实现 强大的数据专家团队,为 长时间跨度、多场景覆盖 各产品线提供大数据支持 发展方向 未来将继续从 未来将通过数 未来将继续向 用户需求和用户体 据共享及战略合 全场景营销方向发 验出发,优化产品 作,扩容腾讯数据 展,助力广告客户 设计,提供个性化 池,营造更高的数 打造互联网广告数 服务,为用户创 据价值,形成智慧 据营销开放协作新 造更大价值。 数据服务。 生态。 用户 数据 营销 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 39

腾讯 广泛数据来源 腾讯将业务体系中的海量用户数据作为底层大数据基础,基于唯一可识别的ID(QQ号或微信号),进行跨平台数据整 合,全方位地对用户在各个场景下的特征和行为进行分析,支持应用层面上的所有业务需求。腾讯大数据体系中的数据来 源广泛、类型多样,除了主要的社交类数据外,还涵括了移动、搜索、资讯、娱乐及生活等多个领域的数据。 腾讯大数据数据来源分布 搜索 QQ 资讯 月活跃账户

腾讯 多维用户洞察 腾讯将用户数据按照基本属性、社交兴趣、娱乐兴趣、媒体兴趣、浏览习惯、购买倾向等不同纬度细分为3000多个标签, 能够组合定制TA画像。基于其算法,腾讯能够根据用户数据洞察用户的上网习惯、用户特征及消费特点,从而推断出用户 在各个场景下的社交习惯、消费偏好、浏览兴趣等,不仅能提供个性分析,定制化挖掘多行业人群,分析投放方案,还能 通过基于拥有强大计算能力的Spark机器学习的Lookalike将种子人群和这些标签进行相似度计算,寻找潜在目标人群。 腾讯大数据标签体系 内容 学历 微信 腾讯网 职业 QQ 标签 新闻 网络 年龄 音乐 客户端 游戏 手机 用户 地域 社交 行为 用户 游戏 标签 媒体 网页 标签 属性 QZone 性别 视频 游戏 电商 儿童 应用宝 游戏 沟通 交易 上网 广告 游戏 交流 休闲 娱乐 用户 习惯 基础 QQ 平台 虚拟 用户 平台 浏览器 游戏 彩贝 支付 行为 特征 电脑 相册/ 积分 工具 管家 歌单 资讯 商业 使用 关系链 获取 层面 等级 角色 个人 母婴 资产 游戏 用户 微博/ /3C 兴趣 兴趣 广告 消费者 账户 日志 用户 属性 特权 兴趣 细分 订购 电商 高低 付费 注册 注册 关系 兴趣 消费 时间 渠道 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。单身/ 新婚 ?.cn 41

腾讯 大数据体系架构 作为日接入数据量.cn 42

腾讯 腾讯DMP:助力精准投放,丰富投后洞察 腾讯DMP基于腾讯累积长达18年的海量数据与强大的算法挖掘服务,能够提供给广告主定制化的TA画像和人群洞察报 告。此外,腾讯DMP支持与广告主自有CRM对接,获取Look Alike人群包,广泛触达潜在TA人群。腾讯DMP主要应用在 数字营销领域,连接内部与外部多方数据,系统化、模块化地处理数据,从而打造数据资产链条,实现数据应用价值。目 前其核心作用在于助力精准投放以及丰富投后洞察,未来在保证数据的安全和隐私的基础上,将逐步向系统层面的自动化 方向发展,在应用层面上赋能商业。 腾讯DMP产品特征总结 量化 规模化 精准化 腾讯联合研究机构,为广 腾讯DMP支持第三方数 腾讯DMP帮助广告主建立 告主提供基于消费者研究 据接入,借助第三方建立 品牌自有DMP模块,将客 的DMP模块,从而为品 的数据安全港,更加安 户按忠诚度、产品线、终端 牌提供消费者聚类标签, 全、系统化地连接企业 等不同维度进行划分,通过 引入第三方全量实时监 CRM数据与腾讯DMP用 多维数据交叉分析,获得不 测,使得投放效果可被衡 户数据库,提升品牌 同维度下的目标人群圈层, 量。 CRM数据的利用率,实 沉淀品牌数据资产,促进广 现规模化跨媒体精准投 告投放 “对症下药”。 放。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 43

腾讯 ACE腾讯广告开放平台 腾讯打造的ACE腾讯广告开放平台,致力于在腾讯完善数据生态和优质媒体资源的基础上,依托腾讯的全系产品生态圈, 通过不同类型产品满足不同类型客户的不同需求,主要包括四款营销产品:1)基于QQ空间、QQ、微信公众号、微信朋 友圈等优质广告资源,跨平台,跨终端的效果广告平台腾讯社交广告,2)基于腾讯新闻、腾讯视频、天天快报等优质媒 体资源,跨平台、跨屏幕媒体的品牌广告自助营销平台智赢销,3)助力区域客户实现品效合一的营销服务产品智汇推, 4)满足品牌客户区域化需求和区域客户品牌化需求的营销产品智汇通。其中,腾讯社交广告和智汇推为效果广告产品, 智赢销和智汇通为品牌广告产品。 ACE腾讯广告开放平台 广告投放服务 流量交易服务 媒体服务 DSP AD EXCHANGE SSP 娱乐 社交 资讯 搜索 生活 广告行为

腾讯 ACE腾讯广告开放平台 ACE腾讯广告开放平台依托于腾讯DMP数据管理平台,以大数据为基础,连接流量与广告主,通过各营销渠道,打造衡量 效果统一的数据营销生态。ACE所包含的四款产品彼此优势互补,既覆盖了品牌广告和效果广告两种广告类型,也覆盖了 CPM、CPD、CPC、CPT及合约CPM等售卖方式,能够灵活地发挥腾讯旗下各类优质媒体资源的营销优势,助力不同需 求的广告主实现不同的营销效果。 ACE腾讯广告开放平台-广告平台概述 智汇通深耕区域市场,通过定时、定向可见的广 告交易模式,为区域品牌广告主提供小预算大声 智汇通 量、跨媒体跨终端的广告投放解决方案。按CPT 智赢销作为品牌广告自助营销平台,广告数 售卖,可根据用户浏览习惯整合跨平台资源投 据透明可监测,并支持广告购买和投放分开。 放,服务行业包括旅游、房地产、汽车、家装 售卖方式以合约广告为主,主要按CPM 等。 和CPD售卖,实现品牌曝光。此外,智 智赢销 赢销还与DMP打通,支持账号体系共用, 智汇推通过标签、计算以及匹配追踪用户,为区 DMP挖掘到的人群包可直接在智赢销中投放。 域广告主提供解决方案。售卖方式为RTB,主要 智汇推 按CPC售卖,实现点击转化,对后续提升较有 腾讯社交广告将传统的广告保量购买方式与 利。 程序化广告的人群定投相结合,推出了合约 腾讯 CPM售卖方式,广告主可以借助平台进行 投放群体预估,并按需求锁定这些目标人 社交 群在不同媒体的曝光量,自定义投放期间的 广告 频次参数,精准触及人群,保持稳定曝光。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 45

应用案例 腾讯DMP × 贝贝 腾讯智慧数据管理平台能够为广告主提供多元、开放、安全的传播服务的平台。通过该平台,腾讯能够连接各方数据,打 破数据孤岛,在开放的数据生态下,通过全方位的合作,帮助广告主达成人群的有效触达,实现品牌营销的数据价值最大 化。腾讯向广告主提供数据洞察分析、人群定向投放和跨媒体数据服务,高效、准确地寻找到TA。广告投放后,TA浓度 和ROI都比常规投放有了大幅提升。 在腾讯DMP与母婴特卖网站贝贝网的合作中,腾讯DMP运用母婴标准化人群包获取高频母婴人群TA,并根据用户的视频 浏览、广告偏好、QQ群兴趣、媒体资讯、手机App等数据进行定向,以视频贴片形式向电视剧、综艺等内容投放广告, 最终实现多次触达完成率提升,下载激活量提升16倍,TA浓度提升26%的投放效果。 母婴 动画 护理 剧情 DMP 微信兴趣 视频浏览 定向投放 标准化人群包 投放周期: 5月5日-5月13日 内容定向:电视剧、综艺 社交兴趣标签 早孕 母婴 投放形式:视频贴片 育儿 近1个月内腾讯 日化 视频广告浏览 商业兴趣标签 手机App 广告偏好 超30次 多次触达KPI完成率提升 应用兴趣标签 下载激活量提升16倍 媒体兴趣标签 育儿 孕产 TA浓度提升26% 成长 育儿 媒体资讯 QQ群兴趣 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 46

360公司 大数据发展历程:从 “IOE”到“IoE” 大数据概念还未完整成型时,360采用IOE系统(IBM-服务器提供商,Oracle-数据库软件提供商,EMC-存储设备提供商, 三者共同构成了一个从软件到硬件的企业数据库系统闭环)进行数据分析,但随着万物互联时代的到来,大数据成为洞察 用户至关重要的一环,360开始集成多端数据,为用户提供精准的信息服务。相较于传统的IOE系统,大数据系统成本低, 可定制,并且扩展性较好,目前每天新增约500TB数据量,可以在几分钟之内调度几十万个CPU进行计算,也可以对TB级 数据进行秒级快速处理。 360在PC端、移动端及智能硬件等方面均有布局,形成了多维产品矩阵,能够通过各个终端采集数据,反馈到云端,汇总 进入大数据平台,经过分析挖掘形成反馈。未来360将加大资源整合力度,一方面打通企业内部所有数据,并使各产品线 的业务人员参与其中,另一方面继续推动各端全面发展,实现万物互联。 360大数据发展历程 产品线 业务人员 硬件 >> X86服务器 软件 >> 开源定制 大数据平台 IOE 万物互联 IoE IBM&Oracle&EMC Internet of

360公司 安全基因下的行为链厚数据:场景化数据联动大数据生态 自2014年开始,360布局智能硬件领域,以自有品牌、战略投资、生态合作等多种方式并行联动,打造360智能硬件生态 链,形成安全基因下的行为链厚数据。同时,360将能够贮存海量原始日志的离线数据和能够对数据进行同步记录与分析 的实时数据有机结合进行处理,既实现了数据的批量处理,又能进行实时决策和反馈,极大地提升了其数据处理速度和日 均处理数据量 。360深耕行为链大数据,从PC、移动到智能硬件多端了解用户的行为轨迹,在保护个人隐私和数据安全的 前提下,立体多维地分析和洞察用户的需求、习惯、偏好、决策,从而运用场景化数据联动大数据生态,催动多种自有应 用场景并对外输出数据服务。 360行为链厚数据布局 智能摄像机 智能手表 安全路由器 战略投资 自有品牌 随身 生态合作 WiFi 超级充电器 空气卫士 行车记录仪 场 可穿戴设备、智能家居等智能硬件产品覆盖了用户不同使用场景,能够采集到维度更加丰富的 行为习惯分析 景 场景化的用户行为数据,联动更完整的大数据生态。不光能通过用户行为习惯分析为大数据检 数 验提供支持,还能根据即时场景,结合大数据的计算处理,以移动设备为载体,提高个性化推 据 荐的效率,优化用户与场景的交互方式。 个性化推荐 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 48

360公司 自有应用场景+对外数据服务 360大数据的主要应用场景主要包括安全体系构建、搜索引擎支持、大数据营销以及数据分析与统计四类,此外,对外也 为其他企业提供数据服务。对外数据服务目前主要包括标签级数据服务、客户独家数据服务以及数据整合三种方式,其 中,标签级数据服务是对360自有大数据体系进行相应的数据挖掘,并向客户提供数据挖掘结果;客户独家数据服务是通 过DMP等数据产品帮助客户进行数据分析,提供建议和指导;而数据整合则是将第三方数据提供商的数据(如WiFi数据 等)与360自有数据进行整合,从而输出数据服务。 数据驱动安全 搜索引擎 大数据营销 数据分析 ? 杀毒引擎 ? 千亿量级网页库 ? 超50万精细用户标签、 ? 手机助手、游戏等 ? 威胁感知系统 ? 快速分布式索引与分析 300余种聚类人群 产品统计分析 ? 样本库、黑白名单库 ? 实时热点推荐与跟踪 ? 营销闭环提供全案服务 ? 数据库解决方案 以标签形式合作,提供自有数据挖掘结果 标签级数据服务 360提供数据服务的客户主 要来自于互联网属性较高、 对数据敏感的行业,如电商 和金融,这些行业对大数据 客户独家数据服务 对客户数据进行分析,提供业务指导 的价值与应用关注程度较 高。 目前360大数据应用主要服 对第三方数据提供商数据与自有数据进行整合 数据整合 务于自有业务,并以增值服 务形式服务于其企业客户。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 49

360公司 大数据平台架构:360安全大数据平台 360深耕大数据领域多年,通过后台数据的采集、存储以及数据仓库的搭建、用户画像的挖掘等,构建了其独立统一的大 数据平台。该平台支持结构化数据存储、离线非结构化数据存储与任意字段检索需求,支持多种计算模型,支持海量数据 离线批量处理、实时数据分析、多轮迭代计算,并能进行复杂数据关联分析与分布式大规模机器学习。此外,数据分析人 员还可以通过大数据交互系统进行可视化分析并运行调度任务,而运维人员则可以通过大数据管理系统对大数据系统进行 管理和升级。在业务应用层面上,360的大数据产品主要可以划分为用户和企业两个方向。 360安全大数据平台架构 数据安全 流量监控 音视频分析 统计报表 ? ? ? ? 态势感知 流量还原 语音识别 数据统计 应用 ? 威胁情报 ? 流量分析 ? 语种识别 ? 报表展示 ? 可视化 TransferX 批量数据接入 非结构化存储系统 (半)结构化存储系统 大数据交互系统 存储 HDFS HBase/Cassandra 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 50

360公司 企业级大数据产品:商易+DMP+分析 应用层方面,主要可以把360的大数据产品分为用户产品与企业级产品两类。用户产品的目标群体是普通网民,主要通过 个性化推荐以提升用户体验,除用户行为数据外,还能根据用户画像进行关联推荐。企业级大数据产品主要包括360商 易、360DMP和360分析,它们分别涵括了从投放前的决策支持到精准投放,最后进行投放效果监测评估的过程,形成了 精准营销的闭环。未来360还将通过数据联动进行数据相关性挖掘,不断提升大数据服务能力以满足更深入的客户需求。 ? 360指数 用户 ? 完善的权限控制和数据加密机制 Custom ? 安全大数据平台 ? 通过灵活丰富的人群组合筛选维 度,实现人群细分管理与定制化 搜索 安全 广告 语音 图像 … 营销推广 产品 ? 360DMP ? 利用大数据挖掘算法全网挖掘相 多方数据管理 似目标受众,扩大精准营销范围 ? 完善的效果评估体系,覆盖投放 02 人群画像分析 展、点、消数据及后续转化指标 精准营销 数据,支持以人群为单位查看投 放效果数据 ? 提供私有DMP服务,支持应用客 企业 户自有数据指导广告投放 ? 全面多维的行为链数据,精细科学的 01 Business 标签体系 03 ? 决策 ? 通过关键词、网址、APP、移动设备、 效果 实时数据秒级响应 人口属性、LBS及兴趣标签等多种方式 指导 ? 依托行为链大数据,精准识别网站访 精准识别目标人群及潜在需求,指导 评估 客人群个性化特征 产品改进 ? 全面打通360点睛平台,实现转化与 ? 分析品牌的发展形态与竞争格局,制 推广数据相结合,优化广告投放策略 定合理的品牌发展策略 ? 全面打通布尔平台数据,展示移动应 ? 洞察用户行为偏好,制定营销决策方 ? 360商易 ? 360分析 用推广与转化实况 案,指导广告预算分配与媒体投放优 ? 数据可用于访客找回、个性化重定 深耕行为链大数据 投放效果监测 化,提升营销效果 向,提升广告投放效果 助力精准营销决策 推广效果分析 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 51

应用案例-全案数据服务指导广告投放 营销闭环的数据价值流转助力流量升级与转化率提升 360商易帮助客户在广告投放前对受众进行全面分析,指导目标受众定位及媒体选择;360DMP依据商易分析结果精准选择 投放人群,同步到投放端指导定向投放;360分析通过对广告投放后续效果的监控,帮助优化投放策略,提升广告效果。它 们可以组合为客户提供精准营销全过程解决方案,也能针对客户在产品、运营、推广等方面的具体痛点,独立进行服务。 客户面临着流量不足效果转化不理想的困局,一方面,客户RTB账户的CTR较低,导致其必须出高价才能竞 争到优质位置,每日获取的流量较为有限;另一方面,单次点击成本较高,使得客户转化成本居高不下,对 展示广告逐渐丧失信心。 360商易日处理数据量约为34TB,主要来 商易 自于360内部数据,其标签覆盖了25个垂 34TB 搜索数据、浏览数据、APP下载和APP访问数据、LBS位置数据 决策指导 直行业,共有55万的行业及兴趣标签。 360DMP的PC数据量级近50TB,移动数 据量级达10TB,主要来自于360内部数 DMP 据、广告主自有数据以及外部合作数据。 基础数据、行为数据 60TB 精准营销 360分析目前日处理数据量为5TB,主要 来自360内部数据和外部数据导入,通过 “数据收集 → 日志存储 → 数据计算 → 5TB 分析 访客浏览数据、推广数据、转化数据、商品数据、购物车数据、订单数 数据存储 → 数据可视化”,为客户提供 效果评估 据、用户画像(人群标签)数据 广告效果监测与评估服务。 通过商易分析客户主体受众最 依托商易分析获得的受众画像优 通过部署360分析代码检测转 常搜索的关键词,在DMP中建 化物料,在DMP中搭建特征人 化,分析观察不同推广组转化 立搜索重定向人群。 群,以实现精准定向。 效果,并及时调整优化。 经过商易、DMP及360分析的协同助力,最终帮助客户CTR提升近三倍,转换成本降低38%。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 CTR 转化成本 ?.cn 52

新浪 实现双平台多终端数据互通,构建大数据内容消费场景 作为一家领先的互联网公司,新浪基于微博、门户网站、手机 新浪网及新闻App等移动应用组成的数字媒体网络,为用户 提供全方位多视角的媒体内容及社交体验,拥有海量用户资源。根据艾瑞网民行为监测系统iUserTracker以及移动网民行 为监测系统mUserTracker的监测数据显示,2016年9月,新浪系资产PC端的月度覆盖人数为.cn 53

新浪 用户与内容双管齐下,大数据洞察系统驱动业务发展 面对4T的日数据量,新浪通过人口统计学算法优化数据结构,以UID为核心维度,与超过4000个标签进行分级匹配,形成 最底层数据系统。在底层数据系统的基础上,同源数据基于不同的维度进行挖掘形成了两套大数据系统,分别是用户洞察 系统和内容洞察系统,其中,用户洞察系统包括用户画像、粉丝经济等子系统,内容洞察系统包括语义挖掘、舆情分析等 子系统,它们共同服务于各类新浪系产品,如门户广告系统(龙渊、扶翼、轩辕)、微指数等,此外,新浪也在对外逐步 开放API共享机制,逐步实现数据的商业化变现,用户与内容双管齐下,共同驱动业务发展。 新浪大数据体系架构 底 用户洞察系统 可 ? 精准营销 层 日产生 视 数 ? 声量监测 数据量 化 据 应 ? 个性化推荐 4T 系 用 统 ? 广告效果评估 内容洞察系统 … 实时画像 个性化推荐 根据用户偏好(搜索行为、关键词提及等)进行对应内容 Real-Time 业 Custom 推荐,并在信息流中展示,如首页特别推荐、微橱窗等。 针对客户投放广告中的产品所产 务 生的PV、UV,可以实时实现用 支 户画像,挖掘个人内容消费行 持 投放策略组合 结合投放需求,面向同源样本库考察人群调性,实现精确 为、社会化口碑行为、兴趣偏好 Business 定位,制定策略组合,以支持进一步的分析与投放。 等,得到用户的个人销售线索。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 54

新浪 基础大数据系统与可视化平台协同助力数据商业化 依托于旗下产品矩阵所获取的海量信息,新浪能够从基本属性、行为、态度、社交等多个维度挖掘用户数据的数据价值, 除了内部业务数据支持外,目前主要有三种与外部合作的方式:数据变现、数据对接以及案例合作。此外,在使用用户洞 察系统与内容洞察系统进行基础数据挖掘后,新浪可以通过微舆情、微榜单等可视化分析平台输出分析结果,为需求提出 方的品牌、营销、产品等多方面提供建议。 新浪大数据洞察维度及合作方式 开放数据接口 ? 搜索 制定策略组合 ? 职业 (非全量) ? 点击 反馈结果 行为 数 ? 地域 ? 点赞 据 数据 数据变现 变 ? 年龄 ? 转发 通过内容洞察 现 系统实时了解 舆情声量 ? 性别 可视化 ? 评论 基础定向 基本 态度 输出数据层 通过用户洞察 属性 数据 系统挖掘目标 通过黑盒形式 信息挖掘 情景分析 实现数据合作 人群特征 基础数据 数 案 据 用户与内容系 ? 群组 ? 语义 例 从行为态度和 对 统协同实现数 合 品牌青睐维度 接 社交 据结果 作 圈定目标人群 ? 私信 数据 ? 表情 分析反馈 ? 关注 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 拆解目标brief ?.cn 55

新浪 广告平台-门户:龙渊、扶翼、轩辕 随着RTB、DSP、AdExchange等概念兴起,精准广告形式迅速发展壮大。龙渊、扶翼及轩辕是基于新浪大数据系统、结 合了场景式沟通和口碑体验来进行精准的大数据定向以达到程序化对广告的解决能力的精准广告平台,主要服务于门户广 告的分发需求(微博广告分发途径与此不同)。龙渊作为全媒体覆盖广告平台,能够进行跨屏、跨产品线、混平台的独立 用户控频投放;扶翼作为精准效果广告平台,能够基于目标群体为广告主提供精准定向和创意优化双维度服务;轩辕作为 创意多元化广告平台,能够使同个广告位实现目标受众千人千面的品牌广告覆盖,并根据反馈结果进行实时优化。 全媒体覆盖 精准效果 创意多元化 广告平台 广告平台 广告平台 龙 扶 轩 在定向基础 按CPM售卖。 采用CPC/CPM 渊 主要售卖长尾 翼 混合竞价机 辕 上,实现广告 资源。 制,以效果类 创意多元化。 投放为主。 15 针对品牌客户的程序化广告策略, 扶翼是以数据洞察为基础、程序 轩辕的投放逻辑是在大数据系统的 龙渊的投放系统依托于新浪双平台 化购买为主导的效果自助广告平 支持下,使同个广告位实现目标受 多终端的海量数据资源,能够基于 台,支持程序化(RTB及非RTB) 众千人千面的品牌广告覆盖,接受 “UserID + CookieID + 用户行为 购买。 品牌从不同创意角度传递的理念, 日志”等多重定位的网络虚拟指纹 扶翼能够通过大数据系统实现用 从而减少品牌方在采购过程中的决 识别技术进行用户区分,进而实现 户与内容层面的数据挖掘,为广 策成本。 跨屏、跨产品线、混平台的独立用 告主提供精准定向和创意优化双 在实际投放过程中,轩辕还会根据 户控频投放。 维度服务。 受众的数据反馈,进行实时优化。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 56

新浪 数据营销产品-微博:品效通、粉丝头条 微博的数据驱动产品主要有两种类型,分别是品效通和粉丝头条。品效通在品牌速递基础上改良,通过独特展现形式的微 博信息流广告,精准投放给相关兴趣受众,并借助好友关系产生二次传播,实现客户高转化、低成本的营销诉求。粉丝头 条则通过原生展现形态,将宣传内容友好地融入到目标受众微博信息流。目前,每月有几十万微博用户使用粉丝头条推荐 自己。 定向投给品牌人群包、垂直行业兴趣人群、高信用高等级 优化粉丝质量 用户包,分年龄层用户包等对应用户包 品效通 抓取用户信息,用户一键提交信息完成活动报名,减去繁 信息流精准 强化线索收集 琐填选环节。 广告 重视用户召回 当用户点击广告后,对未提交信息的用户进行二次触达, 使其深入了解品牌信息。 使客户的博文24小时内置顶在粉丝信息流第一位,并可以 粉丝头条 基于好友关系、用户兴趣等维度将博文推荐给更多用户, 粉丝头条 还可以将博文推荐给指定账号粉丝的相似用户。 帮助他人的博文上头条,可借助明星大V等影响力进行宣 信息流精准 帮上头条 传,也可以为喜欢的明星的微博助推。 广告 账号头条通过大数据精准算法,把客户推荐给最有可能关 账号头条 注他的用户,快速获取大量粉丝。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。

应用案例 新浪+微博车企新车上市全新营销模型 6400万 车媒 汽车KOL 汽车品牌 个人属性/兴趣 汽车兴趣用户 汽车垂直媒体账号 车媒编辑、汽车从业人员 各类品牌及车系 车主、车迷、自驾、购车 2560万购车意向用户,1029万换车意向用户 兴趣群体中以80、90后用户为主,三四线城市用户表现出较高的兴趣 品牌客户 基于关键词提及、微博搜索、话题参与、用户基本属性等维度,从海量数据中通过洞 目标种子用户 察系统圈定汽车兴趣用户,通过信息流、banner、flash、icon等多种广告形式,精 准投放给目标受众,实现触达。 通过粉丝关注关系、意见领袖发声等多种传播途径,基于关系产生二次传播;此外, 为了形成有效的品牌召回,在洞察系统的支持下抓取曾点击card或链接但未提交信 种子用户粉丝 息的用户进行媒体(@微博汽车 或客户官方微博)再次触达,基于用户互动行为形 成二次传播,强化集客效果。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 58

新浪+微博车企新车上市全新营销模型 广告+话题推广+KOL 广告 话题 KOL 强势曝光,有效导流 整合权威内容 提升话题热度 通过开机报头互动版实现广泛覆盖,话题页将品牌呈 数据指标 话题推广 现与内容聚合有机结合,高级定制话题聚合新车声 ——————— 活动页UV、PV 开机报头 量,话题广告提升话题曝光,洞察系统支持目标群体 曝光次数 话题页 精准触达,Iframe(内页框架)实现活动承载,最终 提交信息 Iframe 达到品效合一,打造事件级影响力。 博文互动 (转评赞,加关注,收藏) KOL 直播是KOL发挥影响力的重要方式之一,广告主可通 点击次数 过直播博文发布、大号扩散及流量带入、粉丝push、 (Card、短链、按钮点击) 媒体/自媒体 直播后推广等环节实现全场景营销。以KOL专业测评 互动点击率 明星/网红 (口播)、条幅、品牌露出等形式,通过向洞察系统 (互动+点击)/曝光 … 粉丝头条 下目标人群推送及关系传播,形成品牌影响力。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 59

网易 大数据的发展与应用 网易拥有网易新闻客户端、邮箱大师、网易云音乐、网易公开课等多个产品,构成庞大复杂的业务矩阵,基于业务数据分 析需求,网易开始探索大数据领域。2009年和2010年是网易大数据的萌芽期,面对海量业务数据,网易开始尝试引入 Hadoop等成熟开源技术来解决数据存储和计算的瓶颈。从2011年开始,网易进入大数据分析的整合阶段,整合、规范各 类采集机制和指标体系,将数据分析“工具化”,以适应产品、设计、运营和市场等不同场景。在经历全面整合的阶段之 后,个性化的数据需求以及灵活的多维分析推动了数据分析的“平台化”。 随着大数据发展历程的前进,一方面仍面临着集成、计算和分析等数据处理的老问题,另一方面又出现了新的挑战,如数 据量多样性、数据类型多样性、需求多样性等等,而计算机软硬件设计的基础、各类计算机应用场景、总线和组件的标准 是统一的,未来网易将致力于从底层基础开始,设计大数据平台的数据集成、计算和分析,开发出更基础的融合大数据处 理平台,从而满足未来更加个性化的数据分析需求。 过去 11至今 未来 发 传统统计方法 引入开源技术 工具化 平台化 融合大数据 展 数据量过大,存储与 > 数据格式不规范,产品接入 > 不能完全满足个性化 新老挑战交加,发展 > 与 计算遇到瓶颈 成本高,计算任务不稳定 数据需求 环境愈加复杂 处理平台 应 用 历 基于杭州研究院10年的技术积累,网易运用大数据技术支撑了网易云音乐、云课堂、易信、LOFTER、公开课等 程 产品的发展。未来网易还将把其大数据的技术服务能力开放出来,提供给更多的用户使用。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 … ?.cn 60

网易 用户画像体系 网易对互联网用户大量分散的属性、行为加以采集加工挖掘,全面整合管理内部数据,通过汇聚、清洗、深度建模,以标 签形式全方位量化用户,从而达到对用户的精准描述,构建出庞大的跨渠道跨终端精准人群画像。目前网易用户画像的主 要应用场景包括精准营销、个人征信、客户群洞察与数据报告以及用户画像云服务等。 网易大数据用户画像体系 设备信息 ? 设备类型 ? 操作系统 用户行为 ? 联网方式 用户兴趣 ? 上网时段 ? … ? 产品偏好 ? 上网场所 ? 商业兴趣 ? … ? … 人口属性 购买能力 ? 基本属性 用户画像 ? 电商购买力 ? 家庭状况 ? 网游购买力 ? … ? … 精准营销 个人征信 客户群洞察与数据报告 用户画像云服务 (广告、推送、邮件) 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 61

网易 智能化应用助力业务人员实现商业价值 在大数据变现成为大趋势的潮流下,目前主要存在两种大数据合作方式,分别是作为数据提供方直接进行数据服务和作为 技术服务提供方提供大数据处理工具,网易在此基础上,不断整合自身技术优势,实现了大数据能力的输出。 通过对大数据业务化应用的思考,结合自身多年大数据经验,网易推出通用型大数据处理与分析平台,为行业内外更多的 业务人员提供数据工具,以克服技术障碍,充分发挥其对于业务的洞察力,挖掘数据规律,实现商业价值。未来还将通过 网易云的搭载扩大其大数据服务的覆盖范围。 大数据+ 大数据助力行业应用 大数据+电商 大数据+教育 大数据+金融 大数据+媒体 ——————————— ————————-——— 风险控制 用户画像 技术服务 云服务+大数据智能化应用 征信管理 市场预测 客户生命周期管理 舆情监控 大数据计算 大数据集成 大数据时代下数据挖掘与人工智能紧密相关,各产品应用每天会产生大量数 大数据管理 据,若要实现落地,商业智能是一种重要形式。大数据的智能化应用会直接 转化成成本和效益,聚焦到某些行业中,则能够取代一部分人工工作,比如 个性化推荐取代了传统网页编辑的内容筛选工作等。 网易云陆续发布了网易云信(即时通讯云服务)、网易七鱼(全智能云客 数据源 服)等云服务,将服务通过网易云的搭载来提供能够降低其获取成本并扩大 覆盖范围。除了将把智能化数据服务与云服务相结合之外,未来网易还将以 数据服务 大数据的集成、治理、计算和可视化分析为基础,继续深耕数据科学领域, 构建核心技术优势,为产业智能提供解决方案。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 62

网易 大数据处理 × 可视化分析 将不同数据源的数据通 大数据处理与可视化分析是 对经过处理的、相对结 过整合变成易分析易使 整合企业自有数据资 实现企业级大数据解决方案 构化的数据进行分析, 用的数据,供业务使 产,实现价值输出。 的重要基础。网易开发了猛 辅助商业决策。 用。 犸大数据平台与网易有数敏 捷数据分析平台,为不同业 务需求提供通用型工具。 数据管理 数据分析 数据整合 网易大数据体系架构 网易猛犸 网易有数 大数据平台 敏捷数据分析平台 大数据处理平台:承担着数据集 可视化分析平台:帮助业务人员 成、治理、计算的工作,把来自 高效率低成本地实现敏捷流畅的 不同源、不同结构的数据同步到 数据分析,根据需求定制维度, 内核存储系统,变成结构化易分 不必编程即可通过数据得到规 析的数据,并进行建模和清洗。 律,让数据推动决策,驱动运 营。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 63

网易有数 可视化轻量建立业务主题,快速获取数据价值 网易有数是网易旗下的敏捷数据分析平台,目前已开发出网页版和移动端应用,实现了多端支持。通过私有云部署,有数 能够帮助企业降低成本,缩短数据运行耗时,并且可以连接多种数据源,兼顾灵活性与结构性地实现流畅数据探索。 从操作层面来说,网易有数在无SQL操作的情况下,能够提供高效的数据透视结构以实现多维可视化数据分析,并且能够 通过计算字段提供自定义能力,帮助业务人员快速调整业务主题 ,适应各类需求场景 。其数据可视化智能推导引擎还能 根据自定义主题智能识别意图,自动推荐最佳匹配图表。此外,网易有数支持行列级别的权限设置。 从IT驱动转变为用户驱动,相较于传统BI平台,网易有数更加贴合业务需求,业务人员可以直观获取数据观点,从而提高 业务效率;数据分析团队也可以简化数据分析流程,缩短数据处理周期,将更多精力聚焦在数据建模和数据挖掘上。 网易有数与传统BI的业务流程对比 循环往复,从头再来 传统BI 预先预定数据源 数据经过ETL 加载到数据仓库 基础BI分析应用 需求变更 可视化 迅速创建 需求变更 连接数据源 大大缩短运行耗时 网易有数 业务主题 报表分析 快速调整 1 2 3 4 5 6 Excel MySQL Oracle Hive Spark Kykin 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 64

网易 网易易盾:内容大数据 × 场景化应用 随着网易产品版图的不断扩张、用户数量爆发式增长,网易将内容大数据沉淀出了商业价值。2015年,网易域内清理有害 信息约323亿,19年的大数据内容特征库奠定了其商业化的数据基石,输出了通用型反垃圾云服务——网易易盾,切入互 联网内容安全领域。作为网易云推出的极速智能反垃圾云服务,易盾依托网易的大数据和云计算服务,提供文本过滤、图 片识别、语音分析、视频检测等服务,帮助企业和开发者实现对垃圾有害信息的实时过滤、精准拦截。 广告过滤 智能鉴黄 暴恐识别 谣言排查 —————————— ————————— ————————— ————————— 依托十余年沉淀的邮箱及 基于智能识图技术及海 结合暴恐敏感图像智能 基于海量样本库及专业 UGC反垃圾技术,共享网 量样本库、信誉库,高 分析技术,快速识别定 运营经验,快速排查谣 易亿级反垃圾特征库 效识别色情图片 位暴恐目标图像 言类有害信息 文本数据检测 图片数据检测 直播数据检测 点播数据检测 机器学习 语义分析 特征库 信誉库 内容大数据 反垃圾服务的大数据场景化应用 网易单日亿级的内容数据量支撑起了其内容大数据,通过大数据系统对数据进行筛选、挖掘、分析、验证,输出信息特征,最终形 成反垃圾数据库,结合人工智能技术经验,提供云化服务。企业用户通过接口调用,即可借助网易大数据和云计算服务,根据场景 需求挖掘对应行业垃圾信息的特点,快速、精准过滤有害信息,降低运营风险,提升用户体验。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 65

应用案例-网易云音乐 用户洞察数据驱动产品优化 网易云音乐目前日活超千万,每天产生的行为日志接近100亿,正品高品质音乐歌曲超1000万,用户自主创建歌单数近1 亿,日均创建歌单数达42万个,累积评论2亿条,其中,上半年新增优质歌单中最高播放量达299万次。基于海量用户的搜 索、点击、评论及个性化功能使用情况等行为数据,网易云音乐运用大数据系统洞察用户习惯,归纳行为趋势,结合使用 群体与场景对产品进行不断优化,形成“用户行为 → 用户习惯 → 用户洞察 → 产品指导 → 效果评估”完整迭代过程,以 用户为核心,对产品的发展进行指导。从2013年到2016年,网易云音乐通过大量的数据分析,支撑用户从0增长至2亿。 网易云音乐-用户数据驱动下的产品优化流程 新用户搜索频率很 高,随着用户等级 提高逐渐降低 用户越来越不愿意 歌单推荐使用率翻 将热门推荐调整为 主动搜索歌曲,对 倍,私人FM播放率提 个人化的需求增强 基于用户个性的歌 推荐功能的依赖性 升了30%,最新音乐 单推荐 每日歌曲推荐的使 逐渐增强 进入率提升35% 用频率随着用户等 级提高而提高,之 后渐趋稳定 强化下载按钮,整 体点击率提升 黑胶样式吸引力 60%,拉新提升明 强化下载按钮,但 高,但老用户难以 显 提升下载率的同时兼顾 点击黑胶不再要求 照顾用户习惯, 接受使用习惯过度 用户体验,维护产品调 下载,而是以评论 适度迭代功能 强化下载按钮,同 修改,造成无意义 性,提升用户口碑 形式展开页面 时,点击黑胶唱片 点击 即可直接执行下 载,使点击率大幅 上升,但转化效果 与跑步相关歌单、 不好 电台的播放和互动 扩展了受众用户和合作 数据越来越高,且 运动市场扩张,用 用户已被充分教 在私人FM的基础上 伙伴群体,为营销和音 呈专业化趋势:根 户越来越习惯于跑 育,运动场景的音 推出跑步FM功能 乐付费创造了更大想象 据不同bpm推荐相 步时听歌 乐需求增强 空间 应音乐 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 66

网易云音乐:如何打造惊喜感 海量UGC × 协同过滤 网易云音乐在发展早期吸引到大批高素质音乐发烧友,其种子用户主要来自歌手和乐队,随后吸引到一些DJ和乐评人参与 其中,共同成为最初的KOL。平台沉淀着大量资深乐迷,口碑效应极好,歌单质量较高,并藉此形成了音乐UGC平台和社 区,通过歌单实现曲目的分享和推广。此外,网易云音乐通过大数据与人工智能,改变传统曲库型产品依靠“搜索+编辑 推荐”的模式,看重用户与用户、用户与产品的连接,为用户提供每日歌曲推荐、私人FM等基于用户个性化的推荐功 能。其推荐功能已经达到75%的使用率,用户满意度和推荐度较高。 协同 协同过滤在基于传统内容过滤进行推荐之外,还能通过对特定目标的相似性扩展,找到相似群体,综合他们在某一信 息上的评价,形成对特定目标关于此信息的偏好预测。 过滤 云音乐以海量UGC内容结合协同过滤、语义分析、操作分析等技术,从用户一系列的听歌行为, 个性化 以及App上的操作行为抽象出用户的听歌习惯、模式和操作习惯等,基于这些抽象数据,对于不同 推荐 类型的用户群体采用针对性的推荐策略。其特有的具有音乐社交属性的评论氛围,能够优化协同过 滤的稀疏性问题,目前其曲库使用率已达80%,能把一些小众歌曲推荐出来。 个性化推荐 长尾音乐 UGC 1% 80% 品鉴者 1)首先把音乐推荐给高层次用户(品鉴者),通过他们挑选出来相 对优质的音乐,定位为长尾音乐;2)然后将它们分享给UGC创建传 UGC分享 流行音乐 20% 20% 播者,他们把音乐组建成歌单,推荐给更多的用户,形成流行音乐; UGC创建传播者 3)最后通过算法及生态系统,这些音乐被传达给更多主流用户,通 过用户播放、分享、收藏、喜欢、评论等行为推动出现最热音乐。 全用户投票 最热音乐 80% 1% 主流用户 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 67

凤凰网 数据获取方式:站内统计、样本追踪与外部DMP合作 凤凰网作为互联网五大门户之一,始终致力于为广大用户提供专业、优质的内容,并对用户价值进行实时深入挖掘。为了 洞察用户的行为与偏好,深层解析内容阅读背后蕴含的人群价值观念及品牌营销机会,凤凰开发了自有大数据系统,目前 主要通过站内统计、样本追踪和外部DMP合作的方法获取数据,其中,站内统计获取的全量数据主要服务于大数据系统中 的凤凰统计平台,在其基础之上,结合样本追踪和外部DMP对接校准的方法,构建了凤眼系统。 站内统计 样本追踪 外部DMP合作 统计站内用户行为, 通过长期网上招募 积 将用户数据与外部 跟踪用户行为路径, 累了超过100万样 DMP对接,获取相 洞察用户兴趣点。 本,能够侦测人口信 应的的人口信息 。较 息,实时了解不同新 适合用户稳定的移动 闻事件背后的用户群 端,不太适合流失率 体。 较高的PC端。 A B C 数据来源 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 68

凤凰网 大数据系统结构 凤凰大数据系统由凤凰统计平台与凤眼系统共同构成。凤凰统计平台是凤凰的全量大数据平台,涵括了凤凰网底层海量数 据,通过站内统计,能将统计维度细分到每秒在某些位置的点击率、每个页面的每一帧的点击率等,并为凤眼系统提供底 层数据支持,是凤凰进行内容评估和广告投放的基础。 凤眼系统作为凤凰网解决用户信息的方案,能够通过将长期累积的人口信息用cookie或者IMEI号与用户行为进行对接,持 续追踪这些行为,洞悉不同内容背后的人群,从而逆推实现精准推荐。此外,凤眼还能通过与海量样本追踪的结合,将样 本数据通过后台算法、加权方案等,按照用户累积得到的人群结构进行匹配,实现合理映射。凤眼后续还将支持凤凰自有 DSP平台凤羽系统的DMP建设,并在有效地指导广告投放的基础上,继续探索商业化。 凤凰网大数据系统架构 凤眼系统 用户信息解决方案 累积100万样本行为追踪 凤凰统计平台 全量大数据平台 站内统计 凤凰新闻 凤凰视频 凤凰FM … 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 69

凤凰网 大数据系统-凤眼 伴随着原生营销的发展,凤凰在2014年中启动凤眼系统开发,并2015年中正式完成上线。凤眼系统,即凤凰用户属性监 测系统,是国内首个由媒体自行开发的基于新闻热点/事件的实时监测数据系统,系统借助数据挖掘技术,将样本信息与 海量行为数据结合分析,可实现实时针对热点新闻事件、专题、栏目覆盖人群属性、消费特征的分析,既可支持凤凰内容 编辑团队实时了解要闻、专题受众内容偏好,也能帮助客户预估投放TA效果以及投放覆盖用户规模,同时还能针对用户内 容偏好进行深度解析,形成服务于原生投放的内容标签,找到最适合广告

中国数据驱动型互联网企业大数 据产品研究报告 2016年 . cn

内容综述 聚焦网络媒体大数据,研究其体系架构及相关产品 大数据 互联网大数据 网络媒体大数据 Data Internet Media ? 发展阶段:从信息驱动向数据智能驱动 ? 优势体现:互联网基因有利于大数据的 ? 海外发展:1)企业技术探索先行, 进阶; 获取与处理; 政策推动产业发展进程;2)将自 ? 产业结构:由数据源、技术服务及应用 ? 现状分析:互联网行业是大数据应用的 主研发与投资收购相结合,技术推 类型共同构成; 领跑者。1)已上市互联网企业中,以 动企业发展; ? 数据来源:企业自有数据是主流数据源, BAT为首的数据驱动型媒体整体表现较 ? 优势体现:具有强媒体属性的网络 数据的流通和共享将成趋势; 好;2)未上市互联网企业中,数据驱动 服务的发展策略相对成熟; ? 数据管理:数据挖掘与可视化成行业热 型企业成为领跑者; ? 现状分析:中国网络媒体的数据生 点,数据管理向垂直行业分化; ? 机遇:1)手机网民持续增长,可采集群 态系统雏形已成,多维度输出大数 ? 分析处理:文本、图像、语音分析相对 体更加广泛;2)移动端使用时长占比超 据能力; 成熟,视频分析存在探索空间; 77%,信息采集更加丰富连贯;3)场景 ? 发展策略:大媒体以流量+广告服 ? 应用类型:从独立数据产品向完整行业 化特征为大数据发展带来新契机; 务为起点,推进产业生态形成。 解决方案发展,定制化将成趋势。 ? 挑战:屏幕变小、行为碎片化对大数据 本报告将聚焦于中国网络媒体,研 的应用提出更高要求。 究其大数据体系架构及相关产品, 来源:艾瑞咨询研究院自主研究及绘制。 探讨大数据发展趋势。 ?.cn 2

中国大数据产业现状分析 1 中国网络媒体大数据产业分析 2 中国网络媒体大数据企业分析 3 中国网络媒体大数据的机遇与挑战 4 3

大数据定义与特征 4V:数据规模大,数据流转快,数据类型多,价值密度低 大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。为了适应数据量的爆发式增长, 数据处理方式正逐步向全量性、混沌性及相关性发展。为了避免信息损失,越来越多的场景倾向于对全量数据进行挖掘与 分析,其中,只有一小部分数据是结构化的,而非结构化数据中同样蕴含着大量信息,因此,能够处理各式各样的混杂数 据的大数据技术得到了广泛应用和迅速发展。其中,占据着重要地位的大数据预测分析,也从主要基于因果关系进行分析 发展成了建立在相关关系的基础上的分析模式。 Volume Velocity 数据规模大 数据流转快 ————————— ————————— 抽样数据 >> 全量数据 IDC预计,到2020年,全球新建 1秒定律:要在秒级时间范围内 和复制的信息量将达到44ZB, 给出分析结果,超出这个时间, 中国数据量将超过8ZB。 数据就失去价值了。 Variety Value 精确数据 >> 混杂数据 数据类型多 价值密度低 ————————— ————————— 除了以文本为主的结构化数据、 海量数据中,如何通过强大的机 以网页数据为代表的半结构数据, 器算法,更迅速有效地完成数据 也存在大量网络日志、音频、视 的价值“提纯”,已成为目前大 因果关系 >> 相关关系 频、图片、地理位置信息等非结 数据背景下亟待解决的难题。 构化数据。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 4

大数据集成与存储 数据仓库基于企业整体建立,是大数据集成和存储的基础 作为大数据集成与挖掘的基础,数据仓库是在企业范围内共享准确一致的集成数据、针对分析需求进行数据重组的工具, 基于整个企业的数据模型建立。而数据集市基于单个部门或业务主题建立,为部门业务运行提供数据服务,可以根据仓库 建设也可以独立建设,形成从属数据集市和独立数据集市。所有的从属数据集市都从属于同一个数据仓库,各子系统的数 据均能保持一致。而每个独立数据集市都从各源应用环境中单独提取数据,独立拥有硬件平台、软件平台、数据和应用程 序,彼此没有任何约束,无法保证数据的一致性,从长远来看,既不稳定也不可行。 数据仓库能够对海量数据进行集成,满足大数据发展对数据存储的需求,为企业提供局部解决方案和全面解决方案。 数据仓库与数据集市工作原理示意 面向主题、集成、不可 按照某一特定部门的 数据仓库 更新且随时间不断变化 数据集市 决策支持需求而组织 Data Warehouse 的数据集合,用来支持 Data Mart 起来的、针对一组主 管理人员的决策。 题的应用系统。 源应用环境 从属数据集市 独立数据集市 大数据处理的数据价值流转过程 数据 数据 终端 数据源 ETL 仓库 集市 用户 注释: ETL是指从源系统中提取数据,清洗、转换数据为一个标准的格式,并加载数据到目标数据存储区(通常是数据仓库)的工具。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 5

大数据产业生态 产业结构由数据源、技术服务及应用类型共同构成 大数据产业结构示意图 大数据 Big Data 数据源 Data Source 官方数据 行业数据 企业数据 第三方数据 技术服务 Technical Services 数据准备 存储管理 计算处理 分析技术 数据挖掘 可视化 应用类型 Application Types 解决方案 工具/产品化服务 行业应用 如:精准化营销 智慧城市 如:智慧农场 精准营销 电信行业 如:互联网金融 ————————— —————————— —————————— 智慧政务 个性化推荐 生长监测 搜索引擎精准营销 金融行业 高频交易 智慧社区 舆情监测 医疗行业 产量预测 RTB实时竞价广告 社交情绪分析 智慧旅游 网站/App分析工具 电商行业 农业预警 重定向精准营销 信贷风险分析 …… …… …… 来源:艾瑞咨询研究院自主研究及绘制。 …… …… …… ?.cn 6

大数据产业图谱 工具/产品化服务 解决方案 个性化推荐 精准营销 舆情监测 网站/App分析工具 智慧城市 … (城管) (社区) 行业应用 数 电信 金融 征信 房地产 (农业) 据 智慧政务 应 用 交通 旅游 物流 地图服务 天气 农业 医疗 娱乐 体育 教育 人力资源 能源 智慧公安 … … 数据集成 数据存取 云存储 按应用类型 按数据类型 AI 图像分析 数 数 据 计算处理 数据挖掘 据 BI 文本分析 视频分析 管 数 分 理 据 析 全技术支持 安 可视化 语音分析 全 官方数据 行业联盟 第三方数据服务 数 地理、水利、卫星、气象等 据 数 企业数据 据 来 基础数据 信息类 关系类 交易类 交贵阳、上 源 按类型 易海、东湖 等大数据 按行业 金融 医疗 交通 物流 旅游 体育 娱乐 能源 建筑 农业 … 交易中心 注释:此大数据产业链地图为示意图,未将所有企业标出,举例企业顺序不涉及排名,按企业中文名称首字母排列。如有分类不当,请联系:aixin@。 7

大数据产业图谱 大数据应用广泛,价值升级来源于数据流通及共享 概述:本报告的大数据产业图谱以大数据产品的角度出发,对产业链角色进行划分。其中,数据管理与数据 应 分析部分包括了大数据基础架构及相关分析技术,能够实现大数据的存储、分析、挖掘、可视化等环节。而 数 用 应 在数据源与数据应用方面,从功能和流程角度来看具有高度的关联性及一致性,涉及行业极其广泛。 据 类 用 应 型 用 数据应用 大数据应用已渗透电信、金融、医疗、人力资源、物流、天气等多个行业,从产品角度来看,除传统的工具/ 存 分 产品化服务、行业应用及解决方案外,大数据应用也包括商业智能等分析服务。 储 ? 应用情况:目前大数据应用的主要输出形式是可视化报表,未来将在功能方面进一步融合提升。 数 析 、 ? 典型大数据行业应用: 据 技 分 ? 物流:优化整体运输流程,实现实时查询把控。 分 术 析 ? 营销:应用形式成熟落地,既提高了用户对目标商品的获取效率,又改善了商家的投放效果。 析 、 挖 数据管理与分析 掘 大数据基础架构包括多种数据库及相关分析计算技术,能够支持数据的采集、清洗、集成、存取、分析、挖掘 基 、 数 等环节,从功能角度来看,除传统的数据处理过程外,可视化分析等分析服务也是基础架构的一环。 础 可 据 ? 应用情况:企业(含互联网企业)的数据相关部门(如数据中心/数据分析平台/数据商业部等),主要通 架 视 管 过对数据的管理、分析及整合,服务于自有业务,同时不断拓展应用类型和范围。 构 化 理 ? 价值体现:大数据处理过程中流转的数据形态可划分为静态数据和动态数据,主要通过计算过程实现其价 … 值,其中,模型算法为数据深度挖掘的核心,能够实现预测等功能。 收 数据来源 数 数 集 据 目前数据来源已较为多元,维度也越加丰富,尤其是互联网行业,在数据深度与广度方面具有天然优势,而物 据 / 来 联网、车联网等的出现丰富了数据的采集方式与采集范围。 源 采 ? 源 应用情况:目前企业内部的数据打通已成行业趋势,未来将进一步实现行业内外的数据流通乃至共享。 集 ? 价值体现:1)大数据能够对人群进行细化管理,并提高对特定人群的覆盖率;2)数据价值的实现与其鲜 活度相关;3)大数据的核心价值不在于数据量大,而在于通过数据的沉淀与应用产生价值,其价值升级来 产品 功能 流程 源于数据的流通和共享。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 8

产业链:数据来源 企业自有数据是主流数据源,数据的流通和共享将成趋势 行业数据 第三方数据 企业自有数据 外部企业数据 ? 官方数据,包括国家统计局、工信部等及国家地 ? 运营商数据 包括CRM、ERP数据等企 主要通过企业合作、数据 理、水利、卫星、气象等部门发布的公开数据 ? 第三方机构数据 业内部数据,以及投资并 交易等方式获取,形式多 ? 行业联盟数据等 ? … 购企业的相关数据 样,来源广泛 数据交易 伴随着数据资源价值逐步得到认可,数据流通的需求不断上升,除企业直接合作外,数据交易市场开始出现,建立数据需求方与供给 方之间成规模化的联系。而数据的开放需要多方助力,数据的流通与分享能够为大数据的价值提升赋能,尤其在经济价值和社会价值 方面会有较大提升。 Data Sources 数据来源 近年来,官方数据开放程度提高,行业联盟兴起,第三方数据服务蓬勃发展,各大企业(以互联网核心 1)发展现状 企业为主)也开始逐步开放群体画像数据,单一数据的跨界融合放大了其价值。但目前大数据应用的数 据源仍以企业自有数据为主。整体来看,数据产生量爆炸式增长,可分析的数据维度越来越丰富。 尚未形成完善统一的监管政策与行业规则,企业之间的数据孤岛情况仍然存在。数据交易方面,数据交 2)主要困局 易模式与数据资产定价标准有待建立,发展程度尚不成熟。 艾瑞分析认为,大数据行业的发展将在政策法规和行业自律的约束下,从探索期步入高速发展的成熟期; 3)前瞻视点 在市场客观需求的驱动下,数据的流通和共享将成为趋势。 注释:企业数据的数据类型主要可以分为四类,分别是基础类(LBS/设备等),信息类(搜索/浏览数据),交易类(网购/O2O),关系类(社交等)。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 9

产业链:数据管理(1/2) 数据管理囊括从数据收集到应用的全过程,且外延仍在拓展 数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,经历了人工管理、文件系统、 数据库系统三个发展阶段。狭义的数据管理包括数据准备、存储管理、计算处理及数据安全等环节,伴随着非结构化数据 的爆发式增长,对数据的处理和管控提出了更高的要求,因此将数据挖掘和可视化也纳入广义数据管理过程,以满足更深 入的数据处理需要,在此过程中,数据管理的外延还将持续拓展。 数据准备 存储管理 计算处理 数据安全 包括数据采集、清洗、转换、 包括数据存取、云存储等方面。 包括大数据查询分析计算、批 伴随着数据量的增加,数据 集成等环节,从业务过程中提 数据量爆发式增长,数据存储由 处理计算、流式计算等多种计 安全的重要性越发凸显,既 取多数据类型的数据信息,转 集中式向分布式发展,提高存取 算需求。此外,云计算极大提 包括外来黑客攻击防护,也 化为便于计算和存储的形式。 效率,同时易于扩展。 升了对大数据的处理能力。 包括用户个人信息管理。 数据挖掘 可视化 基于不同的数据类型和格式提出的数据挖掘算法能够更科学地呈现 以可读形式展现数据结果,在人与大数据系统间传递、交换信息。 数据本身的特点,实现预测等更深入的分析需求。 交互形式越发丰富,降低了大数据的使用门槛。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 10

产业链:数据管理(2/2) 数据挖掘与可视化成行业热点,数据管理向垂直行业分化 大数据的数据管理环节 数据 存储 计算 数据 数据 可视 准备 管理 处理 安全 挖掘 化 Data Management 技术服务 数据挖掘和可视化成为行业热点,一方面,数据挖掘算法渐趋成熟,数据洞察深度提升,另一方面,可 1)发展现状 视化工具种类越来越多,应用需求的多样化催生了从场景衍生出来的定制化服务。 技术方面,大数据的运作效率始终是行业发展的痛点之一,基础设施尚不完善。此外,在信息泄露事故 2)主要困局 频发的情况下,数据安全领域还有待进一步深耕,以应对越发丰富复杂的大数据应用场景。 艾瑞分析认为,云环境下的大数据存储和计算是未来数据管理的发展方向,大数据存储与计算效率将不 3)前瞻视点 断提高;数据管理整体将向更垂直、更贴合具体行业特征的方向发展。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 11

产业链:数据分析 文本、图像、语音分析相对成熟,视频分析存在探索空间 文本分析 图像分析 语音分析 视频分析 技术 应用 技术 应用 技术 应用 技术 应用 —————— —————— —————— —————— —————— —————— —————— —————— ? 关键词检索 ? 舆情评估 ? 图像识别 ? 人脸建模 ? 语音识别 ? 语音听写 ? 运动目标检索 ? 活体检测 ? 机器翻译 ? 态度追踪 ? 人脸识别 ? 身份认证 ? 语音理解 ? 情绪洞察 ? 目标路径追踪 ? 交通监测 ? 语义洞悉 ? 口碑管理 ? 相似图像对比 ? 摄影测量 ? 语音合成 ? 人声模拟 ? 侦察预警 ? 场景布控 Data Analysis 分析处理 文本和图像的分析技术已相对成熟,可以达到较高精度,应用也相对落地。语音分析技术取得突破,可将 1)发展现状 非结构化的语音信息(语义、语调、语速、音量等)转换为结构化的索引,实现对海量音频文件的的知识 挖掘和快速检索。而伴随着视频类应用的盛行和监控摄像头的普及,视频分析的需求也在逐年上涨。 语音分析整体发展相对成熟,但在自然语言处理方面还存在难点;视频形成的多维非结构化数据的存储与 2)主要困局 挖掘技术仍不成熟,视频内容分析还存在优化空间。 艾瑞分析认为,视频分析和语音分析的需求将继续增大,在机器学习的基础上,未来将不断提高智能程度, 3)前瞻视点 进一步解放人工劳动,如应用于直播行业的内容监测工作。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 12

产业链:数据应用 从独立数据产品向完整行业解决方案发展,定制化将成趋势 解决方案 将基础设施和信息资源联合起来,结合政 务、公安、旅游等领域的典型行业特征, 工具/产品化服务 共同为对应产业提供智慧解决方案。 正逐步从通用型产品向更加场景化的方向 拓展,应用层面也更加落地,尤以智能分 行业应用 析类软件的快速发展为代表。 越来越多的行业开始探索利用大数据提升产 业效能。互联网化程度较高的行业转变得更 快,较早开始转型的领域积淀得更深。 Data Application 应用类型 大数据应用从独立的工具产品向完整的行业解决方案发展,相关产品和企业的数量大量增加,涉及领域 1)发展现状 越来越广。 各行业的数字化发展程度并不均匀,行业智慧解决方案所涉及的各领域数据的关联程度和挖掘深度还有 2)主要困局 待继续加强。此外,各行各业的数据应用需求具有较大差别,难以通过一类或几类数据产品全面覆盖。 艾瑞分析认为,产业赋能方面,未来智慧城市领域的政企合作将进一步延伸;工具属性方面,具体的大 3)前瞻视点 数据产品/服务将向轻量级、定制化方向发展,满足多样的需求。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 13

中国大数据产业发展 宏观政策环境不断完善,大数据已上升为国家战略 2012年-2015年中国大数据政策梳理 2015 强化 【国务院】推动移动互联网、云计算、大数据、物联网等与现代制 2013 推动 造业结合,促进电子商务、工业互联网和互联网金融健康发展。 【发改委】运用互联网与大数据的技术来创新监管的方式。 【国务院】推动商业企业加快信息 【工信部】大数据产业将纳入“十三五”规划。 基础设施演进升级,增强信息产品 【工信部】加快云计算与物联网、移动互联网、现代制造业的融合 2012 支持 供给能力,形成行业联盟,制定行 发展与创新应用,积极培育新业态、新产业,加快推进云计算与大 业标准,构建大数据产业链,促进 【国务院】支持海量数据存 数据标准体系建立。 创新链与产业链有效嫁接。 储、处理相关软件的研发和 【国务院】运用大数据加强对市场主体服务和监管。 【工信部】定义个人信息范围,提 产业化,推进信息安全关键 【国务院】推动政府信息系统和公共数据互联共享,建立市场化应 出个人信息收集和使用规则、安全 产品研发和产业化。 用机制,深化大数据在各行业的创新应用,强化信息安全保障,顺 保障等要求。 应潮流引导支持大数据产业发展。 国家对大数据产业的重视程度不断上升,从数据存储、软件研发到信息安全,从产业链、行业联盟到跨行业融合的新 业态,不断完善宏观政策,推动数据互联共享和标准体系建立,引导支持大数据产业健康发展。 一些地方政府也已开始着力发展大数据产业,自2013 年以来陆续出台了推进计划,强调研发及公共领域应用,促进相 关政策法规的完善;重视通过大数据引领产业转型升级,与企业合作共建地区大数据生态;建立大数据基地,吸纳优 秀企业落户扎根。伴随着宏观政策环境的逐步完善,我国大数据产业茁壮发展。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 14

中国大数据产业发展 从信息驱动向数据智能驱动进阶 中国大数据产业的发展正在从信息技术驱动向数据驱动方向进阶,未来在数据挖掘、机器学习、人工智能等技术的基础上, 还将以智能化的形式赋能各行各业。大数据趋势正从互联网向各个领域延展,各行各业的决策正在向“数据智能驱动”转 变。 中国大数据产业发展阶段的演变 IT DT “IT” 信息驱动 数据驱动 智能驱动 Information Technology Data Technology Intelligence Technology IT时代以自我控制、自我管 DT时代以服务大众、激发生 “IT”时代通过智能技术为 理为主。信息技术驱动生产, 产力为主。数据驱动业务, 产业智能提供解决方案、解 以信息流为核心,通过传感 以数据流为中心,注重开放、 放劳动力。智能驱动决策, 技术、通信技术和计算机技 透明、体验和分享,基于产 在数据挖掘、机器学习、人 术等实现占有、掌握、传输 业协同关系以及云计算等技 工智能等技术逐渐成熟的基 和控制。数据作为“附加产 术,通过数据整合打通数据 础上,赋能产业,改变人与 物”,碎片化严重。 链路,加快产业升级。 场景的交互方式。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 15

中国大数据产业发展 互联网基因有利于大数据的获取与处理 大数据结合互联网行业的发展相较于其他行业而言,发展速度更快,应用更加落地。其优势在于:1)数据获取:互联网 形式更有利于与用户发生交互,能够采集到连续数据;2)数据处理:互联网的形态更有利于海量数据的存储和分析,特 别是将大数据与云计算的结合,改变了传统的高成本低效率的数据存取方式。 在此基础上,互联网大数据能够结合大数据技术在金融、医疗等传统行业的发展经验,助力互联网+金融、互联网+医疗等 互联网大数据的应用高效健康地发展。同时,互联网大数据各应用类型的高速发展,也推动了传统行业对数据资产的重视 程度,加快了其数字化进程。 中国互联网大数据的核心优势 数据获取 互 互联网形式更有利于与用户发生 交互,能够采集到连续数据。 联 推动数字化进程 传 网 统 大 行 数据处理 数 提供行业经验 业 互联网的形态更有利于海量数据 据 的存储和分析。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 16

中国大数据产业发展 从互联网大数据向各领域延展 根据中国信息通信研究所统计,2014年中国大数据市场规模约为84亿元,预计2015年中国大数据市场规模将达到.cn 金融 互联网 各行业的数字化进程并不均 衡,部分传统行业的大数据 电信 制造 技术与应用的渗透率还较 低,仍有较大增长空间。 能源 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 17

中国互联网大数据产业发展 已上市互联网企业:以BAT为首的数据驱动型媒体整体表现好 .cn 广告营收 .cn

中国互联网大数据产业发展 未上市互联网企业:数据驱动型企业成为领跑者 .cn 数据驱动型 企业估值Top3均为数据驱动型企业 数据驱动型企业,通常自有完整大数 据系统,以数据为支撑进行各环节分 析决策,从而实现企业运营管理。相 较于传统企业,数据驱动型企业在企 业数据的时间纬度、颗粒度及覆盖度 方面都趋于精细化,并通过与实际运 增长指数较高的均为数据驱动型企业 营流程的结合,实现其数据价值。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 19

中国大数据产业现状分析 1 中国网络媒体大数据产业分析 2 中国网络媒体大数据企业分析 3 中国网络媒体大数据的机遇与挑战 4 20

海外数据驱动型网络媒体的大数据奠基 企业技术探索先行,政策推动产业发展进程 2003年-2015年海外网络媒体大数据政策及技术发展历程 美国政府发布 《大数据研究和 ? 2009年美国政 发展倡议》,并 美国白宫发布 府开始开放政 向大数据领域投 了2014年全球 府数据 资2亿美元,是 “大数据”白 麦肯锡发布第 大数据技术从商 英国政府宣布 皮书研究报 2010年德国 一份大数据报 业行为上升到国 注资.cn 21

海外数据驱动型网络媒体的大数据奠基 自主研发与投资收购相结合,技术推动企业发展 大数据已成海外网络媒体标配,其大数据发展历程与技术的迭代紧密相关,一方面,根据业务需求自主研发尖端技术,为 数字化发展奠定基础;另一方面,通过投资或收购大数据技术相关公司,整合业务,提高整体效能。无论是大数据的存储 形式还是运行机制的优化,都给产业带来了深远的影响。这对中国互联网媒体的大数据产业发展起到了示例作用。 2016H1国外主要媒体营收情况 ? 从2003年起,分别发布GFS、Map Reduce、Big Table、BigQuery及Dremel等先进技术产品。 ? 投资或收购云商务公司Orbitera、图像识别技术公司 Google .cn

中国数字信息量快速膨胀 中国数字量在世界总数字量中的占比预计达到40% 2015年底,全球网民数量达到.cn 23

网民规模不断扩大,增速持续放缓 手机网民持续增长,可采集群体更加广泛 2015年,中国整体网民规模已达.cn 24

PC端与移动端月度使用时长继续攀升 移动端使用时长占比超77%,信息采集更加丰富连贯 根据艾瑞网民行为监测系统iUserTracker以及移动网民行为监测系统mUserTracker的监测数据显示,2016年8月,整体上 网时长已突破500亿小时,其中,移动端总体使用时长达392亿小时,占整体上网时长超过77%。PC端月度使用时长趋于 平稳,而移动端月度使用时长呈现较大幅度增长。伴随着流量从PC端向移动端的迁徙,网民对移动设备的依赖性不断增 强,为互联网行业大数据产业在更长、更连贯的时间跨度上实现更加多元的信息采集提供了契机。 600 iUserTracker&mUserTracker-2006年7月-2016年8月 PC端网页、手机端App、Pad端App月度使用时长情况 500 500 PC端 400

移动互联网时代的大数据挑战与机遇 屏幕变小、行为碎片化提出更高要求,场景化带来新的契机 在移动互联网时代,用户的注意力从大屏转移向小屏,上网行为更加碎片化,产生的非结构化数据的类型更多,量级也更 大,因而相较于PC端,移动互联网产品对互联网企业的大数据能力要求更高。 而伴随着移动互联网的发展,用户的触网场景愈加丰富,通过移动设备能够更方便地获取用户地理位置等场景信息,进而 判断其所处场景,并进行相应的内容推送,提高个性化精度,获得更好的点击转化效果。 移动互联网时代的大数据挑战与机遇 屏幕小 碎片化 场景化 移动端比之PC端,屏幕变 移动端的用户行为更碎片 通过移动设备能够获取用 小,单位展示空间也相应减 化,也更具有实时性。移 户的场景信息,判断用户 少(整体展示并未减少,如 动设备覆盖了用户更完整 当下场景,并结合其偏好 原生信息流广告的应用), 的上网时间,产生了更丰 进行信息推送。 因而要更加注重用户体验, 富数据。 更精准地提供内容或服务。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 26

移动互联网时代的产品发展策略 具有强媒体属性的网络服务的发展策略相对成熟 mUserTracker-2016年8月中国移动App 大类别月独立设备数 实用工具 .cn 27

中国数据驱动型网络媒体的大数据战略 媒体间的数据联动提升其数据使用价值 媒体数据对外开放的程度正在逐步提高,同时应用范围渐趋丰富,除指导广告投放、实现精准触达外,还将向产品优化指 导、运营决策支持、舆情监测分析等方向拓展;此外,媒体数据还将进一步支持智能技术的发展和实现。而外部数据获取 和使用的行业标准,将伴随着加密技术的发展而加速形成;同时,外部数据也将对来源广泛的多维数据进行数据联动的方 式和价值进行进一步探索。伴随着媒体数据的开放程度进一步提高,甚至形成企业间的战略联动,媒体数据的使用价值将 提升,在数据话语权上占据主导地位。 媒体数据与外部数据对比分析 完备程度( ) 完备程度( ) 开放程度( ) 开放程度( ) 媒体数据 商用程度( ) 外部数据 商用程度( ) Media External 挖掘程度( ) 挖掘程度( ) 媒体自有数据主要由用户数据组成,通过打通企业内部 外部数据的来源广泛且维度多样,通过第三方、数据交 数据链路,主要服务于自身的数据洞察。 易等途径进行跨企业跨行业的流动。 目前大媒体数据的使用较为封闭,中小媒体的数据重视 由于统计口径及数据形态不一,数据整合难度较大;且 度不高,数据价值有待挖掘。 数据融汇贯通的程度不足,联动效果的发挥尚不明显。 注释:外部数据包括媒体以外的wifi、路由等数据。 来源:艾瑞咨询研究院自主研究及绘制。 ?.cn 28

中国数据驱动型网络媒体的大数据战略 大媒体以流量+广告服务为起点,推进数据生态形成 2016年中国Top级网络媒体流量梯队分布 月度用户覆盖量 5亿+ 3亿+ 2亿+ 360、阿里巴巴、 爱奇艺、网易、 凤凰、乐视等 百度、搜狐、腾讯 新浪、优酷土豆 数据驱动型网络媒体的大数据战略以流量+广告服务为起点,逐步推进形成生态 媒体属性为网络媒体带来了巨大流量,产生了海量数据,为加快企业数字化建设进程,以BAT为首的互联网媒 体纷纷布局大数据,作为输出,其广告服务能力也伴随着大数据的发展和应用而快速成长。在流量快速持续增 长、广告规模增长以及广告形式多元化过程中,互联网媒体的大数据能力逐渐增强,开始布局多种多样的数据 链条,深耕大数据采集、清洗、集成、存储、分析、挖掘、可视化及安全等各个领域,探索可行的大数据落地 形式,推进产业生态形成。 注释:按企业中文名称拼音首字母排列。 来源:.cn 29

中国数据驱动型网络媒体的大数据战略 数据生态系统雏形已成,多维度输出大数据能力 网络媒体的大数据业务正处于初级阶段,但与整个互联网行业的大数据应用情况相比,其应用相对较为成熟,发展速度极 快。目前各家数据生态系统的基本雏形已然形成,数据产品向“面向用户端”与“面向商业端”分化,接下来的发展将趋 向于根据业务模式和应用场景对系统内部角色进行细分。网络媒体属性增强了企业获取大数据的能力,未来还将继续探寻 数据资产的商业化出口。 艾瑞分析认为,目前国内数据驱动型互联网媒体的大数据输出主要可以分为技术能力输出与数据服务输出两种类型,其 中,技术能力以“大数据工具/产品”形式输出,而数据服务的输出则主要可以划分为“提升内容质量”和“提升内容触 达效率”两个主体方向,其中,前者通过内容积淀实现,而后者则通过用户洞察和精准投放实现,同时,后者还成为了大 数据在网络媒体中应用的主要形式。国内网络媒体的大数据输出目前主要服务于自有业务,包括指导产品优化和实现个性 化推荐(含精准营销)等,主要客户来自互联网化程度较高、数据敏感度较高的行业,如电商、金融等。 2016年中国网络媒体大数据输出类型划分 技术能力输出 数据服务输出 工具 内容 用户 精准 产品 积淀 洞察 + 投放 通过标签库等形式对人 主要用于广告精准投放 主要应用包括网站/App 主要应用类型包括反垃圾 群进行细分管理,主要 和新闻、音乐等的个性 分析、数据统计、可视化 云、病毒特征库等,降低 服务于企业内的业务相 化推荐等,实现信息与 等方面,在大数据发展早 噪音,提升内容质量。 期,是大数据能力输出的 关人员。 人群的智能匹配。 主要形式。 提升内容触达效率 提升内容质量 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 30

中国数据驱动型网络媒体的大数据战略 中国网络媒体大数据应用地图 腾讯万象优图、腾讯智能语音服务、360天眼、 网站分析工具 数据服务输出(内容积淀) 网易易盾… 百度统计/移动统计、腾讯移动分析/网 站数据分析/HTML5数据分析… ③用户端产品支持 大数据处理 腾讯大数据处理套件、网易猛犸… 百度联盟、百度凤巢、百度SSP、阿里妈妈、芒果移动(阿里)、腾讯社交 ② 广告、腾讯智赢销、腾讯SSP、360点睛实效平台、新浪龙渊、新浪扶翼、 推荐/搜索 广 网易有道智选DSP、凤凰凤羽DSP、搜狐汇算… 百度推荐、阿里巴巴推荐引擎、腾讯推荐… 告 平 流量交易 创意投放 可视化 台 Tanx Ad Exchange(阿里)、腾讯Ad Exchange 百度霓裳、新浪轩辕 百度Echarts、阿里巴巴DataV、阿里 巴巴Quick BI、网易有数… ① 市场研究 营销指导 机器学习 舆情 数 百度指数… 百度灵犀、阿里御膳房、新浪洞察系统、360商易… 百度机器学习、腾讯机器学 新浪微 据 习、阿里巴巴机器学习… 舆情… 支 数据管理 效果评估 持 百度方物(DMP)、阿里达摩盘、腾讯 云服务 百度精益、360分析、 产 DMP、360DMP、凤凰凤眼、搜狐DMP… 搜狐品算… 百度云、阿里云、腾讯云、网易云… 品 营销过程数据解决方案 解决方案 百度思维、ACE腾讯广告开放平台、360精准营销闭环、阿里妈妈精准数据营销… 百度大数据+、数加(阿里云)… 技术能力输出(工具产品) 数据服务输出(用户洞察+精准投放) 注释:此中国网络媒体大数据应用地图为示意图,未将所有企业及其产品标出,举例顺序不涉及排名。如有分类不当,请联系:aixin@。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。

中国大数据产业现状分析 1 中国网络媒体大数据产业分析 2 中国网络媒体大数据企业分析 3 中国网络媒体大数据的机遇与挑战 4 32

案例综述 选取月度覆盖量2亿以上的部分企业进行案例分析 企业出现的先后以企 本报告所选取企业不 业2015年网络广告市 含视频类及社交类企 案例背景 场媒体营收规模排名 业,视频类及社交类 为序。 企业相关分析请参见 《iResearch-2016年 为更完整的介绍行业 中国在线视频企业创 情况,艾瑞以充分展 LOREM IPSUM LOREM IPSUM 新营销研究报告LOREM IPSUM》 现每一家企业的特色 《iResearch-2016年 和优势为出发点,选 DOLOR SIT DOLOR核心企业 SIT 中国社交网络创新营DOLOR SIT 取了月度覆盖量2亿 销报告》。 以上的部分AMET SITM企业进行 AMET SITM AMET SITM 详细分析; 由于时间和篇幅的限 案例企业包括: 制,未能将所有优秀 百度、腾讯、360、新 相关报告 企业及旗下优秀产品 浪、网易和凤凰网。 呈现在报告当中,敬 请谅解。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 33

百度 以人工智能为战略核心,与应用场景建立动态关联 2014年4月,百度发布大数据引擎,全面对外开放自身的大数据平台,将开放云、数据工厂和百度大脑等核心大数据能力 开放,向外界提供大数据存储、分析和挖掘技术,并提供行业洞察、营销决策、客群分析、舆情监控、店铺分析和推荐引 擎等服务,在医疗、交通、金融等诸多领域有了广泛的运用。 百度大数据发展历程 百度深度学习研究院 .cn 34

百度 大数据+云计算+人工智能:百度大脑 百度大脑是百度人工智能技术研究的重要成果,主要由三部分组成,即算法、计算能力以及大数据。其中,算法包括了模 拟人的神经元组成的网络、万亿级参数和千亿样本,计算能力则由数十万台的服务器提供支持,其中很大一部分不是基于 传统CPU,而是基于GPU集群,而在数据源方面,百度能够获取海量网页内容、搜索数据、图像视频数据和定位数据等。 围绕着这三个核心部分,百度大脑的能力主要分为四个方向,分别是语音、图像、自然语言处理和用户画像。 百度大脑所涉技术与应用概况 语音技术 语音 人脸 全景图 合成 可分为语音识别与语音合成两个部分,目前已经应用在语音搜索、语 识别 制作 音输入、智能家电语音遥控和小说有声阅读领域,如可以帮助客服、 无人 销售人员,通过对客户语音进行实时识别,推荐最合适的销售方案。 语音 图像 车 语音 识别 技术 计算 技术 图像技术 能力 AR 应用方向包括人脸识别、全景图制作、无人驾驶汽车以及AR等,通过 获取场景数据(图片中出现的景物环境等),可以进行拍照翻译、刷 脸身份验证、色情度识别等。 百度 自然语言处理技术 大脑 能够支持机器翻译和实时解说,能够实现搜索知识问答、搜索推荐、 算法 数据 新闻摘要生成、会话翻译、评论分析等,能够支持27种语言互译,并 助力打造了百度人工智能产品——度秘。 机器 个性化 翻译 自然语 用户 画像 用户画像技术 言处理 画像 从个性化特征和垂直行业特征两个维度对用户进行刻画,前者展现用 户的人口学特征、短期意图、位置属性等通用信息,后者根据用户在 垂直行 各领域的习惯偏好实现新闻精准推荐和个性化推广过程设计。目前已 实时 业画像 解说 应用于个性化营销、用户群分析等方面。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 35

百度 商业生态大数据生态架构 百度拥有的数据类型主要是搜索数据,通过全面复杂的产品矩阵,百度能够获取以搜索数据为核心、来源广泛且维度丰富 的海量数据,并实现广告主CRM、广告主自有ID、到店/站数据、注册数据以及统计监测/Cookie等的数据接入,形成完 善的数据体系。结合第一方数据和第三方数据,百度通过其严谨统一的指标体系对数据进行分析,从数据产权、底层数据 标准和应用标准三个方面进行定义,支持各数据产品的运营和发展。百度商业生态大数据输出主要可分为百度投放产品和 对外提供产品及服务两类,助力百度生态圈(包括其客户、合作方及百度联盟等)高速发展,一方面优化用户和客户的使 用体验,增加用户粘性及百度的品牌影响力,另一方面,提升产品运营效率,巩固生态圈,促进数据价值的商业化实现。 百度商业生态大数据生态架构 百度DSP、百度网盟、移动DSP… 配置化DMP Cloud DMP、数据营销模型共建 百度投放产品 对外提供产品 对外提供定制服务 数据产权界定 底层数据标准建立 应用标准制定 第一方数据 百度数据源 第三方数据 网站数据/搜索广告/展示广告/API上传 第三方DMP/运营商/WIFI类/… /CRM/… 广告 广告主 到店/站 注册 统计监测/ 网页 线下 线下 搜索 LBS 电商 社交 金融 CRM 自有ID 数据 数据 Cookie 浏览 到访 消费 … … 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 36

百度 营销数据产品体系-百度思维 百度思维是百度营销数据产品体系的总称,与营销相关的百度大数据产品主要包括营销决策指导(包括市场趋势洞察,品 牌竞争分析,营销活动规划) 、受众管理和评估分析三类,其代表产品分别为灵犀、方物和精益,它们共同构成营销过程 数据解决方案。贯通了百度指数、营销过程数据解决方案、数据管理平台以及数据服务接口API,百度思维分别从营销决 策指导、受众管理和评估分析三个维度支持营销产业链的各角色如广告主、广告代理公司的营销过程。 百度启动了以营销数据产品驱动的品牌营销生态战略,通过百度思维深耕营销领域,攻关技术难题,累积行业经验,未来 还将在此基础上继续向其他领域拓展,将营销领域的经验结合其他行业特点复刻到金融、生活服务等各个行业,实现各行 各业的商业赋能。 百度营销数据产品体系(百度思维)结构 营销过程数据解决方案 百度 数据服务接口 灵犀 方物 精益 指数 (DMP) API 数据管理平台 基础建模 知识库 数据接入 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 37

百度思维 营销数据产品驱动的品牌营销业务流程 百度营销数据产品体系的业务流程包括了市场行业研究、营销决策支持、数据资产管理及效果监测评估四个环节,分别通 过百度指数、百度灵犀、百度方物以及百度精益实现,既满足了大客户和代理公司关于市场监测和营销决策支持的需求, 也能帮助效果类客户对人群进行定义并提供投放指导。此外,百度也与政府、高校及相关研究机构建立合作,共同进行趋 势探索、热度分析等相关项目。 百度品牌营销业务流程 指数:市场行业研究 灵犀:营销决策支持 方物:数据资产管理 精益:效果监测评估 指数:市场行业研究 灵犀:营销决策支持 在广告投放前对行业、市场进行宏观研 包括品牌策略制定和传播策略与传播方案 究,对品牌、产品、消费者表现进行评估 制定两个部分,通过市场及行业研究、品 分析,从而了解市场态势,制定相应投放 牌竞争分析、数字消费者洞察、营销活动 策略,总结整体发展趋势。 规划等环节,助力广告主制定营销决策。 方物:数据资产管理 精益:效果监测评估 接入广告主第一方、百度第二方和客户合 通过人群转化、流动、对比分析和多渠道 作的第三方数据源,通过多维度灵活定 归因分析,多维度综合评估投放效果。一 制、多人群交叉组合、多角度人群画像和 方面,总结市场规律与行业趋势,量化广 种子人群不同灰度扩展、多渠道分发,帮 告效果,另一方面,根据投放结果调整投 助广告主提高投放精度,提升投放效果。 放目标,指导下次投放。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 38

腾讯 大数据的发展与应用 伴随着互联网的发展和网民对内容需求的转变,腾讯通过大数据,推动其内容的生产和分发走向个性化。在内容的产生方 面,为了满足网民越来越个性化的内容需求,腾讯对用户进行了多元立体的洞察,继而创造或寻找对用户更有价值的内 容;而在内容的分发方面,网民获取信息的方式已从过去千人一面的版位式阅读发展到越来越便捷智能的个性化推送,腾 讯从用户需求和用户体验出发,高效精准地为用户提供个性化新闻、歌曲、广告等等。 大数据作为企业发展的助推力,已深入到腾讯的方方面面,推动着其整个产品体系的前进,一方面指导产品优化,提升用 户体验,另一方面实现精准人群定向,助力个性化推荐。借助其数据洞察的广度和深度优势,未来腾讯还将在数据安全的 基础上进一步赋能商业。 腾讯大数据发展方向梳理 覆盖90%以上网民,实现 强大的数据专家团队,为 长时间跨度、多场景覆盖 各产品线提供大数据支持 发展方向 未来将继续从 未来将通过数 未来将继续向 用户需求和用户体 据共享及战略合 全场景营销方向发 验出发,优化产品 作,扩容腾讯数据 展,助力广告客户 设计,提供个性化 池,营造更高的数 打造互联网广告数 服务,为用户创 据价值,形成智慧 据营销开放协作新 造更大价值。 数据服务。 生态。 用户 数据 营销 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 39

腾讯 广泛数据来源 腾讯将业务体系中的海量用户数据作为底层大数据基础,基于唯一可识别的ID(QQ号或微信号),进行跨平台数据整 合,全方位地对用户在各个场景下的特征和行为进行分析,支持应用层面上的所有业务需求。腾讯大数据体系中的数据来 源广泛、类型多样,除了主要的社交类数据外,还涵括了移动、搜索、资讯、娱乐及生活等多个领域的数据。 腾讯大数据数据来源分布 搜索 QQ 资讯 月活跃账户

腾讯 多维用户洞察 腾讯将用户数据按照基本属性、社交兴趣、娱乐兴趣、媒体兴趣、浏览习惯、购买倾向等不同纬度细分为3000多个标签, 能够组合定制TA画像。基于其算法,腾讯能够根据用户数据洞察用户的上网习惯、用户特征及消费特点,从而推断出用户 在各个场景下的社交习惯、消费偏好、浏览兴趣等,不仅能提供个性分析,定制化挖掘多行业人群,分析投放方案,还能 通过基于拥有强大计算能力的Spark机器学习的Lookalike将种子人群和这些标签进行相似度计算,寻找潜在目标人群。 腾讯大数据标签体系 内容 学历 微信 腾讯网 职业 QQ 标签 新闻 网络 年龄 音乐 客户端 游戏 手机 用户 地域 社交 行为 用户 游戏 标签 媒体 网页 标签 属性 QZone 性别 视频 游戏 电商 儿童 应用宝 游戏 沟通 交易 上网 广告 游戏 交流 休闲 娱乐 用户 习惯 基础 QQ 平台 虚拟 用户 平台 浏览器 游戏 彩贝 支付 行为 特征 电脑 相册/ 积分 工具 管家 歌单 资讯 商业 使用 关系链 获取 层面 等级 角色 个人 母婴 资产 游戏 用户 微博/ /3C 兴趣 兴趣 广告 消费者 账户 日志 用户 属性 特权 兴趣 细分 订购 电商 高低 付费 注册 注册 关系 兴趣 消费 时间 渠道 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。单身/ 新婚 ?.cn 41

腾讯 大数据体系架构 作为日接入数据量.cn 42

腾讯 腾讯DMP:助力精准投放,丰富投后洞察 腾讯DMP基于腾讯累积长达18年的海量数据与强大的算法挖掘服务,能够提供给广告主定制化的TA画像和人群洞察报 告。此外,腾讯DMP支持与广告主自有CRM对接,获取Look Alike人群包,广泛触达潜在TA人群。腾讯DMP主要应用在 数字营销领域,连接内部与外部多方数据,系统化、模块化地处理数据,从而打造数据资产链条,实现数据应用价值。目 前其核心作用在于助力精准投放以及丰富投后洞察,未来在保证数据的安全和隐私的基础上,将逐步向系统层面的自动化 方向发展,在应用层面上赋能商业。 腾讯DMP产品特征总结 量化 规模化 精准化 腾讯联合研究机构,为广 腾讯DMP支持第三方数 腾讯DMP帮助广告主建立 告主提供基于消费者研究 据接入,借助第三方建立 品牌自有DMP模块,将客 的DMP模块,从而为品 的数据安全港,更加安 户按忠诚度、产品线、终端 牌提供消费者聚类标签, 全、系统化地连接企业 等不同维度进行划分,通过 引入第三方全量实时监 CRM数据与腾讯DMP用 多维数据交叉分析,获得不 测,使得投放效果可被衡 户数据库,提升品牌 同维度下的目标人群圈层, 量。 CRM数据的利用率,实 沉淀品牌数据资产,促进广 现规模化跨媒体精准投 告投放 “对症下药”。 放。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 43

腾讯 ACE腾讯广告开放平台 腾讯打造的ACE腾讯广告开放平台,致力于在腾讯完善数据生态和优质媒体资源的基础上,依托腾讯的全系产品生态圈, 通过不同类型产品满足不同类型客户的不同需求,主要包括四款营销产品:1)基于QQ空间、QQ、微信公众号、微信朋 友圈等优质广告资源,跨平台,跨终端的效果广告平台腾讯社交广告,2)基于腾讯新闻、腾讯视频、天天快报等优质媒 体资源,跨平台、跨屏幕媒体的品牌广告自助营销平台智赢销,3)助力区域客户实现品效合一的营销服务产品智汇推, 4)满足品牌客户区域化需求和区域客户品牌化需求的营销产品智汇通。其中,腾讯社交广告和智汇推为效果广告产品, 智赢销和智汇通为品牌广告产品。 ACE腾讯广告开放平台 广告投放服务 流量交易服务 媒体服务 DSP AD EXCHANGE SSP 娱乐 社交 资讯 搜索 生活 广告行为

腾讯 ACE腾讯广告开放平台 ACE腾讯广告开放平台依托于腾讯DMP数据管理平台,以大数据为基础,连接流量与广告主,通过各营销渠道,打造衡量 效果统一的数据营销生态。ACE所包含的四款产品彼此优势互补,既覆盖了品牌广告和效果广告两种广告类型,也覆盖了 CPM、CPD、CPC、CPT及合约CPM等售卖方式,能够灵活地发挥腾讯旗下各类优质媒体资源的营销优势,助力不同需 求的广告主实现不同的营销效果。 ACE腾讯广告开放平台-广告平台概述 智汇通深耕区域市场,通过定时、定向可见的广 告交易模式,为区域品牌广告主提供小预算大声 智汇通 量、跨媒体跨终端的广告投放解决方案。按CPT 智赢销作为品牌广告自助营销平台,广告数 售卖,可根据用户浏览习惯整合跨平台资源投 据透明可监测,并支持广告购买和投放分开。 放,服务行业包括旅游、房地产、汽车、家装 售卖方式以合约广告为主,主要按CPM 等。 和CPD售卖,实现品牌曝光。此外,智 智赢销 赢销还与DMP打通,支持账号体系共用, 智汇推通过标签、计算以及匹配追踪用户,为区 DMP挖掘到的人群包可直接在智赢销中投放。 域广告主提供解决方案。售卖方式为RTB,主要 智汇推 按CPC售卖,实现点击转化,对后续提升较有 腾讯社交广告将传统的广告保量购买方式与 利。 程序化广告的人群定投相结合,推出了合约 腾讯 CPM售卖方式,广告主可以借助平台进行 投放群体预估,并按需求锁定这些目标人 社交 群在不同媒体的曝光量,自定义投放期间的 广告 频次参数,精准触及人群,保持稳定曝光。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 45

应用案例 腾讯DMP × 贝贝 腾讯智慧数据管理平台能够为广告主提供多元、开放、安全的传播服务的平台。通过该平台,腾讯能够连接各方数据,打 破数据孤岛,在开放的数据生态下,通过全方位的合作,帮助广告主达成人群的有效触达,实现品牌营销的数据价值最大 化。腾讯向广告主提供数据洞察分析、人群定向投放和跨媒体数据服务,高效、准确地寻找到TA。广告投放后,TA浓度 和ROI都比常规投放有了大幅提升。 在腾讯DMP与母婴特卖网站贝贝网的合作中,腾讯DMP运用母婴标准化人群包获取高频母婴人群TA,并根据用户的视频 浏览、广告偏好、QQ群兴趣、媒体资讯、手机App等数据进行定向,以视频贴片形式向电视剧、综艺等内容投放广告, 最终实现多次触达完成率提升,下载激活量提升16倍,TA浓度提升26%的投放效果。 母婴 动画 护理 剧情 DMP 微信兴趣 视频浏览 定向投放 标准化人群包 投放周期: 5月5日-5月13日 内容定向:电视剧、综艺 社交兴趣标签 早孕 母婴 投放形式:视频贴片 育儿 近1个月内腾讯 日化 视频广告浏览 商业兴趣标签 手机App 广告偏好 超30次 多次触达KPI完成率提升 应用兴趣标签 下载激活量提升16倍 媒体兴趣标签 育儿 孕产 TA浓度提升26% 成长 育儿 媒体资讯 QQ群兴趣 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 46

360公司 大数据发展历程:从 “IOE”到“IoE” 大数据概念还未完整成型时,360采用IOE系统(IBM-服务器提供商,Oracle-数据库软件提供商,EMC-存储设备提供商, 三者共同构成了一个从软件到硬件的企业数据库系统闭环)进行数据分析,但随着万物互联时代的到来,大数据成为洞察 用户至关重要的一环,360开始集成多端数据,为用户提供精准的信息服务。相较于传统的IOE系统,大数据系统成本低, 可定制,并且扩展性较好,目前每天新增约500TB数据量,可以在几分钟之内调度几十万个CPU进行计算,也可以对TB级 数据进行秒级快速处理。 360在PC端、移动端及智能硬件等方面均有布局,形成了多维产品矩阵,能够通过各个终端采集数据,反馈到云端,汇总 进入大数据平台,经过分析挖掘形成反馈。未来360将加大资源整合力度,一方面打通企业内部所有数据,并使各产品线 的业务人员参与其中,另一方面继续推动各端全面发展,实现万物互联。 360大数据发展历程 产品线 业务人员 硬件 >> X86服务器 软件 >> 开源定制 大数据平台 IOE 万物互联 IoE IBM&Oracle&EMC Internet of

360公司 安全基因下的行为链厚数据:场景化数据联动大数据生态 自2014年开始,360布局智能硬件领域,以自有品牌、战略投资、生态合作等多种方式并行联动,打造360智能硬件生态 链,形成安全基因下的行为链厚数据。同时,360将能够贮存海量原始日志的离线数据和能够对数据进行同步记录与分析 的实时数据有机结合进行处理,既实现了数据的批量处理,又能进行实时决策和反馈,极大地提升了其数据处理速度和日 均处理数据量 。360深耕行为链大数据,从PC、移动到智能硬件多端了解用户的行为轨迹,在保护个人隐私和数据安全的 前提下,立体多维地分析和洞察用户的需求、习惯、偏好、决策,从而运用场景化数据联动大数据生态,催动多种自有应 用场景并对外输出数据服务。 360行为链厚数据布局 智能摄像机 智能手表 安全路由器 战略投资 自有品牌 随身 生态合作 WiFi 超级充电器 空气卫士 行车记录仪 场 可穿戴设备、智能家居等智能硬件产品覆盖了用户不同使用场景,能够采集到维度更加丰富的 行为习惯分析 景 场景化的用户行为数据,联动更完整的大数据生态。不光能通过用户行为习惯分析为大数据检 数 验提供支持,还能根据即时场景,结合大数据的计算处理,以移动设备为载体,提高个性化推 据 荐的效率,优化用户与场景的交互方式。 个性化推荐 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 48

360公司 自有应用场景+对外数据服务 360大数据的主要应用场景主要包括安全体系构建、搜索引擎支持、大数据营销以及数据分析与统计四类,此外,对外也 为其他企业提供数据服务。对外数据服务目前主要包括标签级数据服务、客户独家数据服务以及数据整合三种方式,其 中,标签级数据服务是对360自有大数据体系进行相应的数据挖掘,并向客户提供数据挖掘结果;客户独家数据服务是通 过DMP等数据产品帮助客户进行数据分析,提供建议和指导;而数据整合则是将第三方数据提供商的数据(如WiFi数据 等)与360自有数据进行整合,从而输出数据服务。 数据驱动安全 搜索引擎 大数据营销 数据分析 ? 杀毒引擎 ? 千亿量级网页库 ? 超50万精细用户标签、 ? 手机助手、游戏等 ? 威胁感知系统 ? 快速分布式索引与分析 300余种聚类人群 产品统计分析 ? 样本库、黑白名单库 ? 实时热点推荐与跟踪 ? 营销闭环提供全案服务 ? 数据库解决方案 以标签形式合作,提供自有数据挖掘结果 标签级数据服务 360提供数据服务的客户主 要来自于互联网属性较高、 对数据敏感的行业,如电商 和金融,这些行业对大数据 客户独家数据服务 对客户数据进行分析,提供业务指导 的价值与应用关注程度较 高。 目前360大数据应用主要服 对第三方数据提供商数据与自有数据进行整合 数据整合 务于自有业务,并以增值服 务形式服务于其企业客户。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 49

360公司 大数据平台架构:360安全大数据平台 360深耕大数据领域多年,通过后台数据的采集、存储以及数据仓库的搭建、用户画像的挖掘等,构建了其独立统一的大 数据平台。该平台支持结构化数据存储、离线非结构化数据存储与任意字段检索需求,支持多种计算模型,支持海量数据 离线批量处理、实时数据分析、多轮迭代计算,并能进行复杂数据关联分析与分布式大规模机器学习。此外,数据分析人 员还可以通过大数据交互系统进行可视化分析并运行调度任务,而运维人员则可以通过大数据管理系统对大数据系统进行 管理和升级。在业务应用层面上,360的大数据产品主要可以划分为用户和企业两个方向。 360安全大数据平台架构 数据安全 流量监控 音视频分析 统计报表 ? ? ? ? 态势感知 流量还原 语音识别 数据统计 应用 ? 威胁情报 ? 流量分析 ? 语种识别 ? 报表展示 ? 可视化 TransferX 批量数据接入 非结构化存储系统 (半)结构化存储系统 大数据交互系统 存储 HDFS HBase/Cassandra 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 50

360公司 企业级大数据产品:商易+DMP+分析 应用层方面,主要可以把360的大数据产品分为用户产品与企业级产品两类。用户产品的目标群体是普通网民,主要通过 个性化推荐以提升用户体验,除用户行为数据外,还能根据用户画像进行关联推荐。企业级大数据产品主要包括360商 易、360DMP和360分析,它们分别涵括了从投放前的决策支持到精准投放,最后进行投放效果监测评估的过程,形成了 精准营销的闭环。未来360还将通过数据联动进行数据相关性挖掘,不断提升大数据服务能力以满足更深入的客户需求。 ? 360指数 用户 ? 完善的权限控制和数据加密机制 Custom ? 安全大数据平台 ? 通过灵活丰富的人群组合筛选维 度,实现人群细分管理与定制化 搜索 安全 广告 语音 图像 … 营销推广 产品 ? 360DMP ? 利用大数据挖掘算法全网挖掘相 多方数据管理 似目标受众,扩大精准营销范围 ? 完善的效果评估体系,覆盖投放 02 人群画像分析 展、点、消数据及后续转化指标 精准营销 数据,支持以人群为单位查看投 放效果数据 ? 提供私有DMP服务,支持应用客 企业 户自有数据指导广告投放 ? 全面多维的行为链数据,精细科学的 01 Business 标签体系 03 ? 决策 ? 通过关键词、网址、APP、移动设备、 效果 实时数据秒级响应 人口属性、LBS及兴趣标签等多种方式 指导 ? 依托行为链大数据,精准识别网站访 精准识别目标人群及潜在需求,指导 评估 客人群个性化特征 产品改进 ? 全面打通360点睛平台,实现转化与 ? 分析品牌的发展形态与竞争格局,制 推广数据相结合,优化广告投放策略 定合理的品牌发展策略 ? 全面打通布尔平台数据,展示移动应 ? 洞察用户行为偏好,制定营销决策方 ? 360商易 ? 360分析 用推广与转化实况 案,指导广告预算分配与媒体投放优 ? 数据可用于访客找回、个性化重定 深耕行为链大数据 投放效果监测 化,提升营销效果 向,提升广告投放效果 助力精准营销决策 推广效果分析 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 51

应用案例-全案数据服务指导广告投放 营销闭环的数据价值流转助力流量升级与转化率提升 360商易帮助客户在广告投放前对受众进行全面分析,指导目标受众定位及媒体选择;360DMP依据商易分析结果精准选择 投放人群,同步到投放端指导定向投放;360分析通过对广告投放后续效果的监控,帮助优化投放策略,提升广告效果。它 们可以组合为客户提供精准营销全过程解决方案,也能针对客户在产品、运营、推广等方面的具体痛点,独立进行服务。 客户面临着流量不足效果转化不理想的困局,一方面,客户RTB账户的CTR较低,导致其必须出高价才能竞 争到优质位置,每日获取的流量较为有限;另一方面,单次点击成本较高,使得客户转化成本居高不下,对 展示广告逐渐丧失信心。 360商易日处理数据量约为34TB,主要来 商易 自于360内部数据,其标签覆盖了25个垂 34TB 搜索数据、浏览数据、APP下载和APP访问数据、LBS位置数据 决策指导 直行业,共有55万的行业及兴趣标签。 360DMP的PC数据量级近50TB,移动数 据量级达10TB,主要来自于360内部数 DMP 据、广告主自有数据以及外部合作数据。 基础数据、行为数据 60TB 精准营销 360分析目前日处理数据量为5TB,主要 来自360内部数据和外部数据导入,通过 “数据收集 → 日志存储 → 数据计算 → 5TB 分析 访客浏览数据、推广数据、转化数据、商品数据、购物车数据、订单数 数据存储 → 数据可视化”,为客户提供 效果评估 据、用户画像(人群标签)数据 广告效果监测与评估服务。 通过商易分析客户主体受众最 依托商易分析获得的受众画像优 通过部署360分析代码检测转 常搜索的关键词,在DMP中建 化物料,在DMP中搭建特征人 化,分析观察不同推广组转化 立搜索重定向人群。 群,以实现精准定向。 效果,并及时调整优化。 经过商易、DMP及360分析的协同助力,最终帮助客户CTR提升近三倍,转换成本降低38%。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 CTR 转化成本 ?.cn 52

新浪 实现双平台多终端数据互通,构建大数据内容消费场景 作为一家领先的互联网公司,新浪基于微博、门户网站、手机 新浪网及新闻App等移动应用组成的数字媒体网络,为用户 提供全方位多视角的媒体内容及社交体验,拥有海量用户资源。根据艾瑞网民行为监测系统iUserTracker以及移动网民行 为监测系统mUserTracker的监测数据显示,2016年9月,新浪系资产PC端的月度覆盖人数为.cn 53

新浪 用户与内容双管齐下,大数据洞察系统驱动业务发展 面对4T的日数据量,新浪通过人口统计学算法优化数据结构,以UID为核心维度,与超过4000个标签进行分级匹配,形成 最底层数据系统。在底层数据系统的基础上,同源数据基于不同的维度进行挖掘形成了两套大数据系统,分别是用户洞察 系统和内容洞察系统,其中,用户洞察系统包括用户画像、粉丝经济等子系统,内容洞察系统包括语义挖掘、舆情分析等 子系统,它们共同服务于各类新浪系产品,如门户广告系统(龙渊、扶翼、轩辕)、微指数等,此外,新浪也在对外逐步 开放API共享机制,逐步实现数据的商业化变现,用户与内容双管齐下,共同驱动业务发展。 新浪大数据体系架构 底 用户洞察系统 可 ? 精准营销 层 日产生 视 数 ? 声量监测 数据量 化 据 应 ? 个性化推荐 4T 系 用 统 ? 广告效果评估 内容洞察系统 … 实时画像 个性化推荐 根据用户偏好(搜索行为、关键词提及等)进行对应内容 Real-Time 业 Custom 推荐,并在信息流中展示,如首页特别推荐、微橱窗等。 针对客户投放广告中的产品所产 务 生的PV、UV,可以实时实现用 支 户画像,挖掘个人内容消费行 持 投放策略组合 结合投放需求,面向同源样本库考察人群调性,实现精确 为、社会化口碑行为、兴趣偏好 Business 定位,制定策略组合,以支持进一步的分析与投放。 等,得到用户的个人销售线索。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 54

新浪 基础大数据系统与可视化平台协同助力数据商业化 依托于旗下产品矩阵所获取的海量信息,新浪能够从基本属性、行为、态度、社交等多个维度挖掘用户数据的数据价值, 除了内部业务数据支持外,目前主要有三种与外部合作的方式:数据变现、数据对接以及案例合作。此外,在使用用户洞 察系统与内容洞察系统进行基础数据挖掘后,新浪可以通过微舆情、微榜单等可视化分析平台输出分析结果,为需求提出 方的品牌、营销、产品等多方面提供建议。 新浪大数据洞察维度及合作方式 开放数据接口 ? 搜索 制定策略组合 ? 职业 (非全量) ? 点击 反馈结果 行为 数 ? 地域 ? 点赞 据 数据 数据变现 变 ? 年龄 ? 转发 通过内容洞察 现 系统实时了解 舆情声量 ? 性别 可视化 ? 评论 基础定向 基本 态度 输出数据层 通过用户洞察 属性 数据 系统挖掘目标 通过黑盒形式 信息挖掘 情景分析 实现数据合作 人群特征 基础数据 数 案 据 用户与内容系 ? 群组 ? 语义 例 从行为态度和 对 统协同实现数 合 品牌青睐维度 接 社交 据结果 作 圈定目标人群 ? 私信 数据 ? 表情 分析反馈 ? 关注 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 拆解目标brief ?.cn 55

新浪 广告平台-门户:龙渊、扶翼、轩辕 随着RTB、DSP、AdExchange等概念兴起,精准广告形式迅速发展壮大。龙渊、扶翼及轩辕是基于新浪大数据系统、结 合了场景式沟通和口碑体验来进行精准的大数据定向以达到程序化对广告的解决能力的精准广告平台,主要服务于门户广 告的分发需求(微博广告分发途径与此不同)。龙渊作为全媒体覆盖广告平台,能够进行跨屏、跨产品线、混平台的独立 用户控频投放;扶翼作为精准效果广告平台,能够基于目标群体为广告主提供精准定向和创意优化双维度服务;轩辕作为 创意多元化广告平台,能够使同个广告位实现目标受众千人千面的品牌广告覆盖,并根据反馈结果进行实时优化。 全媒体覆盖 精准效果 创意多元化 广告平台 广告平台 广告平台 龙 扶 轩 在定向基础 按CPM售卖。 采用CPC/CPM 渊 主要售卖长尾 翼 混合竞价机 辕 上,实现广告 资源。 制,以效果类 创意多元化。 投放为主。 15 针对品牌客户的程序化广告策略, 扶翼是以数据洞察为基础、程序 轩辕的投放逻辑是在大数据系统的 龙渊的投放系统依托于新浪双平台 化购买为主导的效果自助广告平 支持下,使同个广告位实现目标受 多终端的海量数据资源,能够基于 台,支持程序化(RTB及非RTB) 众千人千面的品牌广告覆盖,接受 “UserID + CookieID + 用户行为 购买。 品牌从不同创意角度传递的理念, 日志”等多重定位的网络虚拟指纹 扶翼能够通过大数据系统实现用 从而减少品牌方在采购过程中的决 识别技术进行用户区分,进而实现 户与内容层面的数据挖掘,为广 策成本。 跨屏、跨产品线、混平台的独立用 告主提供精准定向和创意优化双 在实际投放过程中,轩辕还会根据 户控频投放。 维度服务。 受众的数据反馈,进行实时优化。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 56

新浪 数据营销产品-微博:品效通、粉丝头条 微博的数据驱动产品主要有两种类型,分别是品效通和粉丝头条。品效通在品牌速递基础上改良,通过独特展现形式的微 博信息流广告,精准投放给相关兴趣受众,并借助好友关系产生二次传播,实现客户高转化、低成本的营销诉求。粉丝头 条则通过原生展现形态,将宣传内容友好地融入到目标受众微博信息流。目前,每月有几十万微博用户使用粉丝头条推荐 自己。 定向投给品牌人群包、垂直行业兴趣人群、高信用高等级 优化粉丝质量 用户包,分年龄层用户包等对应用户包 品效通 抓取用户信息,用户一键提交信息完成活动报名,减去繁 信息流精准 强化线索收集 琐填选环节。 广告 重视用户召回 当用户点击广告后,对未提交信息的用户进行二次触达, 使其深入了解品牌信息。 使客户的博文24小时内置顶在粉丝信息流第一位,并可以 粉丝头条 基于好友关系、用户兴趣等维度将博文推荐给更多用户, 粉丝头条 还可以将博文推荐给指定账号粉丝的相似用户。 帮助他人的博文上头条,可借助明星大V等影响力进行宣 信息流精准 帮上头条 传,也可以为喜欢的明星的微博助推。 广告 账号头条通过大数据精准算法,把客户推荐给最有可能关 账号头条 注他的用户,快速获取大量粉丝。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。

应用案例 新浪+微博车企新车上市全新营销模型 6400万 车媒 汽车KOL 汽车品牌 个人属性/兴趣 汽车兴趣用户 汽车垂直媒体账号 车媒编辑、汽车从业人员 各类品牌及车系 车主、车迷、自驾、购车 2560万购车意向用户,1029万换车意向用户 兴趣群体中以80、90后用户为主,三四线城市用户表现出较高的兴趣 品牌客户 基于关键词提及、微博搜索、话题参与、用户基本属性等维度,从海量数据中通过洞 目标种子用户 察系统圈定汽车兴趣用户,通过信息流、banner、flash、icon等多种广告形式,精 准投放给目标受众,实现触达。 通过粉丝关注关系、意见领袖发声等多种传播途径,基于关系产生二次传播;此外, 为了形成有效的品牌召回,在洞察系统的支持下抓取曾点击card或链接但未提交信 种子用户粉丝 息的用户进行媒体(@微博汽车 或客户官方微博)再次触达,基于用户互动行为形 成二次传播,强化集客效果。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 58

新浪+微博车企新车上市全新营销模型 广告+话题推广+KOL 广告 话题 KOL 强势曝光,有效导流 整合权威内容 提升话题热度 通过开机报头互动版实现广泛覆盖,话题页将品牌呈 数据指标 话题推广 现与内容聚合有机结合,高级定制话题聚合新车声 ——————— 活动页UV、PV 开机报头 量,话题广告提升话题曝光,洞察系统支持目标群体 曝光次数 话题页 精准触达,Iframe(内页框架)实现活动承载,最终 提交信息 Iframe 达到品效合一,打造事件级影响力。 博文互动 (转评赞,加关注,收藏) KOL 直播是KOL发挥影响力的重要方式之一,广告主可通 点击次数 过直播博文发布、大号扩散及流量带入、粉丝push、 (Card、短链、按钮点击) 媒体/自媒体 直播后推广等环节实现全场景营销。以KOL专业测评 互动点击率 明星/网红 (口播)、条幅、品牌露出等形式,通过向洞察系统 (互动+点击)/曝光 … 粉丝头条 下目标人群推送及关系传播,形成品牌影响力。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 59

网易 大数据的发展与应用 网易拥有网易新闻客户端、邮箱大师、网易云音乐、网易公开课等多个产品,构成庞大复杂的业务矩阵,基于业务数据分 析需求,网易开始探索大数据领域。2009年和2010年是网易大数据的萌芽期,面对海量业务数据,网易开始尝试引入 Hadoop等成熟开源技术来解决数据存储和计算的瓶颈。从2011年开始,网易进入大数据分析的整合阶段,整合、规范各 类采集机制和指标体系,将数据分析“工具化”,以适应产品、设计、运营和市场等不同场景。在经历全面整合的阶段之 后,个性化的数据需求以及灵活的多维分析推动了数据分析的“平台化”。 随着大数据发展历程的前进,一方面仍面临着集成、计算和分析等数据处理的老问题,另一方面又出现了新的挑战,如数 据量多样性、数据类型多样性、需求多样性等等,而计算机软硬件设计的基础、各类计算机应用场景、总线和组件的标准 是统一的,未来网易将致力于从底层基础开始,设计大数据平台的数据集成、计算和分析,开发出更基础的融合大数据处 理平台,从而满足未来更加个性化的数据分析需求。 过去 11至今 未来 发 传统统计方法 引入开源技术 工具化 平台化 融合大数据 展 数据量过大,存储与 > 数据格式不规范,产品接入 > 不能完全满足个性化 新老挑战交加,发展 > 与 计算遇到瓶颈 成本高,计算任务不稳定 数据需求 环境愈加复杂 处理平台 应 用 历 基于杭州研究院10年的技术积累,网易运用大数据技术支撑了网易云音乐、云课堂、易信、LOFTER、公开课等 程 产品的发展。未来网易还将把其大数据的技术服务能力开放出来,提供给更多的用户使用。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 … ?.cn 60

网易 用户画像体系 网易对互联网用户大量分散的属性、行为加以采集加工挖掘,全面整合管理内部数据,通过汇聚、清洗、深度建模,以标 签形式全方位量化用户,从而达到对用户的精准描述,构建出庞大的跨渠道跨终端精准人群画像。目前网易用户画像的主 要应用场景包括精准营销、个人征信、客户群洞察与数据报告以及用户画像云服务等。 网易大数据用户画像体系 设备信息 ? 设备类型 ? 操作系统 用户行为 ? 联网方式 用户兴趣 ? 上网时段 ? … ? 产品偏好 ? 上网场所 ? 商业兴趣 ? … ? … 人口属性 购买能力 ? 基本属性 用户画像 ? 电商购买力 ? 家庭状况 ? 网游购买力 ? … ? … 精准营销 个人征信 客户群洞察与数据报告 用户画像云服务 (广告、推送、邮件) 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 61

网易 智能化应用助力业务人员实现商业价值 在大数据变现成为大趋势的潮流下,目前主要存在两种大数据合作方式,分别是作为数据提供方直接进行数据服务和作为 技术服务提供方提供大数据处理工具,网易在此基础上,不断整合自身技术优势,实现了大数据能力的输出。 通过对大数据业务化应用的思考,结合自身多年大数据经验,网易推出通用型大数据处理与分析平台,为行业内外更多的 业务人员提供数据工具,以克服技术障碍,充分发挥其对于业务的洞察力,挖掘数据规律,实现商业价值。未来还将通过 网易云的搭载扩大其大数据服务的覆盖范围。 大数据+ 大数据助力行业应用 大数据+电商 大数据+教育 大数据+金融 大数据+媒体 ——————————— ————————-——— 风险控制 用户画像 技术服务 云服务+大数据智能化应用 征信管理 市场预测 客户生命周期管理 舆情监控 大数据计算 大数据集成 大数据时代下数据挖掘与人工智能紧密相关,各产品应用每天会产生大量数 大数据管理 据,若要实现落地,商业智能是一种重要形式。大数据的智能化应用会直接 转化成成本和效益,聚焦到某些行业中,则能够取代一部分人工工作,比如 个性化推荐取代了传统网页编辑的内容筛选工作等。 网易云陆续发布了网易云信(即时通讯云服务)、网易七鱼(全智能云客 数据源 服)等云服务,将服务通过网易云的搭载来提供能够降低其获取成本并扩大 覆盖范围。除了将把智能化数据服务与云服务相结合之外,未来网易还将以 数据服务 大数据的集成、治理、计算和可视化分析为基础,继续深耕数据科学领域, 构建核心技术优势,为产业智能提供解决方案。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 62

网易 大数据处理 × 可视化分析 将不同数据源的数据通 大数据处理与可视化分析是 对经过处理的、相对结 过整合变成易分析易使 整合企业自有数据资 实现企业级大数据解决方案 构化的数据进行分析, 用的数据,供业务使 产,实现价值输出。 的重要基础。网易开发了猛 辅助商业决策。 用。 犸大数据平台与网易有数敏 捷数据分析平台,为不同业 务需求提供通用型工具。 数据管理 数据分析 数据整合 网易大数据体系架构 网易猛犸 网易有数 大数据平台 敏捷数据分析平台 大数据处理平台:承担着数据集 可视化分析平台:帮助业务人员 成、治理、计算的工作,把来自 高效率低成本地实现敏捷流畅的 不同源、不同结构的数据同步到 数据分析,根据需求定制维度, 内核存储系统,变成结构化易分 不必编程即可通过数据得到规 析的数据,并进行建模和清洗。 律,让数据推动决策,驱动运 营。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 63

网易有数 可视化轻量建立业务主题,快速获取数据价值 网易有数是网易旗下的敏捷数据分析平台,目前已开发出网页版和移动端应用,实现了多端支持。通过私有云部署,有数 能够帮助企业降低成本,缩短数据运行耗时,并且可以连接多种数据源,兼顾灵活性与结构性地实现流畅数据探索。 从操作层面来说,网易有数在无SQL操作的情况下,能够提供高效的数据透视结构以实现多维可视化数据分析,并且能够 通过计算字段提供自定义能力,帮助业务人员快速调整业务主题 ,适应各类需求场景 。其数据可视化智能推导引擎还能 根据自定义主题智能识别意图,自动推荐最佳匹配图表。此外,网易有数支持行列级别的权限设置。 从IT驱动转变为用户驱动,相较于传统BI平台,网易有数更加贴合业务需求,业务人员可以直观获取数据观点,从而提高 业务效率;数据分析团队也可以简化数据分析流程,缩短数据处理周期,将更多精力聚焦在数据建模和数据挖掘上。 网易有数与传统BI的业务流程对比 循环往复,从头再来 传统BI 预先预定数据源 数据经过ETL 加载到数据仓库 基础BI分析应用 需求变更 可视化 迅速创建 需求变更 连接数据源 大大缩短运行耗时 网易有数 业务主题 报表分析 快速调整 1 2 3 4 5 6 Excel MySQL Oracle Hive Spark Kykin 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 64

网易 网易易盾:内容大数据 × 场景化应用 随着网易产品版图的不断扩张、用户数量爆发式增长,网易将内容大数据沉淀出了商业价值。2015年,网易域内清理有害 信息约323亿,19年的大数据内容特征库奠定了其商业化的数据基石,输出了通用型反垃圾云服务——网易易盾,切入互 联网内容安全领域。作为网易云推出的极速智能反垃圾云服务,易盾依托网易的大数据和云计算服务,提供文本过滤、图 片识别、语音分析、视频检测等服务,帮助企业和开发者实现对垃圾有害信息的实时过滤、精准拦截。 广告过滤 智能鉴黄 暴恐识别 谣言排查 —————————— ————————— ————————— ————————— 依托十余年沉淀的邮箱及 基于智能识图技术及海 结合暴恐敏感图像智能 基于海量样本库及专业 UGC反垃圾技术,共享网 量样本库、信誉库,高 分析技术,快速识别定 运营经验,快速排查谣 易亿级反垃圾特征库 效识别色情图片 位暴恐目标图像 言类有害信息 文本数据检测 图片数据检测 直播数据检测 点播数据检测 机器学习 语义分析 特征库 信誉库 内容大数据 反垃圾服务的大数据场景化应用 网易单日亿级的内容数据量支撑起了其内容大数据,通过大数据系统对数据进行筛选、挖掘、分析、验证,输出信息特征,最终形 成反垃圾数据库,结合人工智能技术经验,提供云化服务。企业用户通过接口调用,即可借助网易大数据和云计算服务,根据场景 需求挖掘对应行业垃圾信息的特点,快速、精准过滤有害信息,降低运营风险,提升用户体验。 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 65

应用案例-网易云音乐 用户洞察数据驱动产品优化 网易云音乐目前日活超千万,每天产生的行为日志接近100亿,正品高品质音乐歌曲超1000万,用户自主创建歌单数近1 亿,日均创建歌单数达42万个,累积评论2亿条,其中,上半年新增优质歌单中最高播放量达299万次。基于海量用户的搜 索、点击、评论及个性化功能使用情况等行为数据,网易云音乐运用大数据系统洞察用户习惯,归纳行为趋势,结合使用 群体与场景对产品进行不断优化,形成“用户行为 → 用户习惯 → 用户洞察 → 产品指导 → 效果评估”完整迭代过程,以 用户为核心,对产品的发展进行指导。从2013年到2016年,网易云音乐通过大量的数据分析,支撑用户从0增长至2亿。 网易云音乐-用户数据驱动下的产品优化流程 新用户搜索频率很 高,随着用户等级 提高逐渐降低 用户越来越不愿意 歌单推荐使用率翻 将热门推荐调整为 主动搜索歌曲,对 倍,私人FM播放率提 个人化的需求增强 基于用户个性的歌 推荐功能的依赖性 升了30%,最新音乐 单推荐 每日歌曲推荐的使 逐渐增强 进入率提升35% 用频率随着用户等 级提高而提高,之 后渐趋稳定 强化下载按钮,整 体点击率提升 黑胶样式吸引力 60%,拉新提升明 强化下载按钮,但 高,但老用户难以 显 提升下载率的同时兼顾 点击黑胶不再要求 照顾用户习惯, 接受使用习惯过度 用户体验,维护产品调 下载,而是以评论 适度迭代功能 强化下载按钮,同 修改,造成无意义 性,提升用户口碑 形式展开页面 时,点击黑胶唱片 点击 即可直接执行下 载,使点击率大幅 上升,但转化效果 与跑步相关歌单、 不好 电台的播放和互动 扩展了受众用户和合作 数据越来越高,且 运动市场扩张,用 用户已被充分教 在私人FM的基础上 伙伴群体,为营销和音 呈专业化趋势:根 户越来越习惯于跑 育,运动场景的音 推出跑步FM功能 乐付费创造了更大想象 据不同bpm推荐相 步时听歌 乐需求增强 空间 应音乐 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 66

网易云音乐:如何打造惊喜感 海量UGC × 协同过滤 网易云音乐在发展早期吸引到大批高素质音乐发烧友,其种子用户主要来自歌手和乐队,随后吸引到一些DJ和乐评人参与 其中,共同成为最初的KOL。平台沉淀着大量资深乐迷,口碑效应极好,歌单质量较高,并藉此形成了音乐UGC平台和社 区,通过歌单实现曲目的分享和推广。此外,网易云音乐通过大数据与人工智能,改变传统曲库型产品依靠“搜索+编辑 推荐”的模式,看重用户与用户、用户与产品的连接,为用户提供每日歌曲推荐、私人FM等基于用户个性化的推荐功 能。其推荐功能已经达到75%的使用率,用户满意度和推荐度较高。 协同 协同过滤在基于传统内容过滤进行推荐之外,还能通过对特定目标的相似性扩展,找到相似群体,综合他们在某一信 息上的评价,形成对特定目标关于此信息的偏好预测。 过滤 云音乐以海量UGC内容结合协同过滤、语义分析、操作分析等技术,从用户一系列的听歌行为, 个性化 以及App上的操作行为抽象出用户的听歌习惯、模式和操作习惯等,基于这些抽象数据,对于不同 推荐 类型的用户群体采用针对性的推荐策略。其特有的具有音乐社交属性的评论氛围,能够优化协同过 滤的稀疏性问题,目前其曲库使用率已达80%,能把一些小众歌曲推荐出来。 个性化推荐 长尾音乐 UGC 1% 80% 品鉴者 1)首先把音乐推荐给高层次用户(品鉴者),通过他们挑选出来相 对优质的音乐,定位为长尾音乐;2)然后将它们分享给UGC创建传 UGC分享 流行音乐 20% 20% 播者,他们把音乐组建成歌单,推荐给更多的用户,形成流行音乐; UGC创建传播者 3)最后通过算法及生态系统,这些音乐被传达给更多主流用户,通 过用户播放、分享、收藏、喜欢、评论等行为推动出现最热音乐。 全用户投票 最热音乐 80% 1% 主流用户 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 67

凤凰网 数据获取方式:站内统计、样本追踪与外部DMP合作 凤凰网作为互联网五大门户之一,始终致力于为广大用户提供专业、优质的内容,并对用户价值进行实时深入挖掘。为了 洞察用户的行为与偏好,深层解析内容阅读背后蕴含的人群价值观念及品牌营销机会,凤凰开发了自有大数据系统,目前 主要通过站内统计、样本追踪和外部DMP合作的方法获取数据,其中,站内统计获取的全量数据主要服务于大数据系统中 的凤凰统计平台,在其基础之上,结合样本追踪和外部DMP对接校准的方法,构建了凤眼系统。 站内统计 样本追踪 外部DMP合作 统计站内用户行为, 通过长期网上招募 积 将用户数据与外部 跟踪用户行为路径, 累了超过100万样 DMP对接,获取相 洞察用户兴趣点。 本,能够侦测人口信 应的的人口信息 。较 息,实时了解不同新 适合用户稳定的移动 闻事件背后的用户群 端,不太适合流失率 体。 较高的PC端。 A B C 数据来源 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 68

凤凰网 大数据系统结构 凤凰大数据系统由凤凰统计平台与凤眼系统共同构成。凤凰统计平台是凤凰的全量大数据平台,涵括了凤凰网底层海量数 据,通过站内统计,能将统计维度细分到每秒在某些位置的点击率、每个页面的每一帧的点击率等,并为凤眼系统提供底 层数据支持,是凤凰进行内容评估和广告投放的基础。 凤眼系统作为凤凰网解决用户信息的方案,能够通过将长期累积的人口信息用cookie或者IMEI号与用户行为进行对接,持 续追踪这些行为,洞悉不同内容背后的人群,从而逆推实现精准推荐。此外,凤眼还能通过与海量样本追踪的结合,将样 本数据通过后台算法、加权方案等,按照用户累积得到的人群结构进行匹配,实现合理映射。凤眼后续还将支持凤凰自有 DSP平台凤羽系统的DMP建设,并在有效地指导广告投放的基础上,继续探索商业化。 凤凰网大数据系统架构 凤眼系统 用户信息解决方案 累积100万样本行为追踪 凤凰统计平台 全量大数据平台 站内统计 凤凰新闻 凤凰视频 凤凰FM … 来源:艾瑞咨询根据企业访谈及公开资料整理,艾瑞咨询研究院自主研究及绘制。 ?.cn 69

凤凰网 大数据系统-凤眼 伴随着原生营销的发展,凤凰在2014年中启动凤眼系统开发,并2015年中正式完成上线。凤眼系统,即凤凰用户属性监 测系统,是国内首个由媒体自行开发的基于新闻热点/事件的实时监测数据系统,系统借助数据挖掘技术,将样本信息与 海量行为数据结合分析,可实现实时针对热点新闻事件、专题、栏目覆盖人群属性、消费特征的分析,既可支持凤凰内容 编辑团队实时了解要闻、专题受众内容偏好,也能帮助客户预估投放TA效果以及投放覆盖用户规模,同时还能针对用户内 容偏好进行深度解析,形成服务于原生投放的内容标签,找到最适合广告

可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

电脑打开魅族官网,登录账号挂失

丢失手机没有开启GPS,也没有联网可以吗?

我要回帖

更多关于 魅族GPS位置信息 的文章

 

随机推荐