有人知道美团线上零售的范围包括哪些吗？

solidworks | PHP | c4d | 细胞生物学 | HTML | 冬奥会 | 基因 | 营销策划 | 扫地机器人 | 武侠 | 大学生就业 | 电学 | 国航 | 电子技术研发 | 几何学 | 外星人 | 语言学 | 秦时明月之天行九歌 | 金融数学 | 三国人物 | 休学 | 小店区 | 杨紫 | 植保无人机 | CSS | 陶渊明 | 少数民族 | AutoCAD | 3d打印机 | 香港购物 | 日语语法 | 对联 | matlab | 按键精灵 | 粉丝（Fans） | 语言学习 | 总决赛 | 驾驶经验 | Spss数据分析 | 日本漫画 | 数学建模 | 道德 | 项目管理 | 背景音乐（bgm） | 云主机 | 3D Max | onenote | 游戏原画 | 科学 | 网站建设 | 热血传奇（游戏） | 身高 | 网站运营 | 道教 | 社会学 | 迅雷（软件） | 爬虫（计算机网络） | O2O | 运载火箭 | 遗传学 | 率土之滨 | 百度输入法 | 极限挑战(综艺节目) | 电梯 | 女性主义 | Adobe After Effects | mysql | 办公软件 | 法国 | ps3 | 化学实验 | QQ群 | 中国中央电视台 | 前女友 | 性格 | 免费软件 | 分子生物学 | 金庸小说 | 留学生 | Microsoft SQL Server | 龙珠 | 设计院 | C#编程 | 虚拟机 | 字幕 | 微信群 | 创业项目 | 祛痘 | 图形处理器（gpu） | Microsoft Visual Studio | 动物保护 | C/C++ | facebook | 秦岭 | 燕窝 | 人性 | 下载 | 驾驶技术 | 大学数学 | 封神演义 | 整容 | 西装 | 马克思主义哲学 | 计算机专业 | pdf | thinkpad | 代理 | 参考文献 | 江苏大学 | 游戏手柄 | 城市规划 | 黑洞 | 旅行 | CAD制图 | 风水 | 直播 | 快捷键 | 编辑器 | 机器学习 | 暴走大事件 | 球球大作战 | unity（游戏引擎） | 永恒之塔 | DJI大疆创新 | 传统文化 | wordpress | 仙剑奇侠传（游戏） | 国际物流 | 安徽 | 配音 | 猎头公司 | 在线教育 | 欧洲冠军联赛 | ios游戏 | 洛奇英雄传 | 暗恋 | 网盘 | 星座爱情 | 剧场版 | 面相 | 讯飞输入法 | 记忆力 | 超级战队 | stm32 | 亚马逊中国 | Apple ID | 服装设计 | 网络主播 | 品牌营销 | 情侣 | 新加坡 | 调酒 | 雷欧奥特曼 | 花样姐姐 | 物联网 | 任天堂3ds | 易经 | 户型 | 流氓软件 | 圣经 | 进化 | 垃圾分类 | 函数 | 星际穿越（电影） | 山东工艺美术学院 | 优酷视频 | github | 舰队 Collection | 流行音乐 | 进击的巨人 | playstation vita | 科学研究 | 欢乐麻将 | 史莱姆 | 海关 | Internet Explorer | 刑事案件 | 取名 | 江苏银行 | eDonkey网络 | 表情包 | mfc | 大学军训 | 诸葛亮 | Apple WATCH | 嵌入式系统 | 私募证券投资基金 | iOS应用 | 对外经贸大学 | 最强大脑（电视节目） | 青蛙 | 日本代购 | 巧克力 | 天涯明月刀ol（游戏） | 食用油 | 曹操 | SEO | 生命 | 乌贼 | 我的英雄学院 |

你的位置：网站首页 >> 频道首页 >>电子商务 >>有人知道美团线上零售的范围包括哪些吗？

有人知道美团线上零售的范围包括哪些吗？

来源：蜘蛛抓取(WebSpider) 时间：2022-06-04 07:36 标签：美团经营商品类型

试水不到3个月美团剔除香烟零售业务电子烟也不卖了！

　　天眼查数据显示，10月10日，美团运营主体北京三快科技有限公司发生经营范围变更，经营范围中不再包含零售烟草(含电子烟)。这离美团开展零售烟草业务仅仅不到3个月。

　　今年7月，美团经营范围刚新增新增零售烟草(含电子烟)。彼时美团曾回应媒体称，“我们会根据国家法律法规更新和新出台的政策规定，适时更新企业经营范围表述，是正常的企业登记行为。”

　　前瞻产业研究院数据显示，全球电子烟市场销售额高速增长在2016年达到顶峰，同比增长316.7%，而中国市场近年增速则保持在24%左右。此外，中国吸烟人数约全球的三分之一，大约3.16亿人，但电子烟在中国烟民中的普及率远低于欧美国家，只有0.6%。而中国是电子烟的最大生产地，中国出口的电子烟占世界总产量的90%以上。

　　“中国电子烟的市场规模还远远不及欧美市场的成熟度，有很大的发展空间。此外，中国烟民基础已经很大，不需要吸收非烟民进入行业。”Juul前首席科学家、尼古丁盐发明人邢晨悦曾告诉南都记者。

　　此前，南都记者对2019年上半年获得投资的37家电子烟企业进行梳理发现，近年来进入电子烟行业的“玩家”背景，既有电子烟行业内人士、跨界竞争者，还有传统烟草从业者。以四川中烟旗下品牌“宽窄功夫”为代表的国资企业并不多见，大部分是多来自社会资本的创业公司。

　　源码资本、IDG、同创伟业、真格基金等创投机构均已进军电子烟领域。彭锦洲创立的小野电子烟则在今年7月的种子轮中获得了来自红塔集团旗下红塔创投的投资。爱桌依IJOY、前优步的中国负责人汪莹创办的RELX悦刻、MOTI魔笛等品牌已拿到千万级融资。

　　在资本市场关注的同时，国内对电子烟的标准还尚未出台。南都记者查询全国标准信息公共服务平台发现，国家标准计划《电子烟》由全国烟草标准化技术委员会归口上报及执行，主管部门为国家烟草专卖局。项目基础信息显示，国标下达日期为2017年10月11日，项目周期为24个月。也就是说，如果严格按照公示的项目周期，10月11日前国标将会发布。

　　但国标项目进度经过了网上公示、起草、征求意见、审查，目前仍在批准阶段。

　　围绕电子烟仍存在诸多争议。美国疾病控制与预防中心(CDC)表示，截至10月8日，全美确诊的与电子烟相关的致命肺病病例达到1299例，遍布美国49个州、华盛顿特区和美属维京群岛，过去一周新增219例。死亡病例数量从上周的18例升至26例。

商品知识图谱作为新零售行业数字化的基石，提供了围绕商品的精准结构化理解，对业务应用起到了至关重要的作用。相比于美团大脑中原有的围绕商户的图谱而言，商品图谱需应对更加分散、复杂、海量的数据和业务场景，且面临着信息来源质量低、数据维度多、依赖常识以及专业知识等挑战。本文将围绕零售商品知识图谱，介绍美团在商品层级建设、属性体系建设、图谱建设人效提升等方向的探索，希望对大家有所帮助或启发。

人机结合-专业图谱建设

近年来，人工智能正在快速地改变人们的生活，背后其实有两大技术驱动力：深度学习和知识图谱。我们将深度学习归纳为隐性的模型，它通常是面向某一个具体任务，比如说下围棋、识别猫、人脸识别、语音识别等等。通常而言，在很多任务上它能够取得很优秀的结果，同时它也有一些局限性，比如说它需要海量的训练数据，以及强大的计算能力，难以进行跨任务的迁移，并且不具有较好的可解释性。在另一方面，知识图谱作为显式模型，同样也是人工智能的一大技术驱动力，它能够广泛地适用于不同的任务。相比深度学习，知识图谱中的知识可以沉淀，具有较强的可解释性，与人类的思考更加贴近，为隐式的深度模型补充了人类的知识积累，和深度学习互为补充。因此，全球很多大型的互联网公司都在知识图谱领域积极进行布局。

图1 人工智能两大驱动力
美团连接了数亿用户和数千万商户，背后也蕴含着丰富的日常生活相关知识。2018年，美团知识图谱团队开始构建美团大脑，着力于利用知识图谱技术赋能业务，进一步改善用户体验。具体来说，美团大脑会对美团业务中涉及到的千万级别商家、亿级别的菜品/商品、数十亿的用户评论，以及背后百万级别的场景进行深入的理解和结构化的知识建模，构建人、店、商品、场景之间的知识关联，从而形成生活服务领域大规模的知识图谱。现阶段，美团大脑已覆盖了数十亿实体，数百亿三元组，在餐饮、外卖、酒店、金融等场景中验证了知识图谱的有效性。

美团逐步突破原有边界，在生活服务领域探索新的业务，不仅局限于通过外卖、餐饮帮大家“吃得更好”，近年来也逐步拓展到零售、出行等其他领域，帮大家“生活更好”。在零售领域中，美团先后落地了美团闪购、美团买菜、美团优选、团好货等一系列相应的业务，逐步实现“万物到家”的愿景。为了更好地支持美团的新零售业务，我们需要对背后的零售商品建立知识图谱，积累结构化数据，深入对零售领域内商品、用户、属性、场景等的理解，以便能更好地为用户提供零售商品领域内的服务。相比于围绕商户的餐饮、外卖、酒店的等领域，零售商品领域对于知识图谱的建设和应用提出了更大的挑战。一方面，商品数量更加庞大，覆盖的领域范围也更加宽广。另一方面，商品本身所具有的显示信息往往比较稀疏，很大程度上需要结合生活中的常识知识来进行推理，方可将隐藏在背后的数十维的属性进行补齐，完成对商品完整的理解。在下图的例子中，“乐事黄瓜味”这样简单的商品描述其实就对应着丰富的隐含信息，只有对这些知识进行了结构化提取和相应的知识推理后，才能够更好的支持下游搜索、推荐等模块的优化。

图3 商品结构化信息的应用

我们针对美团零售业务的特点，制定了多层级、多维度、跨业务的零售商品知识图谱体系。

图4 商品知识图谱体系
多层级在不同业务的不同应用场景下，对于“商品”的定义会有所差别，需要对各个不同颗粒度的商品进行理解。因此，在我们的零售商品知识图谱中，建立了五层的层级体系，具体包括：

L1-商品SKU/SPU：对应业务中所售卖的商品颗粒度，是用户交易的对象，往往为商户下挂的商品，例如“望京家乐福所售卖的蒙牛低脂高钙牛奶250ml盒装”。这一层级也是作为商品图谱的最底层的基石，将业务商品库和图谱知识进行打通关联。
L2-标准商品：描述商品本身客观事实的颗粒度，例如“蒙牛低脂高钙牛奶250ml盒装”，无论通过什么渠道在什么商户购买，商品本身并没有任何区别。商品条形码则是在标准商品这层的客观依据。在这一层级上，我们可以建模围绕标准商品的客观知识，例如同一个标准商品都会具有同样的品牌、口味、包装等属性。
L3-抽象商品：进一步我们将标准商品向上抽象的商品系列，例如“蒙牛低脂高钙牛奶”。在这一层级中，我们不再关注商品具体的包装、规格等，将同系列的商品聚合为抽象商品，承载了用户对于商品的主观认知，包括用户对商品系列的别名俗称、品牌认知、主观评价等。
L4-主体品类：描述商品主体的本质品类，列如“鸡蛋”、“奶油草莓”、“台式烤肠”等。这一层作为商品图谱的后台类目体系，以客观的方式对商品领域的品类进行建模，承载了用户对于商品的需求，例如各品牌各产地的鸡蛋都能够满足用户对于鸡蛋这个品类的需求。
L5-业务类目：相比于主体品类的后台类目体系，业务类目作为前台类目体系会依据业务当前的发展阶段进行人工定义和调整，各个业务会根据当前业务阶段的特点和需求建立对应的前台类目体系。

商品属性视角：围绕商品本身，我们需要有海量的属性维度来对商品进行描述。商品属性维度主要分为两类：一类是通用的属性维度，包括品牌、规格、包装、产地等；另一类是品类特有的属性维度，例如对于牛奶品类我们会关注脂肪含量（全脂/低脂/脱脂牛奶）、存储方式（常温奶、冷藏奶）等。商品属性主要是刻画了商品的客观知识，往往会建立在标准商品这一层级上。
用户认知视角：除了客观的商品属性维度以外，用户往往对于商品会有一系列的主观认知，例如商品的别名俗称（“小黑瓶”、“快乐水”）、对于商品的评价（“香甜可口”、“入口即化”、“性价比高”）、商品的清单/榜单（“进口食品榜单”、“夏季消暑常备”）等维度。这些主观认知往往会建立在抽象商品这一层级上。
品类/类目视角：从品类/类目的视角来看，不同品类/类目也会有各自不同的关注点。在这一层级上，我们会建模各个品类/类目下有哪些典型的品牌、用户关注哪些典型属性、不同品类的复购周期是多长时间等。

跨业务美团大脑商品知识图谱的目标是希望能够对客观世界中的商品知识进行建模，而非局限于单个业务之中。在商品图谱的五层体系中，标准商品、抽象商品、品类体系都是与业务解耦的，围绕着客观商品所建立的，包括围绕这些层级建立的各维度数据也均是刻画了商品领域的客观知识。在应用于各个业务当中时，我们将客观的图谱知识向上关联至业务前台类目，向下关联至业务商品SPU/SKU，则可以完成各个业务数据的接入，实现各个业务数据和客观知识之间的联通，提供更加全面的跨业务的全景数据视角。利用这样的数据，在用户方面我们可以更加全面的建模、分析用户对于业务、品类的偏好，对于价格、品质等的敏感程度，在商品方面我们可以更准确的建模各品类的复购周期、地域/季节/节日偏好等。

商品知识图谱的构建的挑战主要来源于以下三个方面：

信息来源质量低：商品本身所具有的信息比较匮乏，往往以标题和图片为主。尤其在美团闪购这样LBS的电商场景下，商户需要上传大量的商品数据，对于商品信息的录入存在很多信息不完整的情况。在标题和图片之外，商品详情虽然也蕴含着大量的知识信息，但是其质量往往参差不齐，并且结构各异，从中进行知识挖掘难度极高。
数据维度多：在商品领域有众多的数据维度需要进行建设。以商品属性部分为例，我们不仅需要建设通用属性，诸如品牌、规格、包装、口味等维度，同时还要覆盖各个品类/类目下特定关注的属性维度，诸如脂肪含量、是否含糖、电池容量等，整体会涉及到上百维的属性维度。因此，数据建设的效率问题也是一大挑战。
依赖常识/专业知识：人们在日常生活中因为有很丰富的常识知识积累，可以通过很简短的描述获取其背后隐藏的商品信息，例如在看到“乐事黄瓜”这样一个商品的时候知道其实是乐事黄瓜味的薯片、看到“唐僧肉”的时候知道其实这不是一种肉类而是一种零食。因此，我们也需要探索结合常识知识的语义理解方法。同时，在医药、个护等领域中，图谱的建设需要依赖较强的专业知识，例如疾病和药品之间的关系，并且此类关系对于准确度的要求极高，需要做到所有知识都准确无误，因此也需要较好的专家和算法相结合的方式来进行高效的图谱构建。

在了解了图谱建设的目标和挑战后，接下来我们将介绍商品图谱数据建设的具体方案。

品类体系建设本质品类描述了商品本质所属的最细类别，它聚合了一类商品，承载了用户最终的消费需求，如“高钙牛奶”、“牛肉干”等。本质品类与类目也是有一定的区别，类目是若干品类的集合，它是抽象后的品类概念，不能够明确到具体的某类商品品类上，如“乳制品”、“水果”等。品类打标：对商品图谱的构建来说，关键的一步便是建立起商品和品类之间的关联，即对商品打上品类标签。通过商品和品类之间的关联，我们可以建立起商品库中的商品与用户需求之间的关联，进而将具体的商品展示到用户面前。下面简单介绍下品类打标方法：

品类词表构建：品类打标首先需要构建一个初步的商品品类词表。首先，我们通过对美团的各个电商业务的商品库、搜索日志、商户标签等数据源进行分词、NER（参见文章《》）、新词发现等操作，获得初步的商品候选词。然后，通过标注少量的样本进行二分类模型的训练（判断一个词是否是品类）。此外，我们通过结合主动学习的方法，从预测的结果中挑选出难以区分的样本，进行再次标注，继续迭代模型，直到模型收敛。
品类打标：首先，我们通过对商品标题进行命名实体识别，并结合上一步中的品类词表来获取商品中的候选品类，如识别“蒙牛脱脂牛奶 500ml”中的“脱脂牛奶”、“牛奶”等。然后，在获得了商品以及对应的品类之后，我们利用监督数据训练品类打标的二分类模型，输入商品的SPU_ID和候选品类TAG构成的Pair，即<SPU_ID，TAG>，对它进行是否匹配的预测。具体的，我们一方面利用结合业务中丰富的半结构化语料构建围绕标签词的统计特征，另一方面利用命名实体识别、基于BERT的语义匹配等模型产出高阶相关性特征，在此基础上，我们将上述特征输入到终判模型中进行模型训练。
品类标签后处理：在这一步中，我们对模型打上的品类进行后处理的一些策略，如基于图片相关性、结合商品标题命名实体识别结果等的品类清洗策略。

通过上述的三个步骤，我们便可以建立起商品与品类之间的联系。品类体系：品类体系由品类和品类间关系构成。常见的品类关系包括同义词和上下位等。在构建品类体系的过程中，常用的以下几种方法来进行关系的补全。我们主要使用下面的一些方法：

基于规则的品类关系挖掘。在百科等通用语料数据中，有些品类具有固定模式的描述，如“玉米又名苞谷、苞米棒子、玉蜀黍、珍珠米等”、“榴莲是著名热带水果之一”，因此，可以使用规则从中提取同义词和上下位。
基于分类的品类关系挖掘。类似于上文中提到的品类打标方法，我们将同义词和上下位构建为<TAG, TAG>的样本，通过在商品库、搜索日志、百科数据、UGC中挖掘的统计特征以及基于Sentence-BERT得到的语义特征，使用二分类模型进行品类关系是否成立的判断。对于训练得到的分类模型，我们同样通过主动学习的方式，选出结果中的难分样本，进行二次标注，进而不断迭代数据，提高模型性能。
基于图的品类关系推理。在获得了初步的同义词、上下位关系之后，我们使用已有的这些关系构建网络，使用GAE、VGAE等方法对网络进行链路预测，从而进行图谱边关系的补全。

商品图谱品类体系的构建标准/抽象商品标准商品是描述商品本身客观事实的颗粒度，和销售渠道和商户无关，而商品条形码是标准商品这层的客观依据。标品关联即将同属于某个商品条形码的业务SKU/SPU，都正确关联到该商品条形码上，从而在标准商品层级上建模相应的客观知识，例如标准商品对应的品牌、口味和包装等属性。下面通过一个案例来说明标品关联的具体任务和方案。案例：下图是一个公牛三米插线板的标准商品。商家录入信息的时候，会把商品直接关联到商品条码上。通过商户录入数据完成了一部分的标品关联，但这部分比例比较少，且存在大量的链接缺失，链接错误的问题。另外，不同的商家对于同样的标品，商品的标题的描述是千奇百怪的。我们的目标是补充缺失的链接，将商品关联到正确的标品上。

图6 商品图谱标品关联任务
针对标品关联任务，我们构建了商品领域的同义词判别模型：通过远监督的方式利用商户已经提供的少量有关联的数据，作为已有的知识图谱构造远监督的训练样本。在模型中，正例是置信度比较高的标品码；负例是原始数据中商品名或者图像类似但不属于同一标品的SPU。构造准确率比较高的训练样本之后，通过BERT模型进行同义词模型训练。最后，通过模型自主去噪的方式，使得最终的准确率能够达到99%以上。总体能做到品牌，规格，包装等维度敏感。

图7 商品图谱标品关联方法
抽象商品是用户认知的层面，作为用户所评论的对象，这一层对用户偏好建模更加有效。同时，在决策信息的展示上，抽象商品粒度也更符合用户认知。例如下图所示冰淇淋的排行榜中，罗列了用户认知中抽象商品对应的SKU，然后对应展示不同抽象商品的特点、推荐理由等。抽象商品层整体的构建方式，和标准商品层比较类似，采用标品关联的模型流程，并在数据构造部分进行规则上的调整。

图8 商品图谱抽象商品聚合

对一个商品的全面理解，需要涵盖各个属性维度。例如“乐事黄瓜味薯片”，需要挖掘它对应的品牌、品类、口味、包装规格、标签、产地以及用户评论特色等属性，才能在商品搜索、推荐等场景中精准触达用户。商品属性挖掘的源数据主要包含商品标题、商品图片和半结构化数据三个维度。

商品图谱属性建设商品标题包含了对于商品最重要的信息维度，同时，商品标题解析模型可以应用在查询理解中，对用户快速深入理解拆分，为下游的召回排序也能提供高阶特征。因此，这里我们着重介绍一下利用商品标题进行属性抽取的方法。商品标题解析整体可以建模成文本序列标注的任务。例如，对于商品标题“乐事黄瓜薯片”，目标是理解标题文本序列中各个成分，如乐事对应品牌，黄瓜对应口味，薯片是品类，因此我们使用命名实体识别（NER）模型进行商品标题解析。然而商品标题解析存在着三大挑战：（1）上下文信息少；（2）依赖常识知识；（3）标注数据通常有较多的噪音。为了解决前两个挑战，我们首先尝试在模型中引入了图谱信息，主要包含以下三个维度：

节点信息：将图谱实体作为词典，以Soft-Lexicon方式接入，以此来缓解NER的边界切分错误问题。
关联信息：商品标题解析依赖常识知识，例如在缺乏常识的情况下，仅从标题“乐事黄瓜薯片”中，我们无法确认“黄瓜”是商品品类还是口味属性。因此，我们引入知识图谱的关联数据缓解了常识知识缺失的问题：在知识图谱中，乐事和薯片之间存在着“品牌-售卖-品类”的关联关系，但是乐事跟黄瓜之间则没有直接的关系，因此可以利用图结构来缓解NER模型常识知识缺少的问题。具体来说，我们利用Graph Embedding的技术对图谱进行的嵌入表征，利用图谱的图结构信息对图谱中的单字，词进行表示，然后将包含了图谱结构信息的嵌入表示和文本语义的表征进行拼接融合，再接入到NER模型之中，使得模型能够既考虑到语义，也考虑到常识知识的信息。
节点类型信息：同一个词可以代表不同的属性，比如“黄瓜”既可以作为品类又可以作为属性。因此，对图谱进行Graph Embedding建模的时候，我们根据不同的类型对实体节点进行拆分。在将图谱节点表征接入NER模型中时，再利用注意力机制根据上下文来选择更符合语义的实体类型对应的表征，缓解不同类型下词语含义不同的问题，实现不同类型实体的融合。

图10 商品图谱标题解析
接下来我们探讨如何缓解标注噪音的问题。在标注过程中，少标漏标或错标的问题无法避免，尤其像在商品标题NER这种标注比较复杂的问题上，尤为显著。对于标注数据中的噪音问题，采用以下方式对噪音标注优化：不再采取原先非0即1的Hard的训练方式，而是采用基于置信度数据的Soft训练方式，然后再通过Bootstrapping的方式迭代交叉验证，然后根据当前的训练集的置信度进行调整。我们通过实验验证，使用Soft训练+Bootstrapping多轮迭代的方式，在噪声比例比较大的数据集上，模型效果得到了明显提升。具体的方法可参见我们在NLPCC 2020比赛中的论文《》。

图11 基于噪音标注的NER优化

知识图谱的构建往往是针对于各个领域维度的数据单独制定的挖掘方式。这种挖掘方式重人工，比较低效，针对每个不同的领域、每个不同的数据维度，我们都需要定制化的去建设任务相关的特征及标注数据。在商品场景下，挖掘的维度众多，因此效率方面的提高也是至关重要的。我们首先将知识挖掘任务建模为三类分类任务，包括节点建模、关系建模以及节点关联。在整个模型的训练过程中，最需要进行效率优化的其实就是上述提到的两个步骤：（1）针对任务的特征提取；（2）针对任务的数据标注。

针对特征提取部分，我们摒弃了针对不同挖掘任务做定制化特征挖掘的方式，而是尝试将特征和任务解耦，构建跨任务通用的图谱挖掘特征体系，利用海量的特征库来对目标的节点/关系/关联进行表征，并利用监督训练数据来进行特征的组合和选择。具体的，我们构建的图谱特征体系主要由四个类型的特征组构成：

规则模板型特征主要是利用人工先验知识，融合规则模型能力。
统计分布型特征，可以充分利用各类语料，基于不同语料不同层级维度进行统计。
句法分析型特征则是利用NLP领域的模型能力，引入分词、词性、句法等维度特征。
嵌入表示型特征，则是利用高阶模型能力，引入BERT等语义理解模型的能力。

图13 知识挖掘特征体系
针对数据标注部分，我们主要从三个角度来提升效率。

通过半监督学习，充分的利用未标注的数据进行预训练。
通过主动学习技术，选择对于模型来说能够提供最多信息增益的样本进行标注。
利用远程监督方法，通过已有的知识构造远监督样本进行模型训练，尽可能的发挥出已有知识的价值。

人机结合-专业图谱建设

当前医药健康行业结构性正在发生变化，消费者更加倾向于使用在线医疗解决方案和药品配送服务，因此医药业务也逐渐成为了美团的重要业务之一。相比于普通商品知识图谱的建设，药品领域知识具有以下两个特点：（1）具有极强的专业性，需要有相关背景知识才能判断相应的属性维度，例如药品的适用症状等。（2）准确度要求极高，对于强专业性知识不允许出错，否则更容易导致严重后果。因此我们采用将智能模型和专家知识结合的方式来构建药品知识图谱。药品图谱中的知识可以分为弱专业知识和强专业知识两类，弱专业知识即一般人能够较容易获取和理解的知识，例如药品的使用方法、适用人群等；而强专业知识则是需要具有专业背景的人才能够判断的知识，例如药品的主治疾病、适应症状等。由于这两类数据对专家的依赖程度不同，因此我们分别采取不同的挖掘链路：

弱专业知识：对于药品图谱的弱专业知识挖掘，我们从说明书、百科知识等数据源中提取出相应的信息，并结合通过专家知识沉淀出来的规则策略，借助通用语义模型从中提取相应的知识，并通过专家的批量抽检，完成数据的建设。
强专业知识：对于药品图谱的强专业知识挖掘，为了确保相关知识百分百准确，我们通过模型提取出药品相关属性维度的候选后，将这些候选知识给到专家进行全量质检。在这里，我们主要是通过算法的能力，尽可能减少专业药师在基础数据层面上的精力花费，提高专家从半结构化语料中提取专业知识的效率。

在药品这类专业性强的领域，专业知识的表述和用户习惯往往存在差异。因此我们除了挖掘强弱专业知识外，还需要填补专业知识和用户之间的差异，才能将药品图谱更好的与下游应用结合。为此，我们从用户行为日志以及领域日常对话等数据源中，挖掘了疾病、症状和功效的别名数据，以及药品通用名的俗称数据，来打通用户习惯和专业表述之间的通路。

图14 人机结合的专业知识挖掘

自从谷歌将知识图谱应用于搜索引擎，并显著提升了搜索质量与用户体验，知识图谱在各垂直领域场景都扮演起了重要的角色。在美团商品领域中，我们也将商品图谱有效的应用在围绕商品业务的搜索、推荐、商家端、用户端等多个下游场景当中，接下来我们举几个典型的案例进行介绍。

商品图谱的数据，对于商品的理解很有帮助。例如，在商品搜索中，如用户在搜索头疼腰疼时，通过结构化的知识图谱，才能知道什么药品是有止疼功效的；用户在搜索可爱多草莓、黄瓜薯片时，需要依赖图谱的常识知识来理解用户真正需求是冰淇淋和薯片，而不是草莓和黄瓜。

图15 基于图谱的结构化召回

图谱的类目信息、品类信息、属性信息，一方面可以作为比较强有力的相关性的判断方法和干预手段，另一方面可以提供不同粗细粒度的商品聚合能力，作为泛化性特征提供到排序模型，能有效地提升排序模型的泛化能力，对于用户行为尤为稀疏的商品领域来说则具有着更高的价值。具体的特征使用方式则包括：

通过各颗粒度进行商品聚合，以ID化特征接入排序模型。
在各颗粒度聚合后进行统计特征的建设。
通过图嵌入表示的方式，将商品的高维向量表示和排序模型结合。

图16 基于图谱的排序优化

现有的研究工作已经在多个领域中证明了，将知识图谱的数据进行嵌入表示，以高维向量表示的方式和排序模型结合，可以有效地通过引入外部知识达到缓解排序/推荐场景中数据稀疏以及冷启动问题的效果。然而，传统的图谱嵌入的工作往往忽视了知识图谱中的多模态信息，例如商品领域中我们有商品的图片、商品的标题、商家的介绍等非简单的图谱节点型的知识，这些信息的引入也可以进一步提升图谱嵌入对推荐/排序的信息增益。

图17 基于多模态图谱的推荐-背景现有的图谱嵌入方法在应用到多模态图谱表征的时候会存在一些问题，因为在多模态场景下，图谱中边的含义不再是单纯的语义推理关系，而是存在多模态的信息补充的关系，因此我们也针对多模态图谱的特点，提出了MKG Entity Encoder和MKG Attention Layer来更好的建模多模态知识图谱，并将其表征有效的接入至推荐/排序模型中，具体方法可以参考我们在CIKM 2020发表了的论文《》。

图18 基于图谱的排序优化-模型

商品图谱在用户端提供显式化的可解释性信息，辅助用户进行决策。具体的呈现形式包括筛选项、特色标签、榜单、推荐理由等。筛选项的维度受当前查询词对应品类下用户关注的属性类别决定。例如，当用户搜索查询词为薯片时，用户通常关注的是它的口味、包装、净含量等，我们将会根据供给数据在这些维度下的枚举值展示筛选项。商品的特色标签则来源于标题、商品详情页信息与评论数据的提取，以简洁明了的结构化数据展示商品特色。商品的推荐理由通过评论抽取与文本生成两种渠道获得，与查询词联动，以用户视角给出商品值得买的原因，而榜单数据则更为客观，以销量等真实数据，反应商品品质。在商家端，即商家发布侧，商品图谱则提供了基于商品标题的实时预测能力，帮助商家进行类目的挂载、属性信息的完善。例如，商家填写标题“德国进口德亚脱脂纯牛奶12盒”后，商品图谱提供的在线类目预测服务可将其挂载到“食品饮料-乳制品-纯牛奶”类目，并通过实体识别服务，得到商品的“产地-德国”，“是否进口-进口”，“品牌-德亚”，“脂肪含量-脱脂”，“规格-12盒”的属性信息，预测完成后，由商家确认发布，降低商家对商品信息的维护成本，并提升发布商品的信息质量。

雪智，凤娇，姿雯，匡俊，林森，武威等，均来自美团平台搜索与NLP部NLP中心。

目前，诸多企业都在变革新零售、创新新零售。

新零售的变革一定是一项系统工程，是一个系统化、全面的变革。

绝不仅是简单的超市+餐饮，就变成了新零售，在门店增加一个进口食品区，把门店重新装修的漂亮一点，就是新零售了。也不仅仅是把线上线下融合就叫新零售，也不仅仅是用了大数据、智能化、无人化就叫新零售。

17年走了几十个城市，看了几千家店。很多都在装修改造，也有不少的企业在做超市+餐饮。包括线上企业也在尝试开店，美团的掌鱼生鲜，最近京东又开了生鲜店。目前感觉很多的尝试，缺乏系统的思考。

包括17年，在资本推动下，一些以无人技术推动的新零售创新形式也在快速推进。感觉有些做的逻辑是存在重大缺陷的。

总体看，单纯从一个维度，譬如超市+餐饮，数据化、智能化等方面会起到一定的改进效果。但是不会从根本上改变问题。也不能认为你搞了无人店、无人架就叫新零售了，这只能是一种新零售手段。新零售如果不能系统化的规划，这种变革、调整的效果难以持久。

新零售的变革一定要系统化、全面的变革。

零售的变革一定是要首先从变革逻辑上去思考。不能局限于以往的零售逻辑。逻辑不变很受局限，逻辑改变，海阔天空。不从逻辑上去思考变革，还是按照原来的零售思维+餐饮，大数据、智能化、无人化，方向一定是存在问题的。

新零售的变革，需要从以下四个逻辑方面做系统的规划。

新零售----明确为谁开店是起点：

当前的零售市场已经是一个分层化、小众化、个性化的市场。这种市场结构已经完全区别于以往大众化的市场结构。

在大众化的市场结构，因为市场的需求是相对无差别的，企业可以站在自己的角度，以一种统一的模式，譬如连锁零售的标准化模式，来应对大众化的市场需求。

但是在目前分层化、小众化、个性化的市场环境下，这种定位显然已经不能完全适应当前的市场环境。

目前的开店，包括无人店、包括门店的重新调整，首先需要明确你的店是为谁开，你的目标顾客是谁？他在那里？怎么能够找到他？如何能够连接他？他有那些需求特征？需要用哪些方式满足他的需求？你的优势是什么？你的优势是能满足他的那些需求。

盒马的成功是首先定位好了他为谁做店。盒马模式精准聚焦80、90后，切入的是当前消费活力最强，消费潜力最大，消费最时尚，需求最旺盛的一群人，年轻女性为主体，小白领、白骨精。盒马结合自己的企业优势，聚焦“吃”的场景，聚焦早餐、午餐、下午茶场景需求。

他的一切都是围绕这一定位打造他的新零售模式。门店定位高大上，商品组织大海鲜、品质化、小包装一顿吃完、更多的成品和半成品，营销手段社群化、DIY，满足到店、到家不同需求。更关键的是重构了新的零售价值观：新鲜每一刻、所想即所得、让吃变成快乐、让做饭变成娱乐。

所以，只有明确你的目标消费者是谁，你的店才能吸引到目标顾客，你才能找到流量。

看到的乐语新零售变革也是在明确目标消费者，重构新的零售模式。乐语已经不仅仅是卖手机了，乐语的店逐步变成年轻顾客的“新奇乐”店。乐语在围绕年轻顾客，打造一种时尚生活解决方案。

以往的零售市场细分理念是划商圈，开店三公里以内如何服务好商圈的所有顾客，老中青、高中低。现在不行了，需要在商圈中再圈层，圈出有共同特征的分层顾客。把你的店，用更强的特征去刺激到你的分层顾客。

绝对不能再期望按照以往商圈划法，把男女、老中青、高中低通吃了。

所以目前不论是现有的门店调整、还是线上企业到线下开店、不管是无人还是有人，不管是大店还是小店，任何的店都需要首先明确你是为谁开店。明确为谁开店，才能把店做好。这是基础。

一些无人店、无人架对标目前的日系便利店。但是，包括日系便利店在内的所有便利店来客数已经在下滑，便利店肯定要变革。

大卖场小型化可能是一个调整方向，但是变小后需要特别明确你的店是开给谁。京东、美团开店，首先要明确你的店是开给谁，不是挂上京东、美团二字消费者就会接受。

新零售----用什么商品，服务、体验满足目标消费者需求是焦点：

目前讲到新零售创新变革，很多人还在纠结，什么新零售还是要以商品为中心，什么新零售零售的本质没有变等等。

不能否认未来的里还是卖商品的，但是商品的地位在发生改变，以前的零售是先有商品，通过商品吸引顾客，商品第一。现在的零售、未来的零售一定要先找到顾客，链接顾客，必须要找到一种商品之外的、能够吸引顾客的手段。因为单靠商品已经难以完全吸引到顾客了，必须还要有商品力之外的另外一种力量的链接。

沃尔玛的商品开发力不强？还是屈臣氏的商品开发力不强？为什么偌大的沃尔玛门店顾客寥寥？店太多了，分流了。用罗胖的观点是新物种太多了。

特别是在目前的互联网环境下，影响消费购买的因素已经发生改变，社群影响成为消费购买的主要因素。很多消费者的购买选择，来自于朋友的推荐、朋友嗮的朋友圈。

张瑞敏指出：整个家电还有没出路，肯定是没有出路了！只能从卖产品转向社群经济，看谁拥有的社群规模有多少，顾客价值有多高。

所以目前的零售、未来的零售一定要首先找到一种链接顾客的方法，特别是在互联网环境下，需要找到用互联网手段链接顾客、影响顾客的方法。APP、公众号、社群、朋友圈等等，首先要找到顾客、建立链接。

当然，对零售来讲，商品还是非常非常重要的。但是，商品的理念、模式需要做转换调整。

首先当前环境下顾客对商品需求的概念不仅仅是一个物的概念。商品+服务+体验是构成了一个完整的、符合当前消费需求变化理念的完整商品的概念。

目前的中国社会已经进入一轮新的消费升级。目前消费需求不仅是对商品的需求，消费者更愿意为服务埋单、为体验埋单，特别是为健康埋单，为个性化埋单。

满足消费需求不是商品越来越多，而是要精准切入他的需求，满足他的生活。盒马的新零售理念一些方面值得学习。一家1万平的门店6000SKU，可以做出线上7000单，线下5000单。但是他更多从打造消费者的生活服务角度打造的商品组合。他不仅仅是商品组合，她在打造商品+服务的生活方式组合。所以更好的满足了消费者的需求。

超市+餐饮可以从服务的角度做更多的理解。消费者在逐步希望以往在家庭完成的劳动有人替他完成。超市+餐饮，实际是一种商品+服务的组合。

其次目前的门店需要充分考虑顾客体验。或者讲体验决定顾客购买。零售店需要改变，门店就是商品、到处是商品、满满的商品的以往零售理念，要给到顾客充足的空间。顾客到店有一种主人、主角、被尊重的感觉。不能在门店还是商品是主角。最近看到的耐克、阿迪的门店撤掉了很多货架，给与顾客很充分的空间，调整后感觉店很舒服。

第三门店的商品、服务、体验一定要精准聚焦目标顾客。你的目标顾客是谁，你的商品+服务+体验组合就要聚焦谁。不能作乱了，不能做反了。

第四门店一定要尽快改造成场景化的门店。按照消费者的需求场景、生活场景打造场景化门店。彻底抛弃按品类分区组合的门店。

或者是早餐、午餐、下午茶，或者是客厅、厨房、卧室，或者是办公室、健身房、高铁、旅行、户外，或者社交场景，譬如江小白的个人饮、两人对饮、四人饮、十人饮等，只有这样才能满足当前的消费需求。

第五是商品必须要具备高度的健康理念。当前消费者最关心的就是健康。目前富含化学食品添加剂的食品已经不能满足消费者的观念变化。盒马的日日鲜、牛奶只卖一天，钱大妈的不卖隔夜肉、菜是必须要具备的经营理念。

所以目前开发自有品牌不是最重要的，转换商品理念才是最重要的。

新零售----采用新技术工具手段是重点：

目前，零售企业要特别关注新技术的发展对行业带来的影响。

当前技术的发展在快速迭代。通讯技术，5G即将面世，很多企业都在等待5G时代可能带来的物联网时代；智能技术在快速发展，特别是人工智能技术，已在一些领域具备较大的商业价值；互联网技术也在快速发展；信息技术，特别是机器学习、算法技术、大数据技术都在成熟，并且在一些商业领域得到广泛应用，譬如电商、导航、滴滴等方面。

目前的技术发展已经与商业结合越来越快，越来越紧密。仿佛目前的新技术就是为零售“量身定制”，譬如RFID技术，与无人店结合的如此之快。

其实连锁企业的发展是得益于技术的支撑。没有信息技术，连锁企业不能发展的这么大，这么快。

当前一轮的零售变革，可能将会是线上巨头推动，以技术驱动为特征的新零售变革。所以，我的判断，18年及未来，技术在零售领域的应用及发展将会加速。

技术驱动新零售，将会主要在以下领域发挥出重要价值：

链接顾客的技术：当前零售店最迫切需要链接顾客的技术，如何用互联网信息技术手段，链接顾客是紧迫技术。目前多点、有赞等一些技术企业都做这方面的尝试。

提升顾客体验的技术：技术的发展一定是要首先能带来顾客的良好体验。否则再好的技术也没有价值。特别是能够产生顾客粘性、提升顾客购买效率等方面的技术需要特别关注。自助收银将会产生非常好的顾客体验价值，需要零售店特别关注。

提高效率、降成本的技术：未来的技术必将在企业的效率提升、和成本降低方面发挥重要价值。未来信息技术将会变革的更有效率、更智能化、更具学习能力，会大量替代目前的人，包括自动盘点，自动货架管理等技术必将在效率提升、成本降低方面发挥价值。

目前零售企业需要重点关注信息技术的变革、无人技术、自助收银技术、自动识别技术等。

重点还是要尽快转变观念。要重视技术的价值，主动引进、推动技术发展。必能抱着老观念不放了。

新零售----打造顾客终身价值是终点：

罗胖在18年跨年演讲当中有一个观点要引起零售企业的重视：流量思维转变到超级用户思维。

一个不做零售的人，有如此的观点值得学习。目前可能是大多零售人还没有看清的。

罗胖的观点：过去，受互联网的影响，大家都觉得主流的商业打法，应该是流量思维。一个网站需要更多的点击，一个小店也应该开在人流密集的地方。但是这个词背后是一种冰冷的心态。不论你是什么人，你在我的商业棋盘上，就是一个数字，而不是一个活生生的人。流量，用一个统一的词汇，掩盖了互联网世界的丰富性。

他说：不能说流量思维就错了。过去这20年，互联网人口红利爆发，大量的人从线下转到线上，从真实世界移民到网络空间，用“流量思维”来数人头，图进取，是一个不错的策略。反正遍地沃野，插根扁担都能开花。

目前，不论是对线上企业还是线下企业来讲，流量红利期都已经成为历史。

怎么办？只能从粗放对待流量的理念、经营流量的模式、对待流量的方法转向精细化的运营流量上来。

我的观点：未来零售经营的主线：找到顾客、建立链接、产生影响、增强粘性、打造终身顾客价值。

张瑞敏讲：整个家电还有没有出路？肯定是没有出路了！只能从卖产品，转向社群经济，看谁的社群规模有多少，顾客价值有多高。

未来的零售终点就是顾客价值。

必须要一切围绕顾客价值，一切打造顾客价值，一切营销顾客价值作为零售的中心。

不论是连锁零售企业、还是电商、还是无人店、还是无人架，没有顾客价值，不重视顾客价值的零售将没有生存空间。