投资人看AI:在哪些城市人工智能应用领域领域从业最合适

投资人看AI:人工智能技术最不擅长干什么,对您的影响呢?
王猛,原创系列第5篇
--- ①&---
运算智能,二是感知智能,三是认知智能。目前人类社会创造出来的人工智能产品,不可避免地涉及到以上三个智能层面其中某一个或几个层面。
我们大家都知道,人工智能并不是一个新鲜的概念。早在上个世纪50年代,人工智能概念就轰轰烈烈地出现了第一次热潮,上个世纪80年代掀起第二次热潮,直至本世纪这个年代逐步掀起第三次人工智能热潮。为什么前两次人工智能热潮会退却,这一次又有何不同?
简单总结一下,前两次人工智能热潮在一定程度上提高了机器的自动化水平或智能水平,但并没有真正有效地将上面提及的三个方向的智能水平,提升到人类生产生活实用的层次。而这一次热潮借助天时地利人和,借助学术界和产业界的共同努力,大幅度提升了机器人智能水平达到实用层次。
But,是所有方向的智能水平都达到了实用层次了吗?对创业公司的未来发展和竞争态势会有什么影响?
--- ②&---
我们先来了解一下第一个人工智能发展方向:运算智能。
运算智能即快速计算和记忆存储能力。人工智能所涉及的各项技术的发展是不均衡的,现阶段计算机具有优势的是快速计算能力和存储能力。1996年IBM的深蓝计算机战胜了当时的国际象棋冠军卡斯帕罗夫,从那时起,人类在这样的强运算型的比赛方面就不能战胜机器了。
运算智能目前最典型的人工智能应用就是大数据处理了。互联网的出现和大规模渗透,解决了两个大问题,一是大数据,二是云计算。这两点使得机器的“运算智能”发挥得淋漓尽致,即使人类的“最强大脑”也赶不上这样的机器智能,这是人工智能最擅长干的事情。
--- ③&---
第二个人工智能发展方向:感知智能。
感知智能即视觉、听觉、触觉等感知能力。人和动物,都具备能够通过各种智能感知能力与自然界进行交互。自动驾驶汽车,就是通过激光雷达和摄像头等感知设备和人工智能算法,实现这样的感知智能的。机器在感知世界方面,比人类还有优势。人类大部分是被动感知的,但是机器可以主动感知,如激光雷达、微波雷达和红外雷达。
感知智能目前最典型的人工智能应用就是人脸识别、语音识别等等。之所以计算机能实现这样的感知智能突破,这需要归功于“深度学习”理论的奠基者Geoffrey
Hinton教授,他于2006年《科学》上发表的文章开启了深度学习在学术界和工业界的浪潮。
基于深度学习和大数据的“感知智能”,即使人类的“最强大脑”也可能赶不上这样的机器智能,这是人工智能最擅长干的事情。
--- ④&---
第三个人工智能发展方向:认知智能。
认知智能通俗地讲是“能理解会思考”。人类有语言,才有概念,才有推理,所以概念、意识、观念等都是人类认知智能的表现。要实现机器认知智能的目标,即机器人能理解会思考,需要突破四个方面:语言理解,知识表示,联想推理和自主学习。
认知智能目前最典型的人工智能应用就是聊天机器人、智能客服等等。But,我不得不抱歉地转折一下,现在我们有一个流行的说法是“弱人工智能”,这个“弱”,弱就弱在认知智能上。“深度学习”理论根本性地突破了机器感知智能的边界,但是并不能解决认知智能上面提到的需要突破的四个方面。
别说人类的“最强大脑”,既使一个不到十岁的小学生,也可以轻松地在“认知智能”这个环节将机器人PK掉,这是人工智能最不擅长干的事情。
--- ⑤&---
好了,我们已经了解了人工智能最擅长和最不擅长干的事情了,接下来我们要做的事就是分析这可能给我们的人工智能创业公司、从业者和投资者,会带来什么样的影响?
如果需要解决的刚需痛点问题需要通过提高机器的“认知智能”来解决,需要恭喜您的是,您的竞争对手不会那么多。没有学历超人的AI技术大牛,没有耐心的数据沉淀和知识积累,进入“认知智能”行业的初级创业公司会很难支撑的!
遗憾的是,在学术界未能有“认知理论”突破性的贡献之前,在“认知智能”行业的优秀创业公司也需要清醒地意识到,单纯依靠人工智能无法完全解决行业的刚需痛点,需要大量依靠人机协作。换句话说,此类公司的营收利润要想爆发性地增长,也是困难的!
人工智能最擅长干的事是“运算智能”和“感知智能”,最不擅长干的事是“认知智能”,它们都有利有弊。一旦资金链断裂,最后是很难找到下一轮接盘侠的!
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。在人工智能领域,只有百倍的效率提升才能收获投资人的青睐?    ');我们的投资理念是,如果你要做好人工智能,你就要用到很多的计算资源,然后去处理很多的数据。所以,我们在成立之初,就从底层开始投资,先把下面的云计算、大数据这层给投好,有了坚实的基础再慢慢地往上走……
  回顾人工智能浪潮开始席卷时,大多数人并不知道这场技术革命将带来怎样的惊喜。2017年作为人工智能产业的加速年,在未来5年内它将如何战胜人类?我们该如何面对人工智能?机构作为投资风向标又将如何为行业指路?
  日下午,一场投资界沙龙在上海BBQ小花园里顺利召开。本次沙龙的主办方为和云启资本,承办方为投资界和新芽Newseed,主题为“人工智能,何来何往”,以下为现场实录:
  云启资本执行董事:在投资人眼中,具备哪些特点的人工智能公司更容易被选中?
  众所,“人工智能”是当下最火的一个话题之一,虽然听起来很遥远,但实际上它已经在不知不觉中改变了我们的生活,比如,平时拍照的时候,我们总是会用美颜功能,“美颜功能”实际就是人工智能在To C领域的一个反应。此外,在教育、医疗、工业等诸多领域,人工智能都已经渗透进去了,并且改变着这些行业的一些格局。
  云启资本成立于2014年7月,目前管理一支美元基金,两支人民币基金,合计20亿人民币。在技术方面,我们重点关注云计算、大数据和人工智能三个方向。我们的投资理念是,如果你要做好人工智能,你就要用到很多的计算资源,然后去处理很多的数据。所以,我们在成立之初,就从底层开始投资,先把下面的云计算、大数据这层给投好,然后有了坚实的基础再慢慢地往上走,然后去看每一个领域到底会有哪些人工智能能够切入的一些机会。
  为什么现在是投人工智能的时候?
  第一,2006年,学术界发表了一篇有关于深度学习的文章,掀起了人工智能的这波浪潮,并且上了一个快车道。
  第二,深度学习离不开数据,离不开数据的产生和收集。这些数据上、计算能力上、算法上的多点突破,导致人工智能快速发展和欣欣。
  第三,在中国做事情离不开政策,国家在这方面也是蛮给力的,“十三五”的规划草案明确的把人工智能给提上去了,于是乎,现在在政策的引导下,都开始往人工智能方向倾斜。
  人工智能为什么是那么棒的一个东西?
  我觉得最重要的是它能够带来效率的提升,效率提升了以后,你的产能就上去了,成本就下来了,从而,企业的利润率也会提升,因此,企业本身是很有动力去把人工智能应用在他们的生产和运营之中的。&&&
  人工智能在我国潜力很大。比如,在过去的10年里,华人贡献的文章数和引用数已经达到了30%,这是特别让人吃惊的数字。在其它领域,比如数据库领域、计算机领域……华人的贡献从来没有达到现在的高度。可以说,中国人在这一方面是毫不落后于世界同行的,甚至说,随着我们资本大量的注入,中国有望成为世界的领先。
  在人工智能领域,投资人是如何挑选被投企业的?
  当下的人工智能公司大致可以分为三类:第一类公司是基础设施的提供者,第一类公司着力于生产人工智能的加速方案,第三类公司是技术算法的驱动者。
  接下来,分享一下,在人工智能这个垂直领域里,我们云启资本在挑选投资标的时主要的关注点:
  首先,要有好的商业场景,同时,在这个商业场景里面需要能够有颠覆性效率的提升,这个效率提升至少是3到5倍,甚至说数十倍、数百倍的量级提升。
  第二,我们选择的行业必须是市场规模巨大的,因为这样才能有足够的机会。&&&第三,拥有一个高质量的、巨大的、稳定的数据来源。
  目前,我们比较看好的行业有:无人驾驶、医疗、安防、语音、教育和工业等等。我们在看AI的时候,实际上去接触的是工程师的一个团队,工程师的团队经常会有一些问题,他们会更加专注于技术本身,他们说自己的技术会比别人好,比如一个或者两个百分点,但这个不足以让投资者产生兴趣。投资者更加关心的是你的市场在哪里?你在你的目标市场里面是否能够推出一款有竞争力的产品,然后产生5到10倍,甚至百倍的效率提升?所以我们早期工程师会关注第一、第二个阶段,就是技术的本身,但是它最终还是要走向产品的落地,让它的业务形成一个闭环。
  我们会去考察创业团队几个能力:数据能力、算法能力、渠道和运营能力、产品能力、解决问题能力。
  最后说说接下来的投资方向,投资完AI之后我们计划转向娱乐,因为人都被机器人给解放了,空余时间变多,就只能去娱乐了。
  Roadstar.ai中国区负责人那小川: 无人驾驶,离“上路“有多远
  大家好,今天我来给在座的各位分享一些我对于无人驾驶行业的看法。
  无人驾驶的起源基本上可以追随到2005年的DARPA Grand Challenge和2007年的DARPA Grand Challenge,05年在沙漠,07年在城市。截止到现在大概两个月前,Google的无人车已经累计行驶了500万公里。最新的技术实力是可以达到连续8000公里一次人工干预的水平。我们觉得特斯拉对这个行业有非常大的贡献,它教育了很多投资人,也教育了市场。
  2016年,无人驾驶这个市场变得非常的热,所以出来一大批做无人驾驶的公司。这里面总结几个点,有两个比较大的特性:第一,会看到国外的无人驾驶的初创公司几乎都在做L4,没有见到有哪家公司出来说我在做ADSA,或者我在做L3,几乎没有,全世界都在做L4;第二,有3个很明显的流派存在,Google、和百度。 &&&
  给大家做一些科普,介绍一下L0到L5。L0指没有辅助驾驶,L1是在个别的系统上可以辅助,L2比如ACC、高速公路上的自动巡航、定速巡航等;L3可以理解为,这个车在有些情况下可以完全替代人的,它可以进行完整的驾驶,包括变道,包括所有的驾驶行为。但是它有一个问题,偶尔会遇到它没法处理的场景,遇到这个场景的时候它会让你接管,于是你必须在6秒内进行接管,这是L3的定义;L4的意思是我事先圈出一块地,这个区域我事先告诉你的,在这个区域内我可以实现完全的无人驾驶;L5就是任何区域了,比如说你从中国开到美国,L5因为比较远,暂时没有人说我要做这个L5。
  接下来讲的稍微要有一点点技术,大家都知道,Google的车有很多种,但是有没有一些比较主要的?我觉得最主要的有四个:LIDAR、摄像头、Radar和GPS。
  Google的技术实际是以LIDAR为中心来构建的,它的算法非常依赖于这个激光雷达,以致于到今天Google自己开发了激光雷达,它的激光雷达是128线,这个东西在市面上是买不到的,只有Google自己能做,它有一个非常强的硬件团队。
  当下的硅谷有三个比较新的技术潮流:第一,用多颗低线束的LIDAR来替换一颗高线束。第二,LIDAR和Camera,以及其他传感器的融合。第三,对LIDAR点云数据来使用深度学习算法。
  我讲一下中国市场的独特性,硅谷的路况还是非常好的,中国的路况非常复杂。这会导致一个情况,比如谷歌的算法平移到中国必然是不行的,且不说中国,Google的算法在湾区开的很好,把它放到匹兹堡做过一次实验,性能下降的很厉害,也就是平均无人工干预的行驶公里数下降的很厉害,因为不可避免的要对当地的路况做一个适应。所以如果你想针对中国市场做一套L4的系统,可能你不太能指望Google或者UBER这样的公司来做,还是要针对中国市场,用中国的数据来做训练集,针对中国市场特性去设计一套算法。这就是给了我们初创公司一个很大的机会,如果我以中国市场为前提,我可以避开几乎所有硅谷巨头的竞争,至少当下是这样的。
  最后,介绍一下我们公司,我们自诩为中国实力最强的L4无人驾驶团队,这是有原因的。据我们了解,真正在硅谷一线做过无人车开发的华人,加起来也就30个人左右,不会再多了,而我们的三个创始人都属于这30个人之内,也就是他们都代表硅谷最先进的生产力。具体讲一下,CEO佟显乔是在无人车领域耕耘时间最长的,大概干了有9年时间,参与过nvidia的drive px项目,也是Apple无人车项目的创始员工;CTO衡量在Google负责新一代街景车的开发,后来又被Elon Musk挖到特斯拉,2016年4月,他加入了百度;首席机器人专家周光是大疆全球开发者比赛的第一名,他是一个机器人极客,或者说机器人黑客,也非常擅长深度学习的算法。
  投资总监郑灿:AI创业公司的技术壁垒和销售落地
  大家好,我是郑灿,来自线性资本。线性资本成立于2014年,目前管理两支人民币基金和两支美元基金&。我们主要关注应用数据智能,在人工智能有比较多布局。
  AI的创业公司可以分为哪两类?
  首先,我想先不太科学的把AI的创业公司分为两类:一类我叫做人工智能的基础设施,就是致力于解决如何把人工智能变得更好用,更简单的应用在通用的行业和问题上面的一类创业企业;另一类是人工智能和行业结合的一类创业企业。
  之所以这样分类,是因为这两类创业公司的技术壁垒和销售的落地形式通常有一些不同。&&&
  第一类公司的技术壁垒在哪里呢?在我看来,不在特定的算法本身,而在为了让算法无痛地在实际场景落地而做的很多努力。比如做机器学习自动建模的创业团队,关键算法可以从很多论文当中看到,但如何让这个产品方便地集成到一些常见的数据流水线当中去,又如何应用在大规模的模型场景中,是能成为技术壁垒的。&&
  第二类公司的技术壁垒在哪里呢?由于基础设施不停的往前发展,使得人工智能在行业应用当中,这个智能本身,或者说刚才讲的算法和模型本身的这种壁垒大幅的被削弱了。很多时候新的框架和算法都已经被开源了,拿来就可以用。因此,我们认为壁垒较多形成于创始团队对于相关行业的积累。比如我们最近投资的专注在智能放疗领域,他的核心技术是基于图像识别的智能靶区勾画,和基于物理模拟的放疗计划生成。但为了让这些技术能真正帮助医生,他们做了好几个系统来改造整个肿瘤科和放射科的工作流程,在这个过程中建立了自己的壁垒。
  数据能不能成为壁垒?
  在我们看来,通过特定的途径,拿到一部分的数据本身,这个可能能为你争取一些先发优势,然而,随着后续业务的展开,最理想的模式是在业务的展开当中,你可以不停地得到新的数据,然后在这些新的数据基础上,持续对你整个系统的能力进行增强,这样不停累积数据的模式中,数据能够形成技术壁垒。这个是技术壁垒的部分。
  讲到销售落地呢,首先我们看到目前人工智能基本上还是选择to B的销售方式,一方面,人工智能在产业当中能够产生的价值会比较大;另一方面,企业的付费能力比较强。但是反过来讲,它也面临着传统的to B业务形式的一些挑战。很多时候创业团队会和集成商合作去输出技术,能够在前期比较快地完成销售落地。但是很容易面临被替换,长期而言对于定价和数据积累也都会带来问题。所以还是应该尽量直接面对客户,提供产品和服务。总的来说人工智能的销售,和普通的to B方案的销售没有太大的分别。相对特别的一各方面是人工智能目前在学术前沿比较热,所以在一些特定的行业当中,比如说像医疗,可以通过合作科研的方式去落地。另外对于很多的大公司而言,还处在选择自建还是购买的状态下,这个时候通过联合开发的形式也会比较容易进入到一些大客户当中去。
  CTO胡哲人:人工智能如何改变教育?
  大家好,我来自英语流利说,我们是做移动在线教育的,是比较典型的人工智能在一个垂直领域的落地。
  中国人对教育的重视的确是我们在中国做教育的一个优势,现在,教育最大的问题始终是围绕人,人不可控,老师也是人,也会有情绪波动。
  我们希望通过人工智能这些技术或者机器学习的技术解决老师的这个问题,我们希望至少在英语学习这件事情上能够让软件或者说记忆学习,或者很多背后的服务器、数据、计算这种东西代替很多老师要做的事情。
  对于像我们这样的公司,我们起步的时候是完全没有基础的,现在人工智能是挺火的,记忆学习也挺火的。刚才几位专家也提到人工智能离不开数据,对于一个创业公司来说你的数据来自于哪里?所以,如果你想做一个人工智能平台,其实很难,真的很难。
  我觉得我们当时一个非常巧的点就是说我们找到了一个垂直的市场,并且我们通过比较巧妙的产品,迅速让这个产品起来之后,我们迅速不停收数据,不停的迭代,所以我们才有了今天。
  以我们为鉴,一个零基础的公司想要入局人工智能领域,这真的是一个很大的挑战。当然还有一种做法,你做一个非常好的特别功能,你最终的目的是卖给大公司,我觉得这个也是可行的。但是,如果想作为一个独立的公司,最终能够做大,或者走到某一个阶段,其实我觉得这个路径可能都会非常类似。
  我们的目标是把老师干掉,以学生为中心,现在基本上整个体验通过线上的,这是我们在探索的,也是我们的想法。其实教育这件事情,包括健身,长久以来一直是不讲结果的。但是大部分其他行业时间越短收费越贵,顺丰当天到和两天到、三天到价格很不一样。所以我们其实是希望通过我们的数据,在我们这是完全数据化一个用户学英语的整个过程。我们一个用户贡献除了语音数据之外,他们每一个学习行为的数据,每一个付费用户大概都是以几万,甚至是十万的数据点计入的,差不多我们现在的付费用户,光用户行为的点都已经超过100亿了,基本上是去卖这个东西。
  我们希望最后是按照结果付费,假设你是Level1的学生,你想达到Level3的水平,我们的收费是越快越贵,我们可以给你三个月、六个月、一年的选项,时间越短收费越贵。
  以英语为例,其他以前所有的英语都不是这样的,所有的付费方式都是按课时算,你买多少课时我付多少钱,这个课时你随时随地都能用,可以一周上一次,也可以一天上一次,我们的目标希望跟快递一样。
本文为投资界原创,作者:Alien,原文:http://news.pedaily.cn/.shtml 【本文为投资界原创,网页转载须在文首注明来源投资界(微信公众号ID:PEdaily2012)及作者名字。微信转载须在文章评论区联系授权。如不遵守,投资界将向其追究法律责任。】
TOPS2732゜11961゜21360゜31318゜41312゜51291゜61271゜71124゜81106゜9981゜1027281゜17192゜27008゜36905゜46223゜55772゜63933゜73506゜83419゜93402゜10
A轮 金额未透露 融资天使 金额未透露 融资Pre-A 金额未透露 融资A轮 金额未透露 融资
市场及媒体合作李小姐010 37.cn投稿邮箱.cn
投资界微信
(C)清科集团版权所有京ICP备号-2京公网安备32号投资人李竹:人工智能+将会替代互联网+_网易科技
投资人李竹:人工智能+将会替代互联网+
用微信扫码二维码
分享至好友和朋友圈
有人预测,人工智能将会是比移动互联网大一千倍的市场,下一个BAT级的公司或许就从人工智能里面产生。AI大数据加速器的发布会重点围绕人工智能、大数据,以及AR/R、ADAS、无人机、机器人、IOT、航空航天等科技领域的创业项目做加速服务,会上演讲中嘉宾表示2016年的人工智能=1996年的互联网=1976年的PC。人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。人工智能是中国的大机会英诺天使基金创始合伙人李竹先生一直在关注人工智能的项目,也投资了很多AI项目。在他看来,从模式创新转向技术创新,下一个时代毫无疑问是人工智能的时代。现在有一些大的公司,通过人工智能也焕发了新春,包括做搜索的百度、搜狗都在做人工智能,阿里也推出了一些平台等。在接受网易科技采访时,李竹先生表示非常看好人工智能AI发展趋势,AI+将会替代互联网+成为下一个整个创业的趋势,在人工智能来临的时候,人类社会也会出现一个新的转折点。第一,新的科技应用会让整个生活状态发生变化,比如可以通过跟机器人可以走的更快,有残疾可以得到康复。第二,它让整个人类生活更加美好,跟数字世界连接更加观眉。第三,让每个人活的更加轻松,互联网给我们带来非常多的选择,但是人工智能能够帮助我们做出选择所以更美好更强大更轻松将是人工智能时代的特点。英诺天使基金目前在来AI的布局在人工智能方面,英诺天使基金投资已经持续了将近两年的时间,投资项目主要有无人机、机器人、硬科技、车载直视AR显示器、智能硬件、指纹识别、水下机器人等,还有一些把人工智能引入到医疗影像的公司,这样的公司发展非常快。在人工智能领域里,包括从基础的计算平台到应用大数据,乃至核心技术都会是好的创业方向。对于人工智能发展方向更看重技术层面,以及应用的层面。技术层面包括像图象识别、机器学习、语音识别,也包括像人机交互的东西。应用层面比较看好的项目,如医疗、金融、法律等。人工智能领域创业的建议有业内人士称,人工智能是巨头才能玩得起的领域,因为需要大数据作为支撑,而李竹老师却不这么认为,他表示数据广泛的存在各个行业,在现在每天所有的物联网、O2O、互联网金融都在产生大量的数据只要有行业经验和数据都可以参加到人工智能当中来。希望人工智能加速器大数据能够把人工智能技术和行业数据进行很好的对接,人工智能在技术和行业应用,行业资源对接上都应该做出自己的贡献。在AI创业方面,一方面是技术积累,必须在相关领域有工作几千小时到上万小时的积累,因为技术创业跟原来的模式创新完全不一样。第二必须有好的场景,把人工智能如何更接地气找到应用的地方,这两点是非常重要的。资本寒冬的背景下投资AI是否存在担忧李祝老师表示在资本寒冬的大背景下反而技术创新的公司得到了资本的信赖,在过去一年里边,虽然整个投资环境并不是很好,但对于技术创新人工智能在各个行业的应用反而得到很多VC和天使的认可。创业公司在最近一年获得风险投资天使投资发展非常的快,行业里形成一个新的趋势,更看好技术创新的公司,而这类公司不受资本寒冬的影响。
从李竹老师过去投资的公司来看,人工智能将来是无处不在的,人工智能+将会成为未来一段时间创业和整个技术创新发展的新的趋势。比如说把人工智能应用医疗行业,替代医生看图片,代替医生他的诊断。比如肺病肺癌等其他的疾病。并且还可以用人工智能替代律师在网上回答大家咨询的问题,这些都是很好的应用。那么在一些消费机器人方面,如无人机现在变更升级非常快,能做到人的体感操纵,非常方便,360度进行拍照能跟随等等都应用到计算机视觉人工智能的技术。在中国有海量的数据,而这些数据都是人工智能得以应用的基础,创业公司也可以用上千万的数据训练自己的机器。在人工智能深入学习方面的论文被引用的次数最高的是中国,人工智能方面人才相对较多。中国在图像识别方面可以达到百分之九十几的准确率,已经是世界领先了。由此看来,中国在人工智能方面完全有机会领跑世界。
本文来源:网易科技报道
责任编辑:郜雪丹_NT5097
用微信扫码二维码
分享至好友和朋友圈
加载更多新闻
热门产品:   
:        
:         
热门影院:
阅读下一篇
用微信扫描二维码
分享至好友和朋友圈AI学人AI学人有关 AI 的一切:科普,视点,深度,花边,八卦关注专栏更多最新文章{&debug&:false,&apiRoot&:&&,&paySDK&:&https:\u002F\u002Fpay.zhihu.com\u002Fapi\u002Fjs&,&wechatConfigAPI&:&\u002Fapi\u002Fwechat\u002Fjssdkconfig&,&name&:&production&,&instance&:&column&,&tokens&:{&X-XSRF-TOKEN&:null,&X-UDID&:null,&Authorization&:&oauth c3cef7c66aa9e6a1e3160e20&}}{&database&:{&Post&:{&&:{&title&:&彪悍的家族不需要解释:人工智能人物谱(一)&,&author&:&ygwang&,&content&:&\u003Cp\u003E百年以后,人工智能可能和蒸汽机、电力、计算机一样,因推动人类社会完成跨越式变革而被历史铭记;当然,也可能像某些人担心的那样,突变成科幻电影中主宰或毁灭人类的邪恶幽灵。无论如何,我们必须尊敬那些为人工智能技术奠基的科技大师们,他们的名字必将和瓦特、法拉第、爱迪生、图灵、冯·诺依曼等并列,他们的事迹必将被写进科技史册,他们的探索精神必将驱动着未来人类或毁灭了未来人类的智能机器不懈前行……\u003C\u002Fp\u003E\u003Cp\u003E好吧,不端着架子写官样文章了,我其实就是对人工智能发展史上那些大牛的个人经历、生活感兴趣。八卦是人类进步的阶梯嘛。倒不一定非要像八卦薛定谔那样死盯着花边新闻不放,其实,简单看看人工智能大牛的家谱就能有不少重量级发现。\u003C\u002Fp\u003E\u003Cp\u003E今天这篇,先从深度学习鼻祖 Geoffrey Hinton 说起。\u003C\u002Fp\u003E\u003Cimg src=\&efb37aae6b411cbad5d4add.jpg\& data-rawwidth=\&500\& data-rawheight=\&338\&\u003E\u003Cp\u003E不认识 Geoffrey Hinton?简单说,他最先把反向传播(Backpropagation)用于多层神经网络,还发明了玻尔兹曼机(Boltzmann machine),这两项贡献就足以让所有主修机器学习的学生顶礼膜拜。除了教书,他还创办了名叫 DNNresearch 的人工智能公司,然后把公司卖给了 Google。现在,Geoffrey Hinton 一半时间在多伦多大学教书,一半时间在 Google 建设神秘的 Google 大脑。\u003C\u002Fp\u003E\u003Cp\u003E还是不觉得 Geoffrey Hinton 很牛?列举几个他的大牛学生好了:Yann LeCun 是 Geoffrey Hinton 在多伦多大学的博士后学生,目前是 Facebook 公司的人工智能研究总监,深度学习的一面旗帜;Brendan Frey 是 Deep Genomics 公司创始人和 CEO;Radford Neal 是 R 语言的 pqR 解释器作者;Ilya Sutskever 是 DNNresearch 的联合创始人,也随 Geoffrey Hinton 一起参加过 Google 大脑的研发,目前任 OpenAI 研究总监。\u003C\u002Fp\u003E\u003Cp\u003EGeoffrey Hinton 很牛,但这不是重点,重点是,他出生在一个只能用“彪悍”、“杰出”、“神奇”之类的字眼儿形容的恐怖家族!!!\u003C\u002Fp\u003E\u003Cp\u003E这家族很大,关系很复杂,咱们一点儿一点儿慢慢说。\u003C\u002Fp\u003E\u003Cp\u003EGeoffrey Hinton 的父亲叫 Howard Everest Hinton,是个英国昆虫学家,喜欢研究甲壳虫(不是利物浦的披头士啦)。这不重要,重要的是,Howard Everest Hinton 有一个堂弟叫 William Hinton,还有一个堂妹叫 Joan Hinton。这两个人不提中文名字恐怕很多中国人都想不起来——他们一个叫韩丁,一个叫寒春,是中国人民的老朋友,著名的马克思主义者。\u003C\u002Fp\u003E\u003Cimg src=\&af72b70de893ca93f09b.jpg\& data-rawwidth=\&500\& data-rawheight=\&415\&\u003E\u003Cp\u003E1940 年代,韩丁在中国亲历了土改运动,写下了《翻身——中国一个村庄的革命纪实》。寒春就更有名,有名到很多读了杨振宁、邓稼先事迹的中学生都知道寒春、阳早这一对儿夫妻档。寒春是核物理学家,在美国亲身参与曼哈顿计划,制造原子弹。但广岛、长崎核爆后,寒春就毅然离开曼哈顿计划,抱着“解放全人类”的理想来到了共产主义中国,并成了最早获得中国绿卡的国际友人之一。许多年后,杨振宁回国时曾问邓稼先,寒春到底有没有帮中国研发原子弹,邓稼先请示了周总理后,给了杨振宁一个明确答复:除了早期接受一些苏联帮助外,原子弹完全是中国人自己造出来的。这个故事的大背景是,寒春和阳早来中国根本就不是要从事核物理研究或核武器发展的,他们夫妻俩立志帮助中国人民发展农牧业,建设社会主义。寒春和阳早长期在北京郊外的农场研发农牧机械,特别是奶牛饲养用的农机具,直到二十一世纪初二人先后离世。\u003C\u002Fp\u003E\u003Cp\u003E韩丁和寒春的父亲叫 Sebastian Hinton,职业是律师,业余时间发明了儿童用的攀爬游乐设施——就是儿童游乐场里常见的攀爬架、绳梯之类的组合啦。Sebastian Hinton 和 Howard Everest Hinton 的父亲 George Hinton 是同胞兄弟,他们的父亲,也就是本篇主人公 Geoffrey Hinton 的曾祖父,名叫 Charles Howard Hinton。\u003C\u002Fp\u003E\u003Cimg src=\&d87ae3c0e5ffb85d0e9455e7.jpg\& data-rawwidth=\&325\& data-rawheight=\&457\&\u003E\u003Cp\u003ECharles Howard Hinton 是个了不起的大人物,他不但是个知名的数学家,还是最早的科普和科幻作者之一。1880 年,他发表的文章《第四维是什么?》,解释了三维世界和四维世界之间的几何关联。他的大多数科普、科幻文章都收在名为《科幻小说》(Scientific romance)的文集(已过版权保护期限,网上可以找到文集的全文)中,“Scientific romance”这个词也成了科幻小说最早的英文称谓,直到后来演变成大家熟悉的“Science fiction”。\u003C\u002Fp\u003E\u003Cp\u003E好了,现在我们还都在姓 Hinton 的家族里打转。从 Charles Howard Hinton 开始,我们即将顺着姻亲关系,攀爬到另一个更加彪悍、更加恐怖的家谱树。\u003C\u002Fp\u003E\u003Cp\u003ECharles Howard Hinton 的妻子叫 Mary Ellen,Mary Ellen 的父亲叫 George Boole。\u003C\u002Fp\u003E\u003Cp\u003EGeorge Boole,看看这个伟大的名字吧,每个学计算机的同学都应该把这个名字供在电脑桌前。布尔代数、布尔电路、布尔类型、布尔表达式、布尔函数、布尔模型……这个伟大的英国数学家、教育家、哲学家和逻辑学家,他的思想和发明变成了成千上万本教科书、成千上万道考试题、成千上万个计算机程序,充斥了理工生的整个世界。从某种意义上说,拜布尔神教要远比考试不挂科神教来得靠谱些。\u003C\u002Fp\u003E\u003Cimg src=\&a6b5fc8744d4fffd835c94.jpg\& data-rawwidth=\&250\& data-rawheight=\&335\&\u003E\u003Cp\u003EGeorge Boole 不仅仅自己彪悍,他的五个女儿个个彪悍。\u003C\u002Fp\u003E\u003Cp\u003EGeorge Boole 的大女儿就是 Mary Ellen,是本篇主人公 Geoffrey Hinton 的曾祖母(祖奶奶)。二女儿叫 Margaret,她的儿子 Geoffrey Ingram Taylor 是流体力学的鼻祖级人物,因为研究核爆炸时的冲击波,被英国派到美国参加曼哈顿计划。也就是说,同样参与过曼哈顿计划的寒春是 Geoffrey Ingram Taylor 的远房表侄女。George Boole 的三女儿 Alicia 同样为四维几何学做过贡献。四女儿 Lucy Everest 是英国第一个化学女教授。五女儿 Ethel Lilian Voynich 是中国 50 后、60 后甚至一小部分 70 后非常熟悉的艾捷尔·丽莲·伏尼契,她写了一本曾经流行于中国大江南北的长篇小说——《牛虻》。\u003C\u002Fp\u003E\u003Cp\u003EGeorge Boole 的妻子也是牛人,叫 Mary Everest,是今天的女权主义者经常挂在嘴边的杰出女性代表,自学成才的数学家,写过《代数的哲学与乐趣》,也是著名的儿童教育家——不然她五个闺女会个个厉害?\u003C\u002Fp\u003E\u003Cimg src=\&ebc3849adff6bd.jpg\& data-rawwidth=\&228\& data-rawheight=\&300\&\u003E\u003Cp\u003EMary Everest 娘家姓 Everest,这个姓氏还有另一层含义——珠穆朗玛峰的英文称谓。这是怎么回事?Mary Everest 的叔叔叫 George Everest,是著名的英国地理学家、旅行家、探险家。他亲自游历、勘测过印度、尼泊尔的大片山川。1865 年,藏语原意“圣母之水”的珠穆朗玛被英国人冠名为 Mount Everest。据说当时 George Everest 自己并不乐意,但木已成舟,他必将因此而名传百世。\u003C\u002Fp\u003E\u003Cp\u003E到这里,先打住吧……这个家族可八卦的人物还有很多,不过必须言归正传,我们八卦计划的出发点是人工智能领域里的传奇人物。从 Geoffrey Hinton 开始,一直讲到布尔家族,不得不说,彪悍的家族不需要解释,拥有如此强大的基因,搞不出学术成就才是新闻。\u003C\u002Fp\u003E\u003Cp\u003E给一张这个彪悍家族的概要关系图:\u003C\u002Fp\u003E\u003Cimg src=\&4fe2ff291c31cf888f05fd9b10f07b2a.png\& data-rawwidth=\&2390\& data-rawheight=\&1380\&\u003E\u003Cp\u003E下一篇,我们会从另一个大牛开始八。\u003C\u002Fp\u003E&,&updated&:new Date(&T01:16:25.000Z&),&canComment&:false,&commentPermission&:&anyone&,&commentCount&:15,&likeCount&:203,&state&:&published&,&isLiked&:false,&slug&:&&,&isTitleImageFullScreen&:false,&rating&:&none&,&sourceUrl&:&&,&publishedTime&:&T09:16:25+08:00&,&links&:{&comments&:&\u002Fapi\u002Fposts\u002F2Fcomments&},&url&:&\u002Fp\u002F&,&titleImage&:&https:\u002F\u002Fpic3.zhimg.com\u002F349c92c9bc160e600a8ca_r.jpg&,&summary&:&&,&href&:&\u002Fapi\u002Fposts\u002F&,&meta&:{&previous&:null,&next&:null},&snapshotUrl&:&&,&commentsCount&:15,&likesCount&:203},&&:{&title&:&计算机科学家的土豪人生:人工智能人物谱(二)&,&author&:&ygwang&,&content&:&\u003Cp\u003E科学家 vs. 金钱,是个值得探讨一辈子的有趣话题。现如今摆在明面上的事实是,真正有才的人工智能科学家凤毛麟角,能被 Google、Facebook、百度抢来抢去的那拨人年薪动辄几百万美金,搞得一众苦逼码农们唏嘘不已。上行下效,这年月哪怕是毫无经验的应届毕业生,也愿意给自己的简历上贴上大数据、机器学习、神经网络之类的标签,就像淋了水的蔬菜,开了光的菩提,身价即便不涨,内心也是舒畅。\u003C\u002Fp\u003E\u003Cp\u003E实话实说,计算机科学家能赚钱的不少,与其他门类相比,计算机科学这个圈子跟热门行业离得更近,教授容易申请经费,学生容易打工养活自己,脑筋稍微活泼一点儿的就各种开公司,拉投资,卖概念,再不济,就算老老实实待在大公司里写代码,收入也高过普通办公室白领不少。\u003C\u002Fp\u003E\u003Cp\u003E可十块钱是钱,十万亿也是钱。几百万美金的年薪有人看了眼馋心热,有人却当它是键盘噼啪一响就翻来滚去的数字游戏。所以,看钱得往高处看——这一篇,咱们接着聊人工智能领域的大牛科学家,而且,先拿金钱设个门槛儿,这门槛儿其实也不高,几十亿美金起步吧。\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E身价几十亿美金的计算机科学家?嗯,我们先从许多许多年前聊起。\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E1980 年代,李开复研究非特定语者连续语音识别的时候,有个叫 Peter Brown 的神秘人物起了不小的作用。李开复在自传里是这么说的:\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E“1984 年暑假即将来临,我正沉浸在自己课题的十字路口上,不知道何去何从。这个时候我遇到了我的一个师兄彼得o布朗(Peter Brown),他看到我愁眉不展,就把我叫到一间教室里,在黑板上写了几个统计学公式。彼得o布朗对我说,‘开复,我知道你在做语音识别,并且为之苦恼,但是你为什么不尝试一下统计学的方法呢,从统计中抽取数据我想应该能够提高语音识别率,你觉得呢?’”\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E李开复讲得简单,其实里面还有一点儿背景需要交代。\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E这个 Peter Brown 在人工智能领域算不得什么顶天立地的大人物,但在技术发展史的几个关键点上,都坚定地站在了代表未来方向的一面。他跟当年 CMU 毕业的许多博士生一样,进入了那个时代 科学家们最向往的几个超级乐园之一——IBM 的 T. J. Watson 研究中心。\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cimg src=\&v2-a71b53e77cab17b3c44f0.jpeg\& data-rawwidth=\&626\& data-rawheight=\&582\&\u003E\u003Cp\u003E1970 到 1980 年代,IBM 研究中心(“深蓝”的诞生地),贝尔实验室(UNIX故乡),是不是还得算上一个施乐的 PARC(苹果电脑的图形用户界面可以溯源到这里)?它们差不多就是计算机科学的三大圣殿了吧。\u003C\u002Fp\u003E\u003Cp\u003E在 IBM 研究中心里,Peter Brown 跟着 Frederick Jelinek 领导的小组做语音识别。顺便提一句,这个 Frederick Jelinek 是写《浪潮之巅》的吴军博士的导师,是自然语言处理领域的权威人物,他的好几个学生(还有学生的学生)在 Google 工作时也跟我有过项目上的交集。\u003C\u002Fp\u003E\u003Cp\u003EPeter Brown 这个语音识别小组要解决的是 IBM 关心的听写问题,目的是要用语音识别来代替打字机,代替字处理软件。技术上讲,那个时代的语音识别主流是做专家系统,大概属于符号语义学派(Symbolic AI),可 IBM 里的这一小撮人却悄悄搞起了概率统计模型和 HMM。个中原因说出来,就完全没有了神秘感——IBM 那拨人之所以去搞概率统计,倒不是真的因为他们预见到了未来,而是因为他们一时找不到语言学方面的专家。没想到,弄一大堆训练数据统计来统计去,效果还真比专家系统提升了不少,技术曙光初现。\u003C\u002Fp\u003E\u003Cp\u003E李开复当时在 CMU 读博士。IBM 的语音识别是公司里的机密项目,Peter Brown 却因为师兄弟的关系,把 HMM 以及相关的几个关键词写给了李开复看。李开复问起算法细节,Peter Brown 又支支吾吾起来,一边让李开复去看他们发的 paper,一边又旁敲侧击地提醒说,“发表出来的,都是效果不好的。效果好的,我们都不发表的。”高手之间,原不用说得那么明白,就这么明着暗着一番暗示,李开复硬是顺着这条概率统计的道路走了出来,还走得更远更好,研究出了比 IBM 发布的听写系统好很多的语音识别技术,用自己的论文宣告了 Symbolic AI 在语音识别领域的完败。\u003C\u002Fp\u003E\u003Cp\u003E鉴于 HMM 的成功,Peter Brown 和他们这个研究小组的同事们基本都拜服于统计方法的脚下。这个小组的许多人后来一直从事语音识别研究,可 Peter Brown 不是在一个领域一耗若干年的那种人。这个组里还有另一个不安分的人,他的名字后来经常与 Peter Brown 并列,他叫 Robert Mercer,通常人们也叫他 Bob Mercer。\u003C\u002Fp\u003E\u003Cimg src=\&v2-d9c44554ade25bafecedc146b718901e.jpeg\& data-rawwidth=\&262\& data-rawheight=\&174\&\u003E\u003Cp\u003EBob 比 Peter 年长,1972 年就加入了 IBM 研究中心。Bob 和 Peter 玩腻了语音识别,就开始去弄机器翻译。反正是人工智能领域的几大难题之一。\u003C\u002Fp\u003E\u003Cp\u003E这一下,还真捅了马蜂窝。要知道,语音识别和机器翻译在经典人工智能科学家的心里,地位是有天壤之别的。\u003C\u002Fp\u003E\u003Cp\u003E语音识别嘛,不就是听见啥输出啥,一个听写机器而已。符号语言学的方法在语音识别上派不上用场,统计学方法大放异彩,那完全是因为问题本身就不属于高级智能的范畴。\u003C\u002Fp\u003E\u003Cp\u003E机器翻译?那可是要理解原文语法、语义,然后转换成目标语言的语法、语义的。论智能程度,语音识别是两三岁孩子的水平,跨语种翻译?那可是许多翻译大家皓首穷经,一辈子也难以企及的高远境界。钱钟书不是提到过么,“十七世纪一个英国人赞美这种造诣高的翻译,比为原作的‘投胎转世’(the transmigration of souls),躯体换了一个,而精魂依然故我。”厉害吧,“投胎转世”耶,这玩意儿绝对算得上是高级智能,是人类智慧的精华,要用计算机来解决翻译问题,非得懂得人类思想方法,懂得语言学不可。\u003C\u002Fp\u003E\u003Cp\u003EBob 和 Peter 这两个浑身码农味道的研究员,居然要用什么概率统计方法来解决机器翻译问题,这真真要被语言学家们笑掉大牙的。\u003C\u002Fp\u003E\u003Cp\u003E这故事的结局大家肯定猜得到,Bob 和 Peter 带领的机器翻译小组只用了很短的时间,就建立了一套可以运行的,基于大语料统计模型的机器翻译系统,居然得到了不算太糟的结果,至少,那结果比经典语言学方法得到的结果更接近人类语言,更让用户信服。从那以后,成功的机器翻译系统比如 Google Translate 走的都是统计模型的道路(今天更是在统计模型的基础上增加了深度学习这个高级武器)。Bob 和 Peter 的工作并不复杂,但他们在机器翻译领域的贡献直到许多年后还有人记得。2014 年,计算语言学会议给 Bob 颁发了终身成就奖。\u003C\u002Fp\u003E\u003Cp\u003EBob 比 Peter 从事研究的时间长些,论文也比 Peter 多些。两个人都在语音识别和机器翻译这两个领域取得了不俗的成就,算得上人工智能发展史上的重要人物吧。功成名就之后,大概可以考虑在大公司带带团队,在高等院校指导指导学生,没事儿就去申请申请科研经费的所谓“后半生”了。\u003C\u002Fp\u003E\u003Cp\u003E别人的人生到达顶峰,Bob 和 Peter 的人生才刚开始。他们的人生目标不是赚一个亿,而是赚十个亿,一百个亿,甚至更多——而且,是运用计算机科学的方法,借助计算机科学家特有的敏锐头脑和人工智能知识。\u003C\u002Fp\u003E\u003Cp\u003E有一家高科技公司,在熟悉投资和基金的人听来如雷贯耳,在普通码农听来,却多半是丈二和尚摸不着头脑。这家公司叫文艺复兴科技(Renaissance Technologies)。\u003C\u002Fp\u003E\u003Cp\u003E文艺复兴科技?听起来像什么公司?前半部分像搞艺术的,后半部分像搞电脑的,合起来像搞诈骗的?其实,理工科学生和码农们现在关心投资理财的越来越多,像我这种每次看见著名基金公司名字就彻底蒙圈的人,还是在逐年减少的(回头有空了必须做一个“为什么著名基金公司的名字都比较无厘头”的无厘头研究)。认真地说,这公司是家特别特别特别著名的用量化交易赚钱的对冲基金公司。\u003C\u002Fp\u003E\u003Cp\u003E文艺复兴科技的创始人 James Simons 老先生本身就是个很牛的数学家,还是个很有黑客精神的密码学家(据说攻破过美国政府的密码系统),此外,他还立志用数学模型来赚钱——可谓既有科学情怀、极客情怀,又有财富情怀。当然,寻常老百姓看不懂他在数学领域做了啥,也没法知道他究竟破解了哪些密码,大众只知道他经常在福布斯富豪榜上排在前 100 名里。至于他到底有几百亿的身家,网上有不少数据,有没有水分不好说,反正他每年至少入账一二十亿,媒体对他的一致评价是“世界上最聪明的亿万富翁”。\u003C\u002Fp\u003E\u003Cimg src=\&v2-ab1f3a85a9946.jpeg\& data-rawwidth=\&580\& data-rawheight=\&352\&\u003E\u003Cp\u003E“最聪明”,“亿万富翁”,哎呀,人生能同时得到这两个标签,该是何等的幸福?偏偏造化弄人,这世上有多少聪明人穷困潦倒,又有多少亿万富翁智商低下?\u003C\u002Fp\u003E\u003Cp\u003EJames Simons 之所以能赚那么多钱,主要是文艺复兴科技的几只基金,特别是一只叫大奖章基金的,表现超乎寻常,年均回报高达 71.8%,难怪这基金连管理费和业绩分成都比同行高出一倍还多。James Simons 把基金成功的主要原因归结为数学魔术。当然,大奖章基金到底是如何建模的,外人大多只能猜测些皮毛,真正的魔术技法,文艺复兴科技才不会随便透露。即便最近几年外界对文艺复兴科技的质疑声渐多(特别是大奖章基金以外的几只基金表现不佳),大奖章基金依然在最牛基金排行榜的前列屹立不倒。姑且认为,基于机器学习的人工智能技术就是这一类顶级基金公司的印钞机好了。\u003C\u002Fp\u003E\u003Cp\u003E据说,James Simons 招人的条件颇为严格,一定要找最聪明的数学家或计算机科学家,坚决不找学金融的、学工商管理的。文艺复兴科技的公司内部,基本上就是一个极客乐园,一点儿也没有华尔街那些世俗金融企业的影子。1993 年,Bob Mercer 和 Peter Brown 这两个在人工智能领域已经颇有名气的研究员被 James Simons 招至麾下,开始和文艺复兴科技里的数学家、计算机科学家一道,用人工智能技术投资理财,走上了光芒万丈的财富之路。\u003C\u002Fp\u003E\u003Cp\u003E2009 年, James Simons 退休,Bob Mercer 和 Peter Brown 出任文艺复兴科技的 co-CEO,正式成为财富巨轮的领航人——这么说显得不那么功利,其实,作为这家神奇公司的 CEO,他们自己也早就变成亿万富翁了。福布斯的估计是他们每人每年都能净入一亿美金以上。\u003C\u002Fp\u003E\u003Cp\u003E从大学校园和 IBM 研究中心走出来的计算机科学家领导一家基金公司,这件事在华尔街不算新鲜,但在不熟悉金融圈、投资圈的码农们看来,确实有些不可思议。科学家和财富之间,什么样的关系才最和谐?\u003C\u002Fp\u003E\u003Cp\u003E就个人爱好、性格、生活来说,Bob Mercer 和 Peter Brown 也都算得上是神人级的存在。而且,他们俩的性格还大不一样。\u003C\u002Fp\u003E\u003Cp\u003EPeter Brown 爱动,话唠,好胜,据说喜欢在公司健身房跟员工角力,也花了不少精力将财富投到慈善事业里。\u003C\u002Fp\u003E\u003Cp\u003EBob Mercer 就不大一样,他自己说自己喜欢孤独,宁愿不跟人说话。可另一方面,Bob Mercer 又是个著名的政治活动参与者,参与的方法很简单——大把大把地捐钱。从 2012 年总统竞选,到今年的 Trump 对 Hillary,Bob Mercer 以个人或家族名义,几百万几百万地捐出政治献金。他女儿 Rebekah 更是直接站在前台支持 Trump,参与竞选团队的事务和决策。\u003C\u002Fp\u003E\u003Cimg src=\&v2-6e236ccb257c897a1aae8da.jpeg\& data-rawwidth=\&400\& data-rawheight=\&573\&\u003E\u003Cp\u003E其他方面,诸如 Bob Mercer 和女儿都是德州扑克高手,Bob Mercer 拥有多少多少游艇,业余时间爱玩一套几百万美元的铁路模型之类,只能算是亿万富翁的日常生活一隅,实在不足以成为多么了不起的谈资。\u003C\u002Fp\u003E\u003Cp\u003E从人工智能科学家八到大把大把的金钱,从金钱八到科学家的研究、项目、事业、生活,不是说科学家一定要跟钱死磕,也不是说没钱就配不上科学家的金字招牌,只是想小声说一句,这世上最多的钱最好还是让最聪明的人赚到,那总要比人傻钱多的世界来得舒心、愉快。\u003C\u002Fp\u003E\u003Cp\u003E下一篇,我们换个没那么多钱的科学家来八八。\u003C\u002Fp\u003E\u003Cp\u003E(注:本文部分内容,李开复博士亦有贡献)\u003C\u002Fp\u003E&,&updated&:new Date(&T04:57:45.000Z&),&canComment&:false,&commentPermission&:&anyone&,&commentCount&:14,&likeCount&:148,&state&:&published&,&isLiked&:false,&slug&:&&,&isTitleImageFullScreen&:false,&rating&:&none&,&sourceUrl&:&&,&publishedTime&:&T12:57:45+08:00&,&links&:{&comments&:&\u002Fapi\u002Fposts\u002F2Fcomments&},&url&:&\u002Fp\u002F&,&titleImage&:&https:\u002F\u002Fpic2.zhimg.com\u002Fv2-c9b8a6c4cec28ff4e4f8a_r.jpg&,&summary&:&&,&href&:&\u002Fapi\u002Fposts\u002F&,&meta&:{&previous&:null,&next&:null},&snapshotUrl&:&&,&commentsCount&:14,&likesCount&:148},&&:{&title&:&科普一下:到底啥是人工智能?&,&author&:&ygwang&,&content&:&\u003Cp\u003E早上发了这么一条:\u003C\u002Fp\u003E\u003Cblockquote\u003EGoogle Photos 自动帮我们家小盆友做了一段 1 分 10 秒的配乐视频,还自作主张给起了个中文名字叫“宝贝长得真快”,然后在我完全没准备的情况下推送给我。说实在的,以前 Google Photos 自作主张做的那些东东我大多看一眼就删掉了,唯有这次,很有感染力,很有保存价值,感动中。讲真,人工智能技术越来越人性化,越来越有趣了。\u003C\u002Fblockquote\u003E\u003Cp\u003E然后就有人评论说:这是基于规则做的吧?好多人的娃都被 Google Photos 送了同样名字的视频耶。这能算人工智能吗?\u003C\u002Fp\u003E\u003Cp\u003E嗯,确实是呀,这个年头,人脸识别那么成熟,从一大堆照片里识别出同一个人,然后再根据时间顺序,找一组照片、视频,按固定模式做个剪辑——全是套路,全是套路,这里面看上去一点儿都不智能呀。\u003C\u002Fp\u003E\u003Cp\u003E反过来想,这才几年的光景呀。几年前,大家不还是管人脸识别叫人工智能的吗?怎么今天就不待见人脸识别了?因为这技术不再惊艳了?唉,喜新厌旧的人类呀。\u003C\u002Fp\u003E\u003Cp\u003E可再反过来想,我把这么多年拍的几千上万张照片一股脑都传到 Google Photos 上,人家没抱怨不说,还知道你根本没时间整理娃的照片,或者根本想不到要给娃做成长相册,人家主动帮你做了,还感动得你一塌糊涂,人情味儿、科技味儿俱在,这个还不算既有智商也有情商?还不算人工智能?\u003C\u002Fp\u003E\u003Cp\u003E扯来扯去,问题来了:到底啥是人工智能呀?\u003C\u002Fp\u003E\u003Cp\u003E先看看国内童鞋们要学人工智能的话,不翻墙会看到啥样子的定义。百度百科上,“人工智能”词条是一个叫“中国通信学会科普中国百科科学词条评审专家委员会”的几位专家贡献的。这么权威的专家写的词条,最最重要的前几段定义部分只注明了一个原始出处,是一篇名叫《人工智能,科大讯飞志在何方?》的宣传公关软文,真不知道这几位专家是想普及知识还是想推广产品。推究起来,百度百科那段定义其实也是抄的一本老套教科书啦,不信搜搜看,不但可以搜到教科书名,还可以搜到成千上万用这个定义作为公务员、成人教育等千奇百怪考试题的网页链接。一个技术词条中,核心定义的质量尚且如此,后面有关人工智能的展开论述部分,真不知要害到多少求知欲强的中小学生(高能预警:专家们后来又“不小心”混进了长虹智能电视的宣传文字)。\u003C\u002Fp\u003E\u003Cimg src=\&v2-d03ec70bae0b.png\& data-rawwidth=\&1718\& data-rawheight=\&542\&\u003E\u003Cp\u003E顺便说一句,知乎里,“人工智能”话题页面的定义大概是直接从百度百科拿下来的,也没注明原始出处,墙内网络环境里的知识传播现状可见一斑。(题外话:有空了是不是可以写个小程序,自动分析分析墙内网络里各种低水平知识的传播渠道和传播方向,看看受害者是公务员多些,白领多些,还是中小学生多些。)\u003C\u002Fp\u003E\u003Cp\u003E书归正传,我以前读的教科书里,可没有那种佶屈聱牙、书卷气十足的定义。根据我的理解,历史上,人工智能的定义历经多次转变。一些肤浅的,未能揭示内在规律的定义很早就被研究者抛弃。但直到今天,被广泛接受的定义仍有很多种。具体使用哪一种定义,通常取决于我们讨论问题的语境和关注的焦点。\u003C\u002Fp\u003E\u003Cp\u003E这里,贴一篇最近写的科普长文,简要列举、分析几种历史上有影响的,或目前仍流行的人工智能定义(关于这些定义在理论层面的相互关系,Stuart Russell, Peter Norvig, Artificial Intelligence: A Modern Approach, Third edition 总结得比较清楚,可以参考)。对这些定义的分析、讨论是一件相当有趣的事,这有些类似于古代哲学家们围坐在一起探讨“人何以为人”,或者,类似于科幻迷们对阿西莫夫的“机器人三定律”展开辩论。其实,很多实用主义者反对形而上的讨论,他们会大声说,“嗨,管他什么是人工智能呢?只要机器能帮助人解决问题不就行了?”\u003C\u002Fp\u003E\u003Cp\u003E【注:以下文字意在科普,尽量讲得明白浅近些,科班出身的就没必要耽误时间来读了】\u003C\u002Fp\u003E\u003Ch2\u003E定义一:AI 就是让人觉得不可思议的计算机程序\u003C\u002Fh2\u003E\u003Cp\u003E人工智能就是机器可以完成人们不认为机器能胜任的事——这个定义非常主观,但也非常有趣。一个计算机程序是不是人工智能,完全由这个程序的所作所为是不是能让人目瞪口呆来界定。这种唯经验论的定义显然缺乏一致性,会因时代不同、背景不同、评判者的经验不同而套用不同的标准。但这一定义往往反映的是一个时代里最大多数的普通人对人工智能的认知方式:每当一个新的人工智能热点出现,新闻媒体和大众总是用自己的经验来判定人工智能技术的价值高低,而不管这种技术在本质上究竟有没有“智能”。\u003C\u002Fp\u003E\u003Cp\u003E计算机下棋的历史就非常清楚地揭示了这一定义的反讽之处。\u003C\u002Fp\u003E\u003Cp\u003E早期,碍于运行速度和存储空间的限制,计算机只能用来解决相对简单的棋类博弈问题,例如西洋跳棋,但这毫不妨碍当时的人们将一台会下棋的计算机称作智能机器,因为那时,普通计算机在大多数人心目中不过是一台能用飞快的速度做算术题的机器罢了。1951 年,英国曼彻斯特大学的 Christopher Strachey 编写了第一个会下西洋跳棋的计算机程序。1950 年代中期,IBM 的 Arthur Samuel 开发的西洋跳棋程序就可以和业余选手对抗了。1962 年,Arthur Samuel 的程序战胜了一位盲人跳棋高手,一时间成了不小的新闻事件(Jill Cirasella, Danny Kopec, The History of Computer Games, 2006),绝大多数媒体和公众都认为类似的西洋跳棋程序是不折不扣的人工智能。\u003C\u002Fp\u003E\u003Cp\u003E可没过多久,不少粗通编程的人发现,计算机基本上是在用搜索或优化搜索的方式来解决博弈问题。虽然其中有各种避免穷举的算法技巧,但在公众眼中,程序只不过是按事先编写的搜索策略一步步找到最佳走棋步骤而已。随着PC机普及,每台个人电脑都可以运行一个水平相当高的西洋跳棋程序,会下棋的计算机逐渐褪去了神秘的光环。人们开始怀疑西洋跳棋程序的智能程度,不少人会用国际象棋作为例子,挑衅式地说,“下西洋跳棋有什么了不起?哪天在国际象棋棋盘上赢了世界冠军,那才叫人工智能。”\u003C\u002Fp\u003E\u003Cp\u003E后面的事情大家都很熟悉了。1996 年,IBM 研究团队倾力打造的计算机深蓝挑战世界棋王卡斯帕罗夫,当年虽遗憾败北,但人们已经看到了计算机战胜人类的希望。1997 年,深蓝卷土重来,在六局棋的对抗赛中战胜卡斯帕罗夫后声誉大振。当时,几乎全世界的人都在讨论深蓝的强大和可怕,没人怀疑深蓝就是人工智能的代表,至少,公众愿意相信,在深蓝巨大的黑色机箱内,拥有一颗在棋类博弈领域不输人类的特殊“大脑”。\u003C\u002Fp\u003E\u003Cp\u003E好景不长,与西洋跳棋相似的历史很快就再次上演。当国际象棋、中国象棋已经被计算机玩得滚瓜烂熟,连一部手机、一台平板电脑上的象棋程序都能与人类高手分庭抗礼,公众立即开始怀疑这样的博弈程序是不是还算得上人工智能。道理很简单,公众总是乐于证明人类在智慧层面的独一无二。不管是不是真的懂得算法细节,人们总会说,计算机只不过是在程序控制下机械地完成搜索或穷举罢了。事实上,与下棋类似的事情也发生在 OCR 等失去了新鲜感的计算机算法身上(Roger C. Schank, Where's the AI? AI Magazine Volumen 12 Number 4, 1991),本文开头提到的人脸识别也不例外。\u003C\u002Fp\u003E\u003Cp\u003E拒绝承认象棋程序是人工智能后,公众找到了维护人类智慧尊严的最后阵地——围棋。直到 2016 年年初,除了一个叫樊麾的职业围棋选手和 Google DeepMind 的一只规模不大的研发团队外,几乎所有地球人,包括围棋高手和不少计算机专家都经常会说,“下象棋有什么了不起?真有智能的话,来跟世界冠军下盘围棋试试?围棋可是一项无法穷尽搜索,需要依靠人类大局观的智力运动,是唯一一种计算机无法战胜人类的棋类比赛。”\u003C\u002Fp\u003E\u003Cp\u003E很不幸,人类的自以为是又一次被快速发展的人工智能算法无情嘲笑了。2016 年 3 月 9 日,围棋世界冠军李世石坐在 AlphaGo 面前,宿命再一次降临。随着 AlphaGo 在五番棋中以四比一大胜,有关人工智能的热情和恐慌情绪同时在全世界蔓延开来,也因此引发了一波人工智能宣传、研发和投资的热潮。\u003C\u002Fp\u003E\u003Cp\u003E今天,没有人怀疑 AlphaGo 的核心算法是人工智能。但想一想曾经的西洋跳棋和国际象棋,当时的人们不是一样对战胜了人类世界冠军的程序敬若神明吗?再过几年,当手机上的围棋程序可以轻松战胜职业棋手,当所有围棋比赛都要严查手机作弊时,人们还会认为计算机下围棋是一件不可思议的事吗?人们还会将围棋程序视为人工智能的代表吗?\u003C\u002Fp\u003E\u003Ch2\u003E定义二:AI 就是与人类思考方式相似的计算机程序\u003C\u002Fh2\u003E\u003Cp\u003E这是人工智能发展早期非常流行的一种定义方式。另一种类似的,同样从思考方式本源出发的定义是:AI 就是能遵照思维里的逻辑规律进行思考的计算机程序。\u003C\u002Fp\u003E\u003Cp\u003E从根本上讲,这是一种类似仿生学的直观思路。既然叫人工智能,那用程序来模拟人的智慧就是最直截了当的做法。但历史经验证明,仿生学的思路在科技发展中不一定可行。一个最好也最著名的例子就是飞机。人类在几千年的时间里一直梦想着按照鸟类扑打翅膀的方式飞上天空,但反讽的是,真正带着人类在长空翱翔,并打破了鸟类飞行速度、飞行高度纪录的,是飞行原理与鸟类差别极大的固定翼飞机。\u003C\u002Fp\u003E\u003Cp\u003E人类思考方式?人究竟是怎样思考的?这本身就是一个复杂的技术和哲学问题。要了解人类自身的思考方式,哲学家们试图通过反省与思辨,找到人类思维的逻辑法则,而科学家们则通过心理学和生物学实验,了解人类在思考时的身心变化规律。这两条道路都在人工智能的发展历史上起到过极为重要的作用。\u003C\u002Fp\u003E\u003Cp\u003E思维法则,或者说,逻辑学,是一个人的思考过程是不是理性的最高判定标准。从古希腊的先贤们开始,形式逻辑,数理逻辑,语言逻辑,认知逻辑等分支在数千年的积累和发展过程中,总结出大量规律性的法则,并成功地为几乎所有科学研究提供了方法论层面的指导。让计算机中的人工智能程序遵循逻辑学的基本规律进行运算、归纳或推演,这是许多早期人工智能研究者的最大追求。\u003C\u002Fp\u003E\u003Cp\u003E世界上第一个专家系统程序 Dendral 是一个成功地用人类专家知识和逻辑推理规则解决一个特定领域问题的例子。这是一个由斯坦福大学的研究者用 Lisp 语言写成的,帮助有机化学家根据物质光谱推断未知有机分子结构的程序。Dendral 项目在 1960 年代中期取得了令人瞩目的成功,衍生出一大批根据物质光谱推断物质结构的智能程序(\u003Ca href=\&https:\u002F\u002Fen.wikipedia.org\u002Fwiki\u002FDendral\& data-editable=\&true\& data-title=\&Dendral\& class=\&\&\u003EDendral\u003C\u002Fa\u003E)。\u003C\u002Fp\u003E\u003Cp\u003EDendral 之所以能在限定的领域解决问题,一是依赖于化学家们积累的有关何种分子机构可能产生何种光谱的经验知识,一是依赖符合人类逻辑推理规律的大量判定规则。Dendral 的成功事实上带动了专家系统在人工智能各相关领域的广泛应用,从机器翻译到语音识别,从军事决策到资源勘探。一时间,专家系统似乎就是人工智能的代名词,其热度不亚于今天的深度学习。\u003C\u002Fp\u003E\u003Cp\u003E但人们很快就发现了基于人类知识库和逻辑学规则构建人工智能系统的局限。一个解决特定的、狭小领域问题的专家系统很难被扩展到稍微宽广一些的知识领域中,更别提扩展到基于世界知识的日常生活里了。一个著名的例子是早期人们用语法规则与词汇对照表来实现机器翻译时的窘境。1957 年苏联发射世界上第一颗人造卫星后,美国政府和军方急于使用机器翻译系统了解苏联科技动态。但用语法规则和词汇对照表实现的俄语到英语的机器翻译系统笑话百出,曾把“心有余而力不足(the spirit is willing but the flesh is weak)”翻译为“伏特加不错而肉都烂掉了(the vodka is good but the meat is rotten)”,完全无法处理自然语言中的歧义和丰富多样的表达方式(Stuart Russell, Peter Norvig, Artificial Intelligence: A Modern Approach, Third edition)。在后起的统计模型、机器学习等技术面前,专家系统毫无优势可言,从 1990 年代开始就备受冷落。科研机构甚至不得不解雇过时的语言学家,以跟上技术进展的脚步。\u003C\u002Fp\u003E\u003Cp\u003E另一方面,从心理学和生物学出发,科学家们试图弄清楚人的大脑到底是怎么工作的,并希望按照大脑的工作原理构建计算机程序,实现“真正”的人工智能。这条道路上同样布满荆棘。最跌宕起伏的例子,非神经网络莫属。\u003C\u002Fp\u003E\u003Cp\u003E生物学家和心理学家很早就开始研究人类大脑的工作方式,其中最重要的一环,就是大脑神经元对信息(刺激)的处理和传播过程。早在通用电子计算机出现之前,科学家们就已经提出了有关神经元处理信息的假想模型,即,人类大脑中的数量庞大的神经元共同组成一个相互协作的网络结构,信息(刺激)通过若干层神经元的增强、衰减或屏蔽处理后,作为系统的输出信号,控制人体对环境刺激的反应(动作)。1950 年代,早期人工智能研究者将神经网络用于模式识别,用计算机算法模拟神经元对输入信号的处理过程,并根据信号经过多层神经元后得到的输出结果对算法参数进行修正。\u003C\u002Fp\u003E\u003Cp\u003E早期神经网络技术没有发展太久就陷入低谷。这主要有两个原因,一是当时的人工神经网络算法在处理某些特定问题时有先天局限,亟待理论突破,二是当时的计算机运算能力无法满足人工神经网络的需要。1970 到 1980 年代,人工神经网络的理论难题得到解决。1990 年代开始,随着计算机运算能力的飞速发展,神经网络在人工智能领域重新变成研究热点。但直到 2010 年前后,支持深度神经网络的计算机集群才开始得到广泛应用,供深度学习系统训练使用的大规模数据集也越来越多。神经网络这一仿生学概念在人工智能的新一轮复兴中,真正扮演了至关重要的核心角色。\u003C\u002Fp\u003E\u003Cp\u003E客观地说,神经网络到底在多大程度上精确反映了人类大脑的工作方式,这仍然存在争议。在仿生学的道路上,最本质的问题是,人类至今对大脑如何实现学习、记忆、归纳、推理等思维过程的机理还缺乏认识,况且,我们并不知道,到底要在哪一个层面(大脑各功能区相互作用的层面?细胞之间交换化学物质和电信号的层面?还是分子和原子运动的层面?)真实模拟人脑的运作,才能制造出可以匹敌人类智慧的智能机器。\u003C\u002Fp\u003E\u003Ch2\u003E定义三:AI 就是与人类行为相似的计算机程序\u003C\u002Fh2\u003E\u003Cp\u003E和仿生学派强调对人脑的研究与模仿不同,实用主义者从不觉得人工智能的实现必须遵循什么规则或理论框架。“黑猫白猫,逮住耗子就是好猫。”在人工智能的语境下,这句话可以被改造成,“简单程序,复杂程序,聪明管用就是好程序。”\u003C\u002Fp\u003E\u003Cp\u003E也就是说,无论计算机以何种方式实现某一功能,只要该功能表现得与人在类似环境下的行为相似,就可以说,这个计算机程序拥有了在该领域内的人工智能。这一定义从近似于人类行为的最终结果出发,忽视达到这一结果的手段。另一种对人工智能的近似定义则更强调人工智能的实用色彩:AI 就是可以解决问题并获得最大收益的计算机程序。\u003C\u002Fp\u003E\u003Cp\u003E略懂些编程的人都知道,几乎所有程序设计语言都提供了类似 if ... else ... 的分支结构,那么,与 if ... else ... 相关的一个哲学问题是,程序根据某个条件进行判断并完成相应操作的时候,这个“判断”以及随后的“决定”是由计算机自己做出的,还是由编程序的人做出的?如果是由计算机自己做出的,那能不能说所有执行了 if ... else ... 语句的计算机程序都是人工智能?如果相反,那计算机根据运行时的情况做决策时,人又在哪里呢?\u003C\u002Fp\u003E\u003Cp\u003E哲学思辨容易陷入这样的两难境地,但实用主义者根本不把这当回事——执行 if ... else ... 的程序是否有智能,完全要看那个程序是不是做了和人相似的有智能的事。像 Dendral 这样的专家系统就是靠大量 if ... else ... 来模仿人类专家的判定规则,这当然属于人工智能的范畴,而普通的数值计算程序即便用了 if ... else ...,也不能被称作智能。\u003C\u002Fp\u003E\u003Cp\u003E实用主义者推崇备至的一个例子是麻省理工学院于 1964 到 1966 年间开发的“智能”聊天程序 ELIZA。那个程序看上去就像一个有无穷耐心的心理医生,可以和无聊的人或需要谈话治疗的精神病人你一句我一句永不停歇地聊下去。当年, ELIZA 的聊天记录让许多人不敢相信自己的眼睛。可事实上,ELIZA 所做的,不过是在用户输入的句子里,找到一些预先定义好的关键词,然后根据关键词从预定的回答中选择一句,或者简单将用户的输入做了人称替换后,再次输出,就像心理医生重复病人的话那样。ELIZA 心里只有词表和映射规则,它才不懂用户说的话是什么意思呢。\u003C\u002Fp\u003E\u003Cp\u003E这种实用主义的思想在今天仍有很强的现实意义。比如今天的深度学习模型在处理机器翻译、语音识别、主题抽取等自然语言相关的问题时,基本上都是将输入的文句看成由音素、音节、字或词组成的信号序列,然后将这些信号一股脑塞进深度神经网络里进行训练。深度神经网络内部,每层神经元的输入输出信号可能相当复杂,复杂到编程者并不一定清楚这些中间信号在自然语言中的真实含义,但没有关系,只要整个模型的最终输出满足要求,这样的深度学习算法就可以工作得很好。在研究者看来,深度学习模型是不是真的跟人类大脑神经元理解自然语言的过程类似,这一点儿都不重要,重要的是,整个模型可以聪明地工作,最终结果看起来就像人做的一样。\u003C\u002Fp\u003E\u003Ch2\u003E定义四:AI 就是会学习的计算机程序\u003C\u002Fh2\u003E\u003Cp\u003E没有哪个完美主义者会喜欢这个定义。这一定义几乎将人工智能与机器学习等同了起来。但这的确是最近这波人工智能热潮里,人工智能在许多人眼中的真实模样。谁让深度学习一枝独秀,几乎垄断了人工智能领域里所有流行的技术方向呢?\u003C\u002Fp\u003E\u003Cp\u003E1980 到 1990 年代,人们还在专家系统和统计模型之间摇摆不定,机器学习固守着自己在数据挖掘领域的牢固阵地远远观望。短短十几年过去,从 2000 到 2010 年,机器学习开始逐渐爆发出惊人的威力,并最早在计算机视觉领域实现了惊人的突破。2010 年至今,使用深度学习模型的图像算法在 ImageNet 竞赛中显著降低了对象识别、定位的错误率,领先的算法已经达到了比人眼更高的识别准确率(\u003Ca href=\&http:\u002F\u002Fimage-net.org\u002F\& data-editable=\&true\& data-title=\&ImageNet\& class=\&\&\u003EImageNet\u003C\u002Fa\u003E)。2015 年,语音识别依靠深度学习获得了大约 49% 的性能提升(\u003Ca href=\&http:\u002F\u002Fgoogleresearch.blogspot.ch\u002F\u002Fgoogle-voice-search-faster-and-more.html\& data-editable=\&true\& data-title=\&googleresearch.blogspot.ch 的页面\& class=\&\&\u003Ehttp:\u002F\u002Fgoogleresearch.blogspot.ch\u002F\u002Fgoogle-voice-search-faster-and-more.html\u003C\u002Fa\u003E)。机器翻译、机器写作等领域也在同一时期逐渐被深度学习渗透,并由此获得了大幅改进。\u003C\u002Fp\u003E\u003Cp\u003E“无学习,不AI”,这几乎成了人工智能研究在今天的核心指导思想。许多研究者更愿意将自己称为机器学习专家,而非泛泛的人工智能专家。Google 的 AlphaGo 因为学习了大量专业棋手棋谱,然后又从自我对弈中持续学习和提高,因此才有了战胜人类世界冠军的本钱。微软的小冰因为学习了大量互联网上的流行语料,才能用既时尚、又活泼的聊天方式与用户交流。媒体上,被宣传为人工智能的典型应用大多都拥有深度学习的技术基础,是计算机从大量数据资料中通过自我学习掌握经验模型的结果。\u003C\u002Fp\u003E\u003Cp\u003E这一定义似乎也符合人类认知的特点——没有哪个人是不需要学习,从小就懂得所有事情的。人的智慧离不开长大成人过程里的不间断学习。因此,今天最典型的人工智能系统通过学习大量数据训练经验模型的方法,其实可以被看成是模拟了人类学习和成长的全过程。如果说人工智能未来可以突破到强人工智能甚至超人工智能的层次,那从逻辑上说,在所有人工智能技术中,机器学习最有可能扮演核心推动者的角色。\u003C\u002Fp\u003E\u003Cp\u003E当然,机器目前的主流学习方法和人类的学习还存在很大的差别。举个最简单的例子:目前的计算机视觉系统在看过数百万张或更多自行车的照片后,很容易辨别出什么是自行车,什么不是自行车,这种需要大量训练照片的学习方式看上去还比较笨拙。反观人类,给一个三四岁的小孩子看一辆自行车之后,再见到哪怕外观完全不同的自行车,小孩子也十有八九能做出那是一辆自行车的判断。也就是说,人类的学习过程往往不需要大规模的训练数据。这一差别给人类带来的优势是全方位的。面对繁纷复杂的世界知识,人类可以用自己卓越的抽象能力,仅凭少数个例,就归纳出可以举一反三的规则、原理甚至更高层次上的思维模式、哲学内涵等等。最近,尽管研究者提出了迁移学习等新的解决方案,但从总体上说,计算机的学习水平还远远达不到人类的境界。\u003C\u002Fp\u003E\u003Cp\u003E如果人工智能是一种会学习的机器,那未来需要着重提高的,就是让机器在学习时的抽象或归纳能力向人类看齐。\u003C\u002Fp\u003E\u003Ch2\u003E定义五:AI 就是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序\u003C\u002Fh2\u003E\u003Cp\u003E针对人工智能,不同的定义将人们导向不同的研究或认知方向,不同的理解分别适用于不同的人群和语境。如果非要调和所有看上去合理的定义,我们得到的也许就只是一个全面但过于笼统、模糊的概念。\u003C\u002Fp\u003E\u003Cp\u003E维基百科的人工智能词条采用的是 Stuart Russell 与 Peter Norvig 的定义(Stuart Russell, Peter Norvig, Artificial Intelligence: A Modern Approach, Third edition),他们认为,人工智能是有关“智能主体(Intelligent agent)的研究与设计”的学问,而“智能主体是指一个可以观察周遭环境并作出行动以达致目标的系统”(\u003Ca href=\&https:\u002F\u002Fzh.wikipedia.org\u002Fwiki\u002F%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD\& data-title=\&https:\u002F\u002Fzh.wikipedia.org\u002Fwiki\u002F人工智能\& class=\&\&\u003Ehttps:\u002F\u002Fzh.wikipedia.org\u002Fwiki\u002F人工智能\u003C\u002Fa\u003E)。\u003C\u002Fp\u003E\u003Cp\u003E坦率地说,这个定义将上面几个实用主义的定义都涵盖了进去,既强调人工智能可以根据环境感知做出主动反应,又强调人工智能所做出的反应必须达致目标,同时,不再强调人工智能对人类思维方式,或人类总结的思维法则(逻辑学规律)的模仿。\u003C\u002Fp\u003E\u003Cp\u003E基本上,偏重实证是近来人工智能研究者的主流倾向。如前所述,在今天这个结果至上的时代里,没有多少人愿意花心思推敲人工智能到底该如何定义。有那个时间,还不如去跑几个深度学习的新模型,发几篇深度学习新算法的论文来得合算。\u003C\u002Fp\u003E&,&updated&:new Date(&T15:01:13.000Z&),&canComment&:false,&commentPermission&:&anyone&,&commentCount&:9,&likeCount&:89,&state&:&published&,&isLiked&:false,&slug&:&&,&isTitleImageFullScreen&:false,&rating&:&none&,&sourceUrl&:&&,&publishedTime&:&T23:01:13+08:00&,&links&:{&comments&:&\u002Fapi\u002Fposts\u002F2Fcomments&},&url&:&\u002Fp\u002F&,&titleImage&:&https:\u002F\u002Fpic3.zhimg.com\u002Fv2-ba315f296b81_r.jpg&,&summary&:&&,&href&:&\u002Fapi\u002Fposts\u002F&,&meta&:{&previous&:null,&next&:null},&snapshotUrl&:&&,&commentsCount&:9,&likesCount&:89},&&:{&title&:&AI领域,中国人\u002F华人有多牛?&,&author&:&ygwang&,&content&:&\u003Cp\u003E人工智能这把火已经烧到了国家战略层面,连美国总统和政府机构也卷了进来。上周四,奥巴马主持白宫前沿峰会,展望美国在未来50年的发展。峰会中,白宫发布报告《\u003Ca href=\&https:\u002F\u002Fwww.whitehouse.gov\u002Fsites\u002Fdefault\u002Ffiles\u002Fwhitehouse_files\u002Fmicrosites\u002Fostp\u002FNSTC\u002Fnational_ai_rd_strategic_plan.pdf\& data-title=\&国家人工智能研究与发展策略规划\& class=\&\& data-editable=\&true\&\u003E国家人工智能研究与发展策略规划\u003C\u002Fa\u003E》。相关情况,大家可以参考《连线》杂志的总统专访(\u003Ca href=\&https:\u002F\u002Fwww.wired.com\u002F\u002Fpresident-obama-mit-joi-ito-interview\u002F\& class=\&\& data-editable=\&true\& data-title=\&Barack Obama on Artificial Intelligence, Autonomous Cars, and the Future of Humanity\&\u003EBarack Obama on Artificial Intelligence, Autonomous Cars, and the Future of Humanity\u003C\u002Fa\u003E) 。\u003C\u002Fp\u003E\u003Cp\u003E这两天,自媒体没少炒作这个报告;我自己呢,倒是特别地对这个报告中的两张趋势图感兴趣。报告中说,从2013年到2015年,SCI收录的论文里,提到“深度学习”的文章增长了约六倍,同时强调,“按文章数计算,美国已不再是世界第一了。”\u003C\u002Fp\u003E\u003Cp\u003E美国不是世界第一?谁是世界第一呢?来看报告中的两张趋势图:\u003C\u002Fp\u003E\u003Cimg src=\&v2-9fb63e75f92d74252add850f873a48ef.png\& data-rawwidth=\&710\& data-rawheight=\&507\&\u003E\u003Cp\u003E上图是每年SCI收录的文章里,提到“深度学习”或“深度神经网络”的文章数量变化趋势,同时按国家做了区分。数据本身是从Web of Science核心数据库里查询得到的。\u003C\u002Fp\u003E\u003Cimg src=\&v2-522ee5e3c34e44c25085.png\& data-rawwidth=\&716\& data-rawheight=\&520\&\u003E\u003Cp\u003E第二张图和第一张图其他条件一样,只是增加了一个“文章必须至少被引用一次”的附加条件。也就是说,第二张图统计的文章数,是被引用过的“有效文章数”,相对来说更合理一些。\u003C\u002Fp\u003E\u003Cp\u003E两张图里,中国都在2014年和2015年超过了美国(以及其他所有第二梯队的国家),居于领跑者的位置。\u003C\u002Fp\u003E\u003Ch2\u003E问题来了,在AI研究领域,中国人真有这么强吗?\u003C\u002Fh2\u003E\u003Cp\u003E从这些年的直觉看,中国人\u002F华人在人工智能领域里的大牛比比皆是,吴恩达、孙剑、杨强、黄广斌、马毅、张大鹏 ……随口可以说出一大串,我自己在Google的研究团队,微软研究院等地亲眼看到的,也到处是中国人、华人的面孔。但这只是直观感受。整体来看,中国人\u002F华人所做的科研贡献到底有多重要,对人工智能的推动作用到底有多大?白宫报告里的统计是不是科学、合理?\u003C\u002Fp\u003E\u003Cp\u003E其实,对美国国家战略规划里的统计,我自己是有几个疑问的,主要包括:\u003C\u002Fp\u003E\u003Cul\u003E\u003Cli\u003E直接搜索关键字“深度学习”、“深度神经网络”,真的能涵盖这些年人工智能领域的所有科学研究进展?像机器人、智能控制、机器视觉、无人驾驶等领域里,没有提及深度学习的文章眼见还有不少。严格按关键词匹配会漏掉多少相关文章?是否影响统计结果?\u003Cbr\u003E\u003C\u002Fli\u003E\u003Cli\u003E“文章至少被引用一次”,比较科学,但好像还远远不够。这种统计,真的不需要考虑SCI的影响因子吗?不考虑的话,会混进多少较差期刊上发表的比较水的论文?这些数据会不会被国内研究机构靠SCI引用数来评职称的风气污染?\u003Cbr\u003E\u003C\u002Fli\u003E\u003Cli\u003E在全球化时代,按国家统计,会不会有明显偏差?白宫报告没有提到被统计的文章是如何归入不同国家的。如果按作者发表文章时的所在机构,那大量在国外机构访问的中国学者会不会被算成外国人?中国人和外国人合写的文章该如何统计?如果按期刊所属国家和地区,那不同国家间的期刊水平(影响因子)差异是不是会让统计结果带有偏见?\u003Cbr\u003E\u003C\u002Fli\u003E\u003C\u002Ful\u003E\u003Cbr\u003E\u003Cp\u003E基于此,我也想自己去做个统计。\u003C\u002Fp\u003E\u003Cp\u003E统计前,给自己设了几条原则:\u003C\u002Fp\u003E\u003Cul\u003E\u003Cli\u003E从期刊的SCI影响因子出发,只统计影响因子高的顶尖期刊。\u003Cbr\u003E\u003C\u002Fli\u003E\u003Cli\u003E从Web of Science主题词出发,涵盖人工智能相关的所有科研领域,而不仅是深度学习方面的文章。\u003Cbr\u003E\u003C\u002Fli\u003E\u003Cli\u003E文章要求至少被引用一次。\u003Cbr\u003E\u003C\u002Fli\u003E\u003Cli\u003E关注对象是华人,而不是用国家分类的办法去比较中国和外国——这个是我自己的选择,因为今天的学术界,国家间的合作和交流已不可忽视。类似吴恩达这样的外籍华人,其实也在为中国的人工智能发展做贡献,百度首席科学家嘛(有人说吴恩达是越南裔,我没找到出处,只知道他父母是香港人;也许有机会时,当面问问Andrew?)。与其限定国家,不如从整体上看一看,地球上的华人科学家、研究者群体,到底有多厉害。\u003Cbr\u003E\u003C\u002Fli\u003E\u003Cli\u003E关注时间范围是年,跨度10年左右——因为许多人说,这一波人工智能大潮是从2006后的几年时间里,才开始真正兴起的。\u003Cbr\u003E\u003C\u002Fli\u003E\u003C\u002Ful\u003E\u003Cbr\u003E\u003Ch2\u003E我的统计结果\u003C\u002Fh2\u003E\u003Cp\u003E先说说我的统计结果,一会儿会在附录一中讲讲我用的统计方法。\u003C\u002Fp\u003E\u003Cp\u003E来看下年间华人作者的平均贡献:\u003C\u002Fp\u003E\u003Cimg src=\&v2-a36e23ffdf05aa9ab6d2f611bc7c4488.png\& data-rawwidth=\&1239\& data-rawheight=\&785\&\u003E\u003Cp\u003E在年的时间段里,近两万篇最顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29.2%和31.8%。近十年,华人用五分之一左右的作者人数,平均贡献了三成的顶级AI研究文章和被引用数。统计角度,这已经是超出平均水平的科研贡献了。\u003C\u002Fp\u003E\u003Cp\u003E但平均数并不能看出华人科学家、研究者在最近几年的发力程度。来看年间,华人贡献的文章数和被引用数的变化趋势:\u003C\u002Fp\u003E\u003Cimg src=\&v2-88fcd41fcbfa7ef8b4be1ea.png\& data-rawwidth=\&1299\& data-rawheight=\&783\&\u003E\u003Cp\u003E年间,华人作者参与的顶级AI论文,占全部顶级AI论文数量的比例,从23.2%逐年递增到42.8%。而华人作者参与的顶级AI论文被引用次数,占全部顶级AI论文被引用次数的比例从25.5%逐年递增到55.8%(2016 年数据较少,未用于趋势比较)。\u003C\u002Fp\u003E\u003Cp\u003E也就是说,即便只统计顶级出版物里的顶级文章,中国人\u002F华人在人工智能领域的贡献,在发展趋势上也和白宫报告中揭示的规律如出一辙——无论从哪个角度来说,中国人\u002F华人正在人工智能领域里发挥举足轻重的作用,而且,从2014年,2015年开始,中国人\u002F华人已经处于人工智能研究的领先地位,占据了人工智能科研世界的半壁江山!\u003C\u002Fp\u003E\u003Ch2\u003E个案分析\u003C\u002Fh2\u003E\u003Cp\u003E会有人觉得这个统计很不可思议吗?这个结果会出乎很多人意料吗?我们还可以拿一个更具体的例子,来深入分析一下。\u003C\u002Fp\u003E\u003Cp\u003E在顶级人工智能期刊里,我来举个大名鼎鼎的例子吧:IEEE模式分析与机器智能汇刊(IEEE Transactions on Pattern Analysis and Machine Intelligence,简称PAMI),2015年影响因子6.077,高到没朋友,想往这里投稿的同学可能都知道被接受和发表的难度有多恐怖。\u003C\u002Fp\u003E\u003Cp\u003E我从《IEEE模式分析与机器智能汇刊》里按引用数选出年间的前500篇论文,下面是这500篇论文的引用数分布情况:\u003C\u002Fp\u003E\u003Cimg src=\&v2-f680b26de840ad8a0ad08.png\& data-rawwidth=\&1136\& data-rawheight=\&633\&\u003E\u003Cp\u003E其实很恐怖的,前500篇文章最高引用数2715,最低引用数41——真顶级期刊!普通期刊难以望其项背呀。\u003C\u002Fp\u003E\u003Cp\u003E那么,这500篇最顶级的人工智能论文里,华人科学家、研究者的贡献如何呢?先说几个数字:500篇顶级文章的作者一共1220人,其中华人科学家、研究者316人,占25.9%。所有作者单独累加计算的被引用数总和是231361次,其中,华人科学家、研究者被引用数总和是63846 次,占27.6%。如果单看2014年(当年华人的文章数、引用数均较高)的数据,华人科学家、研究者被引用数占51.8%,超过了半数。\u003C\u002Fp\u003E\u003Cimg src=\&v2-dda3c82d9a670b2a2cefcd4.png\& data-rawwidth=\&1540\& data-rawheight=\&843\&\u003E\u003Cp\u003E如果只看《IEEE模式分析与机器智能汇刊》在年间,引用数最多的10位华人作者和10位非华人作者的具体情况,也是一个很有趣的表格:\u003C\u002Fp\u003E\u003Cimg src=\&v2-ce61ede7fd9c.png\& data-rawwidth=\&2576\& data-rawheight=\&1476\&\u003E\u003Cp\u003E《IEEE模式分析与机器智能汇刊》的华人前10位大牛,与非华人前10位大牛,在每个人的总引用数上几乎不相上下。的确,最顶尖的人工智能科学家里,中国人\u002F华人的贡献丝毫不亚于其他科学家。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E另外,如果对人工智能特别是模式识别的研究领域不熟悉,那么,记住表中这20位顶尖科学家的名字吧。有兴趣的话,大家可以去搜一搜他们的简历,看看他们都在哪里工作,在哪里做研究,他们的学生、同事都是谁,相信会有很多发现。\u003C\u002Fp\u003E\u003Ch2\u003E原因?\u003C\u002Fh2\u003E\u003Cp\u003E为什么中国人\u002F华人在人工智能领域这么强?因为数学好?因为兴趣使然?因为思维习惯?因为勤奋?因为教育?大家可能都有自己的答案。\u003C\u002Fp\u003E\u003Cp\u003E本文不想展开讨论,列举数据和事实,才是本文的目的。\u003C\u002Fp\u003E\u003Ch2\u003E附录一:统计方法介绍\u003C\u002Fh2\u003E\u003Cp\u003E简单介绍一下我是怎么得到上面那些比例和趋势数据的。\u003C\u002Fp\u003E\u003Cp\u003E周末,我先去Web of Science数据库里,找到Computer Science \u002F Artificial Intelligence的主题类目,根据2015年SCI影响因子

我要回帖

更多关于 投资领域人工智能应用 的文章

 

随机推荐