为什么开发者在国内智能手表电视领域举步维艰

同学已是年薪百万,他却沦落到月薪3000,且看他是如何扭转乾坤的?
作者:常远
来源:硕士博士圈(phdmaster)
他少年成名,26岁纵横江湖,从合成做到识别,从识别做到了评测,从评测做到了翻译,连续8年在国际大赛中获得一路第一,并将市值从32亿做到近900亿,9年增长28倍,他就是科大讯飞的董事长,刘庆峰。
1973年,刘庆峰出生于安徽泾县。泾县风景优美,黄山余脉、九华山支脉穿境而过,更有烟波浩渺的太平湖点缀其中。2000年前,李白应泾县名士汪伦之邀请,畅游桃花潭,豪饮于“万家酒店”,临别留下“桃花潭水深千尺,不及汪伦送我情”的千古绝句。
不过,到了上个世纪五、六十年代,自然科学更加吃香,“学好数理化,走遍天下都不怕,”尤其是1978年,少年天才宁铂的故事传遍大江南北。受此影响,刘庆峰5岁就开始喜欢数学,母亲上街卖菜,他就在旁边算数,经常是母亲刚把菜称完,刘庆峰已经噼里啪啦算好了价钱,包括要找的零钱。
到了初中,刘庆峰开始自学立体几何、微积分、线性代数。1985年,12岁的他参加泾县初中数学、物理竞赛,结果包揽两个第一,隔年又以全县第一的成绩考入宣城中学。
刚入宣城中学,刘庆峰就发誓要报考中科大,“当时是国内最难考的大学,也是少年时的梦想。”以至于1990年,他被推荐到清华汽车工程专业时,想都没想就放弃了,转而参加当年的高考,最终以高出清华录取分数线40分的成绩,被中科大电子工程系录取。
中科大有这么大的魅力?没错,作为国内第一家开班少年班的高校,神童的号召力排山倒海,当年,与刘庆峰一起进入中科大的,还有13个省市的高考状元。
不过,天才就是天才。在高手云集的中科大,刘庆峰入校后的第一次高等数学、理论物理摸底考试就在77人中考了两个第一。此后,数理方程、力学、电磁场、光学等课程都是全系第一。刘庆峰可不只是学习好,人缘也好,口才也棒,于是顺理成章当上了班长。
你知道的,作为偏距合肥一角的中科大,在国内虽然名声也很大,但真正扬名的却是海外,尤其是在美国高校的数学界、物理界,“遇到的5个华人教授,有4个是中科大毕业的。”所以,很多中科大的大学生都是把出国深造作为大学4年的终极目标。
刘庆峰也一样。大二那年,他开始酝酿转学到数学系,“数学系和物理系出国的机会最多。”没有想到的是,1992年五一刚过,王仁华教授就敲开了宿舍的门。
王仁华教授是谁?中科大电子工程系的博导,曾在日本东京大学做过访问学者,是我国著名的人机语音通信,数字信号处理专家,他一眼就相中了19岁的刘庆峰,“数理计算能力强,是个语音技术研究的好苗子。”
什么是语音研究?刘庆峰有点发蒙,直到他第一次走进人机语音实验室,亲眼看到通过一排排的计算机合成人声,他被震撼了,“原来数学还可以用来做数字信号处理。”从此,刘庆峰就决定跟着王仁华教授。
老先生很开明,只管大的研究方向,具体试验充分放手。所以,大三刘庆峰就带队参加了国家863项目,要知道,即便是在学风相当开放的中科大,能够进入实验室最起码也得是硕士。
当然,刘庆峰确实争气。1995年下半年,老先生提到日本的语音分析工具效率太低,“有没有提升空间?”结果刘庆峰仅用了一个月不到的时间,就将效率提高整整10倍。
4年磨一剑,1996年,已是研二的刘庆峰获得中国科学院院长奖学金特别奖,“这是中科院的最高奖项,每年整个科学院系统只有10个名额。” 同年夏天,他带队参加全国“挑战杯”大学生科技作品竞赛,结果其参赛的“语音合成系统”以优良的语音自然度,毫无争议获得了一等奖,并且是唯一可达到实用门槛的作品。
也正是参加那次“挑战杯”,刘庆峰第一次意识到自己所从事的语音识别技术具有极高的门槛,“必须具备优秀的算法,强大的计算能力,和庞大的数据库支持。”他也第一次听说微软、IBM、摩托罗拉等国际巨头纷纷在中国设立语音研究基地。
“挑战杯”的一鸣惊人也惊动了深圳华为。1996年暑假,华为邀请刘庆峰去深圳优化114电话语音平台。大师兄就是大师兄,仅仅两个月就使电话语音接近于真人语音,最后华为在4万元研发经费的基础上,又追加了1万元的奖励。
“看来,语音技术真的可以实现产业化。”1996年秋天,刘庆峰拒绝了时任微软亚洲研究院李开复博士的邀请,转而向王仁华教授提议,“能否一边攻读博士,一边办公司创业?”
敢跟自己的老板提条件,这不是太岁头上动土吗?的确,换上一般的教授,估计不是博士毕不了业,就是被打入冷宫。然而,王仁华教授却立即就答应了,“当然可以,而且你的股份应该比我拿得还要多。”
听说刘庆峰要办公司,马上来了18条好汉,不但来了10多个实验室里的师兄弟,而且中科大BBS论坛中的8个版主,有6个要求加盟,包括当年电子工程系的第一名胡郁,计算机系第一名胡国平。
最有意思的是黑客版版主,网络ID名为“绝地战警”的陈涛。当初,刘庆峰邀请陈涛加盟时,陈涛也准备创业,“有一家日本的投资公司给我投资办软件公司。”刘庆峰话锋一转,“给日本人打工多没意思,搞出自主知识产权,将来能做产业霸主才过瘾。”这就样,桀骜不驯的“绝地战警”最终选择了加盟。
没有经费,18个年轻人就蜗居在租来的民房中,在闷热的夏日中夜以继日,“几乎天天吃盒饭,饿了就啃黄瓜充饥。”
刚开始,大伙认为只有研发才算是创新,才是有意义,其他诸如品牌、营销、公司注册等杂七杂八的事情纯属浪费时间。刘庆峰也是这么想的,所以前期的大量运营工作交给了一家福建企业,他自己则担任总工程师,只负责产品研发。
没有想到,团队辛辛苦苦开发出来的产品,却叫好不叫座,“在展览会上颇受好评,但一旦投放市场却举步维艰。”
更要命的是,企业家与科学家是有分歧的,技术变成产品,需要一个漫长的孵化过程,但是福建那家企业要生存,要盈利,所以强迫团队四处试错,“今天做语音PDA,明天做语音听写软件,后天又搞工商查询系统。”结果半年下来,没有一个做深做透的,企业没有赚到一分钱,团队也搞得精疲力竭。
大伙疯了!1999年五一,十几个兄弟找到刘庆峰,“要不你当CEO,要不我们就地解散!”解散?刘庆峰吓了一大跳,好不容易聚集了那么多学霸!“行!如果做不好,我半年就走人!”就这样,日,26岁的刘庆峰正式创办了科大讯飞。
合肥市的领导识货,当听说刘庆峰要搞语音合成技术,当即表态,“这些小伙子必须留在合肥,”随后,市政府下面的3家投资机构当即投了3060万。
仅靠一张蓝图就融来3000万现金?大伙彻底服了,刘庆峰也开始拔高,“做燃烧最亮的火把,要么率先燎原,要么率先熄灭。”此后,他决定通过资本的力量把民族语音产业拧成一股绳,与国际巨头们抗衡。
为此,刘庆峰逐个拜访了清华、中科院、社科院的有关教授,主要表达了三层意思。第一,中文语音产业已经被外国人掐住了喉咙,必须联合起来。第二,由科大讯飞提供项目经费,比国家划拨的经费还要多。第三,各个机构现有研究领域不变,由科大讯飞负责产业整合,同时给各个机构股权,实现成果共享。
太好了!要知道,10多年以来,那些搞中文语音的老先生们正被国外的大公司打得抬不起头来,突然有这么一个后生主动给钱、给人,“于民族感情,于经济利益,都没有理由拒绝啊。”
于是,中科院声学所、社科院语言所和清华大学等科研院校,最终跟科大讯飞结成了紧密的合作关系,刘庆峰也就此完成了我国语音产业核心源头技术的资源整合。
有了核心源头技术,很快,“畅言2000”的电脑软件问世。那是一款能把语音自动转换成文字的软件,“通过语音控制电脑,最大程度解放用户的双手。”为此,刘庆峰信心满满,“过不了两三年,科大讯飞的营收就能突破10亿,甚至100亿。”
然而,产品推向市场却根本没有人买账。
怎么回事?你想啊,团队18个人,个个都是技术出身,哪里懂什么铺市场,建渠道,做推广?而且当时正赶上国内盗版最猖獗的时候,这边畅言2000刚一面世,那边北京中关村的盗版已经走向街头。
好不容易遇到用户购买,还是些年龄偏大的老年人,操作电脑的能力弱,动不动就因为电脑本身的硬件问题来电话,而且一聊就是半个小时,其他客户根本打不进来。
既然大众消费市场不行,刘庆峰马上把方向对准企业客户。很快,生意就来了。当时,中国电信168电话信息平台采取人工录音接听,全国业务量非常大,即便500名客户代表同时在线都搞不定,而采取语音合成技术,只需50人就可以轻松解决。
中国电信是什么级别,哪怕安徽一个省会城市的单子也有1000多万元,如果30多个省会城市都采用讯飞的产品,那还得了,马上就是上亿的规模,刘庆峰那叫一个激动哦,更令团队激动的是,最终的实验效果也非常理想。
然而,激动只持续到招标前,产品在安徽电信第一次过会就惨遭淘汰。对方的理由很简单,“你们成立时间都不到一年,十几个人的团队,一点经验都没有,拿我们练手啊?我们要合作,也是跟华为那样的大企业合作。”
是啊,人家说的没错,企业合作讲究的是对等交流。
怎么办?到手的鸭子又飞了,刘庆峰不甘心,琢磨来琢磨去,最后他来了灵感,“既然电信愿意找华为合作,那我们为什么不把技术直接嵌入到华为的系统平台上呢?”
对于华为,刘庆峰不陌生,1996年研二就合作过,“对方对中科大的语音合成技术相当认可。”果然,没有费太多口舌,华为就答应在系统平台上试用语音技术。
不过,测试报告一出来,刘庆峰就疯了,“系统兼容性不强,语音合成不自然,连续性差……。”更加让人抓狂的是,对方要求一周的时间搞定,否则免谈。
接下来就是一场硬仗。在随后的一个星期里,18个人吃住全在办公室,“不分白天黑夜,几乎不眠不休。”有位副总裁回忆,“走出办公室的时间大概是下午4点,回到家倒头就睡,一直睡到第二天的中午12点,整整睡了20个小时。”
辛苦付出确实值得,后来华为的评价非常高,从此双方开始了长期合作。更重要的是,团队终于找到了一种适合自己的商业模式,“把技术嵌入合作方的系统平台上。”
到2000年底,刘庆峰拓展了包括华为、中兴、联想在内的50多个合作伙伴,公司账面也有了500多万的收入。
但是,远水救不了近火,公司一年的支出就达到1000多万,尤其在语音核心源头技术的整合,一次性投入就是3000多万,公司的那点资本金全部投入还不够。最困难的2001年8月,财务总监告诉刘庆峰,“公司账上只剩20万元,只够维持2个月”。
整个2001年,刘庆峰都在一种莫大的痛苦中煎熬。想想看,团队中的18个人,哪个不是精英?他们为了语音梦想而放弃出国留学的机会和唾手可得的百万高薪,却拿着2000多元的月薪玩命奋斗,大家图什么?
所以,当一些股东和同事询问销售数字时,那是刘庆峰最煎熬的时刻。
是捂着还是盖着?刘庆峰夜不能寐,反复掂量了2个月,最终他决定跟大家说实话。是啊,从大众消费市场,到企业客户市场,再到技术授权市场,一次次的折磨,一次次的打击,刘庆峰清醒了,“语音产业至少需要10年的时间来进行技术积累,别说过100亿,就是过1亿元规模,也不可能两三年达到。”
不过,团队中的大部分人无法接受这一现实。那段时间,大伙都在私底下议论,“语音产业到底能不能做大?”“语音业务赚不了钱,不如改做网络游戏。”“公司还不如做房地产来钱快。”
何去何从?大家都把目光投向了刘庆峰。为此,2001年底,他专门将团队拉到巢湖半汤开了两天的务虚会议。听完大家七嘴八舌地发言后,刘庆峰放出狠话,“如果不看好语音,请走人!”当然,没有一个人动窝,他也就此一锤定音,“未来,语音是公司的唯一方向。”从此,再无杂音。
不过,此时的语音已经成为一个烧钱童子,要想继续朝前走,找到金主是当务之急。
2002年,在一次全国青年大会上,刘庆峰遇到了复星集团的郭广昌,一个是科大系出身,一个是复旦系出身,成长轨迹与企业基因都高度类似,两人惺惺相惜,郭总当即表示要投资。
此后,联想投资和英特尔也相继入股。这些股东带来的不只是资金,更多的是资源和经验。
联想的那笔投资,是IT教父柳传志进军投资领域的第一笔业务,所以柳总很看重,隔三岔五就对刘庆峰面授机宜,刘庆峰也正是从柳总身上学到了诸多管理经验,不只是著名的“建班子、定战略、带队伍,”包括花60%的精力跟团队沟通,也不只是埋头研发技术。
这期间,支撑刘庆峰仍旧只有梦想与希望。当时,很多同班同学在微软、IBM、华为等已是百万年薪,而他和18人的创业团队月薪仅有可怜的2000多元。2003年年初,复星集团的副董事长来参加讯飞的董事会,看到高管团队的薪资时,当时的眼泪就下来了,“多发点工资吧,不然,团队不稳定。”刘庆峰却一摆手,“股东还在亏钱,我们应该少拿点。”
不过,山中无甲子,寒暑又一年。正由于那长达5年的坚持,科大讯飞不知不觉练就了绝世神功“一阳指”,逐步形成了以语音合成和语音识别为核心的技术体系,成为了中文语音技术标准,并开始在全球英文语音合成大赛中拿奖。
2001年底,刘庆峰带领团队在电信168和114呼叫中心的基础上,开始延伸到旅游信息服务、工商税务查询等业务,“以智能语音替代人工服务。”2002年上半年,他一举开发智能语音芯片,植入家用电器、车载系统和儿童玩具等终端设备。
人工智能的风终于来了!2004年,科大讯飞扭亏为盈,从2005年开始,连续3年保持净利润130%的复合增长,2007年,营收更是达到历史性的2亿元,净利润突破5300万。
2008年 5月12日,汶川地震永远留在了全国人民的记忆中。不过,也就是这一天,科大讯飞成功登陆深交所,成为中国第一个由在校大学生创业的上市公司,也是中国语音产业唯一的上市公司。
上市以后,名气上来了,也有了业绩压力。如何才能让自己的核心技术变现呢?很快,他从与中国移动、中国电信等运营商合作中找到突破口,通过搜索歌曲、定制彩铃,收入分成。2010年,刘庆峰一举搞定了7000万元的收入。沿着这思路,科大讯飞开始在客服、车载、教育、云平台等4个方面发力。
第一、做大客服行业
银行、保险和电信的客户服务中心,每天都要接听10多万通客服电话,产生几十万条电话录音,“很难一个个去测听,了解用户诉求。”而讯飞的智能语音客服能够实现全网运营,“通过关键词实现语音信息检索、语音导航,”包括后来推出的“晓曼”智能客服机器人更是集成讯飞超脑的绝大多数阶段性成果,一举减少80%的人工工作量,先后在中国移动,中国平安、建设银行、徽商银行等行业展开应用,打造面向服务行业的机器人产业链。
第二、瞄准车载市场
老司机都知道,开车过程中只能动口不能动手,因为车祸就是一瞬间的事。刘庆峰敏锐地发现了司机的这一纠结,“车载语音是刚需”。当然,他不是第一个看到的,奔驰、宝马等厂家很早就注意到这个市场了,但苦于一直无法逾越行车过程中的噪音,“语音识别率40%都到不了,无法商业化。”
不过,刘庆峰一出手,情况就不一样了。在2013年德国全球语音技术评测会议上,即便在时速超过100公里的高速公路上,讯飞的语音识别技术依然高达98%,从此,刘庆峰的背后就有了奔驰、宝马、奥迪、福特和沃尔沃等汽车厂商,奇瑞前装轿车出货量更是突破百万辆。
第三、通过普通话测试撬开教育市场
中国经济一火,带动了老外的普通话测试,并孕育出一个上亿规模的市场。”5年前,国际上的几大巨头都找过教育部普通话测试中心,想要用语音技术替代人工,但最后都倒在了普通话的技术标准上。
但是,刘庆峰不服输。那一年,他去了全国10多个考点观摩普通话考试,发现每个考点的老师每天都要测试上千考生,一天下来疲惫不堪, 而这正是语音技术的强项。所以,刘庆峰放出狠话,“横竖都要搞出来,3年不成就5年,5年不成就10年。”
的确,一坚持就是4年,光研发成本就扔进去2000多万。功夫不负有心人,4年后的2008年,讯飞的普通话测试终于通过了教育部的测评。
随后,刘庆峰乘胜追击,相继搞出英语口语测试,并开发出全学科教学的畅言智能教具,“能够用标准发音进行教学,还能为学生的口语发音打分。”如今,讯飞拥有7000多万的中小学师生用户,新加坡94%的中小学校在使用讯飞的产品。
第四、开放语音云平台
经过5年的摸索,刘庆峰慢慢发现语音的应用领域实在太广阔,尤其是迅速崛起的移动互联网,彻底打开了语音技术的万花筒,“与各种终端形态结合,可以排列成几十万种商业应用。”
学苹果做封闭的业态?显然不现实,而要让用户从键盘输入的习惯切换到语音交互上,单凭讯飞一家难成大气候。所以,刘庆峰决定学习安卓,“搞开放的业态。”
于是,2010年10月,刘庆峰发布了“讯飞语音云”平台,“集成语音合成、语音搜索和语音听写等讯飞核心技术,”主要面向机器人、智能家居、智能音箱、智能家电等行业客户。
7年后,语音云平台开发者达26万,总用户数达到9亿,月活跃用户超过3亿,日服务量达30亿人次,不仅有高德、滴滴、携程、新浪微博和58同城等大公司,更多的是成千上万的中小企业。
值得一提的是,刘庆峰自己也没有闲着,他带领团队开发出灵犀语音助手、酷音铃声、讯飞音箱、车载小语点等15款终端产品,尤其是讯飞输入法,仅靠自然增长,短短5年时间就累计了2亿多客户,语音输入覆盖率超过40%,一举挤入移动端输入法前三甲。
如此开放,就不怕核心技术外泄吗?对此,刘庆峰胸有成竹,他的自信只要来自两个方面。一方面,通过与大公司合作开发APP,“借船出海,获得收入的同时,成长为世界上最大的中文语音语言数据库。”另一方面,从云平台中遴选出有潜力的创业团队,将创业型公司扶持到一定规模后通过资本市场兑现收益。
当然,关注语音技术的并非只有刘庆峰,阿里巴巴、腾讯、百度都在虎视眈眈,“未来,语音是一个重要的交互方式,包括手机、电视、玩具、汽车都是载体。”
最有意思的是腾讯的态度,“既合作又竞争。”在移动QQ上直接采用了讯飞的技术,而在微信上则采用自己的语音技术,“哪怕技术水平还有差距。”
在讯飞的广场上,有一尊雕塑叫“孺子牛”,寓意“扭转乾坤,敢为人先”。
与刘庆峰一样,讯飞的团队非常年轻,很多业务骨干都是刚刚毕业3-4年的大学生,他们稚气未脱,平均年龄不到28岁,出差坐三等座,住快捷酒店,不过所有讯飞人眼睛里都充满着对成功的渴望,而那种激情往往能够感染到客户。
讯飞输入法总用户超过4.3亿,活跃用户超过1.1亿,输入法语音输入的月覆盖率超过40%,支持方言已达19种;
灵犀语音助手用户稳步增长,活跃用户达到1600万,保持同类产品中用户规模第一。
语音合成方面,在国际最高水平的语音合成比赛Blizzard Challenge(暴风雪竞赛)中再度夺冠,七项指标全部全球第一;
语音识别领域,是业界唯一能够在实际应用场景中达到实用门槛的中文语音转写;
首次参加由Google承办的第四届CHiMEChallenge国际多通道语音分离和识别大赛就获取全部三项赛事的第一名;
常识推理方面,获得国际著名的常识推理比赛Winograd Schema Challenge2016的第一名成绩;
知识图谱方面,2016年首次参加美国国家标准技术研究院(NIST)举办的国际知识图谱构建大赛(NIST TAC Knowledge BasePopulation)并获第一名;
智能测评方面,中英文口语作文自动评价经专家鉴定,业界唯一达到实用水平;
无疑,在这场人工智能的风口中,讯飞是一颗最闪亮的星星。2012年以后,科大讯飞在感知智能、认知智能以及感知智能等与认知智能的深度结合等领域,均取得达到显著研究,讯飞超脑也成为网络搜索热词,甚至进入政府高层的法眼。
今年6月27日,《MIT科技评论》评选“全球最聪明50家公司”的榜单在北京全球首发,有9家来自中国,科大讯飞竟然一举超过腾讯大疆、阿里巴巴、百度等公司,排名国内第一,全球第六。
资本市场也对刘庆峰9年的付出做出了反应。2008年,科大讯飞上市的市值是32亿,如今市值已经接近900亿,9年28倍,营收规模从上市之初的2.6亿增长到2017年的33亿。
“我本将心向明月,奈何明月照沟渠”。讯飞的发展路径也引发了投资界的巨大争议,不少价值投资者更是拿酒类、银行的评估模型来观察讯飞,认为讯飞毛利率不够高,收入增长不够快,夸大了技术门槛。
但是,对于天才的刘庆峰来说,世界上最远的距离,也许是鱼与飞鸟的距离,“一个在天,一个却深潜海底。”因为他坚信梦想不是一成不变的,不管梦想如何改变,有两件事特别重要。“一是要勤奋,努力积累;二是要做一个诚信的人。”
————END————
(版权声明:若文章涉及版权问题,敬请原作者联系我们删除。)
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
今日搜狐热点深度|人类“智能”的本质:无中生有的自觉与主动
人工智能领域的大师级人物H.A.Simon在1957年说的一段话曾经被不断地引用:“我的目标不是使你惊讶或者震惊—我能概括的最简单的方式是说现在世界上就有机器能思考、学习和创造。而且它们做这些事情的能力将快速增长直到—可见的未来—它们能处理的问题范围扩展到人类思想已经得到应用的范围。”这段话表达了在人工智能起步的时候,人们对智能类工具的期待就是造出一个完整的、独立的、与人相当的智能化机器,也许它长得与人并不相像。
那么,“智能”到底是什么?对此学术界至今也没有给出一个标准的答案。而仅仅从计算机的本质出发,分析了什么样的智能“活动”是计算机可实现的。下面通过对人的智能活动的分析来深入地探讨一下人类智能的本质特征,即使我们难以给智能下一个准确的定义。
智能显然是深藏在人(或其他生命)的大脑中的一种能力。不考虑宗教的说法,从科学的角度来看,人在出生之时,除本能以外,就知识与具体的能力而言,大脑是一片空白。然后随着一天天成长,通过、而且仅仅通过与外界的交互,人就能逐步获得越来越多的知识与能力,学会说话、走路、唱歌、写字、分析、思考等。人的智力随之不断增长,进而成为一个有健全智能的人。
这个过程与现代计算机实现的人工智能是有本质不同的。计算机实现的高级智能目前都是与领域相关的,虽然也包括一定程度的“自学习”过程,但是这些智能的基础还是大量人工直接“植入”的与领域相关的知识与能力,如针对领域中各种具体问题的算法等。而人的成长却完全不同,人仅仅依靠与外界的交互就可以获得各种高级且复杂的、与不同领域相关的能力与知识,而无须打开大脑对大脑神经元进行底层“编程”或“设置”。
显然,在人的大脑中,与生俱来就拥有了某种初始内在底层的“智慧能力”,这种能力与具体的领域知识技能无关,是一种高度抽象的能力。它让人从一片空白的无知逐步获得各种不同意义的具体的智能,包括具象的情感与抽象的逻辑认知能力。我们可以认为人具有的这种初始能力也是被“植入”的。但是它与计算机被植入的与领域相关的能力却有本质不同,这种智能在本质上与知识经验等无关,是通过与外界的交互而获得知识与经验的基础性能力。而在此基础上的“智能活动”,则是智能发挥作用的过程,也就是人思考的意识过程。如果这个过程是可以逻辑化描述的,则就能够物化为机器的行为,实现对人脑的思维机制模拟,否则就只能寻找别的方法去做机制替代。
为了方便,我们把人所具有的这种高度抽象的、与领域无关的基础性智能称之为“基础核心智能”。它不仅仅是一般意义上的智能的基础,也是人的自觉性与主动性的来源。基础核心智能与其他智能及智能活动之间的关系如下图所示。
▲ 人的智能层次示意图
对于这种基础核心智能到底是什么,我们显然知之甚少,如果不是一无所知的话。也许就像人无法揪着自己的头发将自己从地上拔起那样,这种基础核心智能也许是人自己的智能自身所永远无法认识的黑洞。如果我们不能够理解这种基础核心智能,谈论人工智能对人的完整模拟乃至超越就显得依据不足。当年那些科学家们信誓旦旦声称在10~20年内就可以造出拥有与人同样智能的机器,显然是认为我们可以掌握这种“基础核心智能”,然后将其“植入”到计算机中,从而实现完整的人工智能。
在人工智能兴起的初期,那些抽象的、与领域无关的逻辑规则,如推理、归纳等,就被认为是“基本核心智能”。但后来的实践证明虽然这些能力确实也具有与领域无关的特质,并且也许确实与“基本核心智能”相关,但远不是“基本核心智能”的关键或全部。
实现完整的、与人相当的人工智能这个梦想,至今依然非常遥远。能够战胜国际象棋世界冠军的深蓝,也只是具有特定领域内的“智能”,而不具有“基础核心智能”。所以如果它还“想”下围棋的话,它没有办法自己去学习,而是要由人再另行“植入”一套下围棋的知识与能力,那才会成为后来的AlphaGo了。
我们不知道如何描述这种“基础核心智能”,也不知道这种“基础核心智能”是否是基于“数值计算”的,或是否可以用某种算法来表达。当然,许多人相信人的智能的基础是可以用数值计算来完成的,这种信念可以追溯到古希腊时期的毕达格拉斯(约公元前580年—前500年,古希腊哲学家、数学家和音乐理论家)。他在两千多年前就坚信“万物皆数”,认为这个世界的一切问题都可以归结为数字计算问题。虽然许多智能活动属于计算问题,虽然今天用计算的方法实现了越来越多的智能类活动,但依然没有足够的证据证明人类智能的基础就是数值计算,也还没有充分的理论或实践证据证明可以用数值计算来直接完整地模拟人类的智能过程。
所以,认为用数值计算可以直接完整地实现人所拥有的智能,甚至可以超越人类的智能,更多的是一种信念,而非被理论或实践证明了的科学意义上的结论。
当然,还有人认为人脑的这类智能过程是量子过程。但是量子计算到今天还是仅仅去做一些数值算法,而没有找到其他的与人的底层智能契合的、在数值逻辑计算之外的基本机制。
▲大脑的不同区域(陶然提供)
我们对大脑内在机制的知识缺失还不仅仅限于此。
神经生理学家经过近百年的努力,已经可以将大脑的不同部位与不同的功能对应起来(见上图)。枕叶主要负责视觉加工,躯体感觉联合区接收多通道感觉信息并进行整合,顶叶主要进行感觉加工,颞叶负责语言、听觉加工,运动功能区支配肌肉、眼球等的运动,而额叶既负责推理、决策等高级认知加工过程,也是掌管人格的区域。并且,越来越多的研究发现,人类的任何一项认知加工都不仅依赖于某一侧脑区,而是由左右两侧大脑共同协作完成的,但对于特定加工会有单侧化优势(hemisphere advantage),即主要依赖于左侧半球或右侧半球来完成任务。
大脑的运动功能区左右分别交叉控制着人体的右左侧,这是两侧大脑最明显的一个分工。但是事情远非这样简单。尽管正常情况下各脑区分工明确,但我们的大脑还具有强大的动态调整能力,即可塑性。这种能力强大到了令人瞠目的地步。
2009年2月,中国中央电视台CCTV-10科教频道《科学探索》节目讲述了一个“半脑人”的故事。这个病人在刚出生不久就发高烧而被诊断为脑膜炎,当时医生认为他会有后遗症。但是他的病症不久就消失了,没有发现异常而一直健康成长。到了12岁的时候,他出现了癫痫症状。随后,癫痫发作间隔逐年缩短。在他17岁时,癫痫发作间隔已经按星期来算了,家人只好带他到武汉的大医院诊治。下图是他的脑部CT片,从中能够看到他的一侧大脑严重病变萎缩。
▲ 一侧严重萎缩了的大脑
医生看到这种情况,决定摘除已经丧失了基本功能并且严重萎缩的一侧大脑。手术后,病人的癫痫症状彻底消失,而且各种表现也一如常人。医生推断,在他小时候那次得病之后,一侧大脑就逐渐失去作用,另一侧逐步完整地接管了大脑的所有功能。这个例子似乎支持了人的大脑在正常情况下利用率不高这一结论,虽然对此结论尚有争议。
可能是因为这个病例在普通人眼里有点儿“不科学”,所以《科学探索》节目特别做了连续三期的报道。其实在世界上,这种“半脑人”并非绝无仅有。从这些半脑人身上,我们看到大脑具有高度的动态自我调整能力,生理学称代偿作用。病变的脑区所应负责的功能由剩余部分的大脑建立新的神经通路与神经联结来承担。这种能力与现在风起云涌的、可以动态配置资源的云计算分布式系统有着某种类似的地方。
下面把人脑与云计算分布式计算机系统作一下对比(见下图)。我们知道,在人的大脑底层,有海量的神经元连接在一起的大脑神经网络,每个神经元相当于一个处理单元,尽管我们不清楚在神经元内部发生的物理与生化过程是否可以被解释为数值计算过程。神经生理学家还告诉我们许多不同部位的神经元在控制着我们的某些活动。
▲人脑与云计算分布式计算机系统的对比(1)
心理学家分析的重点则是大脑外在的、可观察、可度量的各种意识行为表现。这些表象相当于大脑的各种具体应用,对应于云计算平台之上的各种具体应用。
在云计算系统中,在基础的计算、存储和网络之上,有一个动态配置管理这些资源的云平台,或称之为云中心操作系统。这个平台处于基础计算能力与具体的应用之间,从应用层面看,它隐藏在应用之下。正是这一层的存在,使得云计算分布式系统具有了高度的动态自我调整能力。
从半脑人身上能够看到,大脑在神经网络与大脑的意识/智能活动之间,应该也有一层类似云平台的功能,负责神经元网络的形成与动态调整,它不属于人的意识活动层面的功能。而现在我们对大脑的这一层的存在形式与作用机制几乎一无所知。
简而言之,我们迄今积累了丰富的心理学知识,对大脑在应用层面的表现即“智能类活动”有着比较深入全面的理解;我们也知道大脑由众多的神经元连接而成,并且知道在正常的情况下,不同的区域主管着哪些活动。但是我们不知道神经元内部过程的智能意义,也不知道这些神经元动态组织的机制。所以,我们对人类外在的上层智能活动有了相当多的了解,据此可以做出深蓝、AlphaGo那样的系统战胜人类,但是我们对大脑的本质,对智能的底层机制和过程,包括“基本核心智能”,如果不是一无所知的话,也只能说知之甚少。
尽管如此,我们还是可以努力地将人的智能的特质做一个深入的分析描述。就个人而言,我们是从一无所知的状态,通过他人的帮助教育和自己的探索而逐步具有了各种不同的智力能力。在这其中,自己主动的探索又最为重要,因为它可以突破别人的帮助的边界,而认识新的未知,抽象形成新的知识。如果我们把视野扩展到整个人类文明,就更能看出自主探索能力的重要性了。
抛开宗教的观点,我们从科学的角度来看,人类从茫然无知、一片空白的原始状态走向智慧文明,并没有外来智慧的“引导”,而是完全依靠自己的力量,依靠自己与生俱来的“基本核心智能”去发现世界,认识世界,并且改造世界,而且目前还看不到人类智能这种不断拓展能力的失效边界。这种自觉的主动性就是人类智能的最本质的特质,应该属于“基本核心智能”的基础,是其最重要的组成部分。
目前,任何人工智能系统都还不具有这种特质。人工系统需要外来的、人的智慧的植入,并且只能在人的智慧植入的范畴内,实现与人类相比非常有限的“自我学习”,远不具有探索全新未知的能力。其根本原因就在于被植入的人的智慧仅仅是人的表层智慧能力,而不是人所具有的底层根本性的智慧机制。随着人工智能的发展,虽然我们对表层能力的理解与物化更加有效,但对深层机制的认识却依然举步维艰。
近百年来,对人工智能的追求正是在这种状态下艰难前行的。
作者简介:谢耘博士,国家科技进步二等奖获得者,现任海航科技首席科学家,首都科技领军人才,清华大学电子工程系博士,教授级高级工程师。
以上内容节选自谢耘博士新书
《智能化未来:“暴力计算”开创奇迹》
《智能化未来:“暴力计算”开创的奇迹》是全面深入剖析智能化信息技术的著作。作者将历史文明视角、哲学思考、科学与技术分析、创新思维等内容有机结合在一起,既高屋建瓴又深入本质,论之有据、语言风趣易懂而又不失严谨,对信息技术提出了独特的、系统的、深刻的理念与看法,揭示出了信息技术发展的客观本质规律与趋势,以及对人类文明的颠覆性影响。
◆ 国家科技进步二等奖获得者,海航科技首席科学家 谢耘博士著。
◆ 英国帝国理工学院终身教授,英国帝国理工学院数据科学研究所所长,上海大学计算机科学学院院长 郭毅可 倾力推荐。
◆ 人工智能、区块链、深度学习、机器学习领域从业人员必看的科普书。
◆ 深入剖析智能化信息技术对人工智能、区块链、深度学习、机器学习等的影响,语言风趣易懂又不失专业性。
本书即将在京东、当当、天猫三大平台发售
敬请关注!
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
今日搜狐热点

我要回帖

更多关于 智能手表推荐 的文章

 

随机推荐