没有sirisiri链接有问题怎么办办

起了个大早,却赶了个晚集:Siri是怎么被别家甩开的?
【腾讯科技编者按】虽然先于竞争对手开发了Siri语音助手,但却未能保住先发优势,反而被和()后来居上。《华尔街日报》日前撰文分析了背后的原因,以下为原文内容。2014年末,苹果Siri团队的几名成员参加了亚马逊的一场活动。他们原以为自己可以领先于这个竞争对手。由于能够通过语音指令处理日程安排、文本消息和其他简单任务,这款发布3年的苹果产品广受欢迎。一时间,Siri似乎天下无敌。然而,当Siri团队目睹了亚马逊的一段演示视频后,前景似乎很快发生了变化。视频里是一个能用语音控制的小音箱,可以播放音乐、订购产品、搜索信息。它证明亚马逊已经具备在嘈杂背景中分离人声的能力,而且拥有一款可以远距离响应语音指令的数字助手——而Siri当时还不具备这种能力。“苹果员工的焦虑感陡然上升。”一位当晚出席活动的苹果Siri团队前成员说。丧失先发优势如今,苹果正在一个它自己开拓的产品领域奋力追赶,使得人们不禁担心这家科技巨头是否已经失去创新优势。本周一,该公司发布了HomePod,这款内置Siri的家用音箱将于今年12月正式开售。该设备可以完成Siri的各种功能,包括调节电灯和设置提醒等,但苹果却宣称它主要是一款具备一流音效的高端家庭音响系统。苹果花了好几年时间才开发出这样一款产品。该公司当天还宣布将于今年秋天对Siri进行升级,可以将英语翻译成5种语言,而且能通过对用户偏好的学习,为其提供上网、聊天和应用使用建议。苹果最多也只能算第三家进军家用音箱市场的科技巨头。亚马逊两年半以前就开始销售Echo,上月还发布了一款可以通过内置摄像头和显示器进行视频通话的设备,而且同样内置了Alexa语音助手。该公司还与很多企业展开了合作,将Alexa嵌入福特汽车、LG冰箱和通用电气的灯具之中。Alphabet去年10月发布了基于“谷歌助手”的音箱。该公司上月表示,他们将通过一款手机应用向iPhone应用提供其语音产品。今年5月也发布了一款内置其Cortana语音助手的音箱,也有望把该公司的Bixby语音助手植入家电产品。尽管已经可以兼容Apple Watch等少数其他设备,但Siri很大程度上仍然只是iPhone的一项功能。Siri的功能已经大幅增加,但竞争对手却有后来居上的迹象。多份独立研究表明,Siri在准确率方面不及Alexa或谷歌助手。成也iPhone,败也iPhone一些前高管、观察人士和客户都表示,由于缺乏紧迫感,加之难以将理念付诸实施,苹果的创新力似乎逐渐丧失。在CEO蒂姆-库克(Tim Cook)掌舵的6年间,该公司股价大幅飙升,但并未推出足以比肩乔布斯时代的突破性产品——包括iPod、iPhone和iPad。其中的原因之一或许在于iPhone本身。作为有史以来最成功的消费电子产品之一,它为苹果贡献了多数销售额,并且占据了该公司的很多精力。但苹果前高管表示,正因如此,它才限制了该公司的能力,使之难以开发与手机无关的产品——全新的语音控制设备便是其中之一。“Siri简直提供了一个教科书般的范本:它最初在技术上领先,而且拥有充裕的资金和人才,但却逐渐丧失领先优势。”科技研究和顾问公司Constellation Research首席分析师霍尔格-穆勒(Holger Mueller)说。苹果的支持者表示,该公司在竞争对手之后进入某个领域,然后占据主导。而苹果则表示,他们的创新速度在不断加快。他们过去5年的年度研发开支增至100亿美元。该公司还在从事多个潜力巨大的项目,其中就包括无人驾驶系统。苹果指出,Siri已经借助iPhone进入全球数亿用户的口袋——触角之广远超任何一个竞争对手的语音助手。“从创新角度来看,我们对公司现状很满意。这是我们基因的一部分。”苹果高级副总裁艾迪-库伊(Eddy Cue)在周一的发布会之前接受采访时说,他负责的产品中就包括Siri。苹果周一还针对开发者推出了增强现实功能,还发布了更加强大的Mac电脑。数字助理已经成为当今科技行业竞争最激烈的领域之一。行业高管表示,这些采用高效人工智能算法的产品所具备的革命意义堪比PC和智能手机,未来甚至有可能让电脑与人类展开对话、回忆之前的对话记录,并在没有按钮或触摸屏的情况下提供个性化服务。乔布斯遗作命运不济Siri是乔布斯生前推出的最后一款重要新品。他2010年开始看好这项技术,这当时还只是一家小型创业公司针对iPhone设计的数字助手应用。Siri发明人加里-莫金塔勒(Gary Morgenthaler)表示,乔布斯在45天内给他们打了30通电话,最终说服创始人把公司卖给苹果。乔布斯随后要求他们对部分功能进行微调,以便在不同语言的iPhone上流畅使用。苹果营销主管菲尔-席勒(Phil Schiller)曾在2011年将Siri称作iPhone 4s“最好的功能”,它可以将语音转换成文本,还能解读具体的含义,甚至播报天气和安排日程,并在推出后第一年帮助iPhone实现73%的出货量增长。就在发布第二天,乔布斯便与世长辞。Siri团队的前成员表示,自那之后的几年间,由于未能制定野心勃勃的目标,加之战略转移,而且越来越重视用户隐私(此举导致该公司很难实现个性化,也难以改进产品),这个项目的进度便大幅放缓。该项目还遭遇了重要成员的离职,其中一些人甚至跳槽到竞争对手那里。大约在乔布斯去世后一年,苹果挖来了亚马逊搜索高管比尔-斯塔西尔(Bill Stasior)来负责Siri。斯塔西尔在麻省理工学院研究人工智能,但他的专长在于搜索,而非语音或语言。这也导致Siri团队的部分成员认为,他不再完全认可该产品最初的目标:从iPhone向第三方应用渗透。为了将Siri嵌入更多应用——例如,可以让用户查看银行账户余额或订购汽车服务——苹果需要开发一个平台和编码工具,让开发者将这个虚拟助手整合到iPad、iPhone或Apple Watch应用中。该公司在2016年实现了这个目标。苹果拒绝让斯塔西尔接受采访,他本人也未作出回应。Siri联合创始人亚当-切耶(Adam Cheyer)和戴格-吉特劳斯(Dag Kittlaus)也已经因为个人原因离职。他们创办了一家与之竞争的公司Viv Labs,专门向第三方开发者提供语音系统。此后又有6名员工追随他们离职。三星在去年斥资2.15亿美元收购了Viv。2014年,苹果在Siri中融入了机器学习系统,利用算法来提升它的表现。库伊将这套新系统比作大脑移植,他表示,这让Siri变得更加多才多艺,使之可以理解各种表述。例如,无论你说“告诉我洋基队昨天的比分”还是“洋基队昨天比分是多少”,它都能准确理解。“Siri这种产品的关键在于不用让你为了它而专门思考。”库伊说。苹果称,Siri的错误率已经下降一半。Echo令苹果措不及防大约就在同时,亚马逊推出了Alexa和Echo音箱,开创了新的领域,还利用亚力克-鲍德温(Alec Baldwin)主演的怪异电视广告展开地毯式轰炸。短短两年,这款音箱的销量就达到1100万台。这款设备的流行令苹果措不及防。它不仅可以播放音乐,还能回答问题,甚至控制电灯和各种家电,而苹果直到最近才通过HomeKit软件系统引出了这个概念,让开发者可以设计能用Siri控制的恒温器和门锁。iPhone本应是一项巨大优势,但却成了发展障碍。苹果表示,每月约有3.75亿台苹果设备通过21种语言使用Siri,这项服务每周大约处理近20亿条请求。仅在美国,它每周的独立用户就达到7000万。相比而言,亚马逊Alexa仅支持德语和英语,而谷歌助手也只能支持7种语言。与此同时,为苹果贡献了三分之二营收的iPhone成为了内部的绝对焦点,导致苹果几乎忽视了Siri团队对虚拟助手的发展愿景,只是局限在日程安排和文本信息这些领域。相反,苹果只是支持了更多语言,并在女声的基础上增加了男声,而且允许用户在用iPhone阅读文章或查看其他内容时口头创建提醒信息。Siri前语音家、创业公司Semantic Machines CTO拉里-吉利克(Larry Gillick)表示,苹果和其他大型企业“都倾向于逐步改进”。隐私保护反成短板亚马逊和谷歌都在2016年推出了自己的语音助手。Siri前员工表示,由于他们凭借各自强大的搜索引擎对语音助手进行了训练,而且不太受制于严格的隐私政策,所以比Siri更具优势。为了保护用户隐私,苹果会随机标记Siri搜索,而且只会保留6个月的数据标记,这与谷歌和亚马逊长期保留用户数据的做法有所不同。Siri前工程师表示,由于这种做法相当于放弃了数据控制权,导致苹果难以改进Siri的使用效果。“你被打残了。”Siri搜索团队前成员詹森-道格拉斯(Jason Douglas)说,“iTunes商店有很多数据,但跟谷歌或亚马逊不是一个级别。”库伊表示,苹果往往会使用通用数据而非用户的个性化数据对系统进行训练,因而无法借助iPhone上的个性化信息改进Siri的性能。第三方对接不畅在Siri接受了“大脑移植”手术后,改进Siri对话能力的计划便暂时搁置。苹果让语言处理专家亚历克斯-阿赛洛(Alex Acero)将语音识别和自然语言两个相互竞争的团队合并起来。第一个团队是让机器学会识别人类的语音,第二个则是解决这些语音的含义。曾经任职于语音识别团队的查克-沃特斯(Chuck Wooters)表示,经历了管理层的权力斗争之后,该项目又被交给一个缺乏该领域专业技能的人负责。这一调整令一些语音识别专家感觉梦想破灭。沃特斯表示,一位专家跳槽谷歌,另一位跳槽亚马逊。沃特斯本人也加盟Semantic,这家公司正在开发一种能让虚拟助手更加健谈的技术。苹果拒绝对此置评,仍然任职于Siri团队的阿赛洛也没有发表评论。其他员工也因为苹果迟迟不愿让第三方应用使用Siri而感到心灰意冷。苹果在2013年增加了一项功能,可以使用Fandango购买电影票,但两位前员工表示,斯塔西尔搁置了将Siri与更多第三方应用对接的计划。一位苹果前工程师透露,等到该项目两年后继续推进时,苹果已经减少了新的开发者可以使用的新命令数量。去年6月,苹果在年度开发者大会上发布了大约150个新的Siri命令(他们称之为“意图”)。他们对7类应用开放了Siri,其中包括付费(Venmo)和专车(Uber)应用。相比而言,亚马逊Alexa则允许开发者自主定制命令(他们称之为“技能”),目前的总量已经达到1.2万种。借助这些命令,用户可以使用语音订购咖啡、练习冥想、查看银行余额。当时参加发布会的开发者布莱恩-罗姆勒(Brian Roemmele)表示,Siri在命令方面的局限令很多开发者感到失望。“人们原本兴致勃勃地来参加会议,但最终却发现,‘我根本不能使用。’”他说,“有的人又恢复了原先的看法,他们认为Siri永远成不了气候,于是继续为谷歌和Alexa做开发去了。”库伊表示,苹果选择向人们经常使用的应用开放Siri,而且能够理解通过不同方式表达的各种请求。“这都是你每天都会用到的东西。”他说。苹果周一宣布,开发者可以在笔记和银行等四类应用中使用Siri。准确率欠佳Siri在其他方面的能力也落后于竞争对手。数字营销公司Stone Temple表示,在5000个不同的测试问题中,Siri的准确率为62%,而谷歌助手和亚马逊Alexa都达到90%。市场研究公司Loup Ventures的另外一项研究表明,Siri在iPhone核心功能上的表现好于对手。这些功能都与指令相关,包括制定日程安排、拨打电话、发送文本信息。不过,在回答网络问题时的准确度却相对较低。苹果试图通过收购缩小差距。该公司2015年收购了英国创业公司VocalIQ,后者设计了一款可以提升虚拟助手对话能力的系统。一位苹果前工程师表示,他们的计划是通过该系统为苹果提供数据,从而让Siri更加健谈。例如,用户可以首先询问周围有哪些咖啡厅,之后还可以进一步缩小范围,从中挑选可以提供Wi-Fi的咖啡厅。谷歌助手已经开始提供这些对话能力,但Siri仍没有取得进展。“我认为没有一家公司在对话上得到了A+的成绩。”库伊说,“这是个很有挑战的问题,这一领域有很多工作要做。今后会大幅改进,也确实需要大幅改进。”(编译/长歌)推广:更多精彩内容,请微信搜索关注公众号「腾讯科技」(ID:qqtech)。
正文已结束,您可以按alt+4进行评论
责任编辑:sonicluo
扫一扫,用手机看新闻!
用微信扫描还可以
分享至好友和朋友圈
Copyright & 1998 - 2018 Tencent. All Rights Reserved中文(简体)
中文(繁體)
中文(台灣)
中文(新加坡)
中文(香港)
打开“设置”应用程序。一般来说,它位于手机主屏幕,图标是灰色齿轮(?)。
确保设备连入无线网络或蜂窝移动网络,并且禁用“飞行模式”。Siri需要连入网络才能正常运作。
滑动菜单,轻触Siri选项。它和“通用”、“电池”选项位于菜单的同一个部分。
将“Siri”的开关滑块滑动到“打开”位置。它会变成绿色。
打开锁定时访问 功能,这样当手机处于锁定模式时,也可以使用Siri。
打开 允许 “嘿Siri” 功能,你无需按下主屏幕按钮,只要说“嘿Siri”,就可以随时和Siri对话。
轻触语言按钮。它位于菜单的最后一个部分。
选择一种语言。轻触你偏好使用的一种语言来选择它。
点击屏幕左上角的Siri按钮。
点击我的信息。它也位于菜单的最后一部分。
点击你的联络人信息。将你的具体联络信息告诉Siri。
Siri从你的联络信息了解你的名字和邮箱地址等,并用联络卡片上的名字来称呼你,或执行一些常用的指令,如发送邮件等。
如果你从未在通讯录里给自己创建联络卡片,可以在主屏幕打开“通讯录”应用程序,点击右上角的 +按钮,输入你的信息,然后点击 完成。
按下Home键。Home键是位于设备前面的圆形按钮,就在屏幕正下方。这时候,你可以在设备上使用语音助手Siri啦。
点击苹果菜单。它位于屏幕左上角,图标是黑色苹果。
点击系统偏好设置。它位于下拉菜单的第二部分。
点击Siri。它位于菜单的左下方。
勾选“启用Siri”选框。它位于对话框的左侧面板中。
点击语言菜单。它位于对话框右侧面板的上部。
选择一种语言。在下拉菜单中选择你偏好的语言,点击语言即可选中它。
勾选“在菜单栏中显示Siri”。它位于对话框窗口右侧面板的底部。
关闭窗口。点击左上角的红点按钮,关闭窗口。此时,你已经启用Mac电脑的Siri助手了。
打开“通讯录”应用程序。它是一个棕色图标,左边是人像剪影,右边是彩色标签。
点击你自己的联络信息。Siri从你的联络信息了解你的名字和邮箱地址等,会用联络卡片上的名字来称呼你,也可以根据你的信息执行一些常用的指令,如发送邮件等。
如果你从未在通讯录里给自己创建联络卡片,请点击 +按钮,输入你的信息,然后点击 完成。
点击名片。它位于屏幕顶部的菜单栏。
点击将这张设为我的名片按钮。它位于靠近屏幕中央的地方。这时候,Siri就“知道”你是谁啦。
。长按Home键,直到屏幕上出现一行字:“请问需要什么帮助?”如果你已经打开语音激活功能,那么只要你对着手机说“嘿Siri”,就能打开Siri。
在Mac电脑上,点击菜单栏里的“Siri”图标,它位于屏幕右上角。
告诉Siri应该如何称呼你。对着设备的麦克风说“Siri,叫我xxx”,发音要清楚,这里的“xxx”就是你想让siri称呼你的名字或昵称。
回答“是的”。Siri会询问你是否确认这样称呼你,如果没问题,请对着设备的麦克风说“是”。
如果Siri说的不正确,请回答“不是”,然后再次对它说“叫我...”来纠正它。说话的时候语速要慢,发音要清晰。
如果Siri在发音时遇到困难,请打开主屏幕或桌面上的“通讯录”应用程序。
在iPhone或iPad设备上,点击屏幕顶部的你的名字。你的名字下面应该有“我的名片”四个字。在Mac电脑上,点击 名片 ,然后选择 前往我的名片。
点击或轻触编辑按钮。它位于移动设备右上角、Mac电脑的右下角。
在iPhone或iPad设备上,滑动屏幕,点击或轻触添加字段。在Mac电脑上,点击名片,然后点击 添加字段。
在iPhone或iPad设备上点击名字或姓氏发音(或拼音) 。在Mac电脑上,点击 名字或姓氏发音。
滑动屏幕到名片的顶部,点击或轻触你添加的发音栏或拼音栏。
正确拼出你的姓名,或写下正确的发音。
点击或轻触完成按钮。它位于移动设备的右上角、Mac电脑的右下角。
尽可能详细地填写你的联络名片。Siri掌握的信息越多,才可以更好地帮助你。
本页面已经被访问过57,298次。后使用快捷导航没有帐号?
只需一步,快速开始
查看: 55578|回复: 22
积分5精华0主题帖子威望0 活跃5 PP币23 PP豆0 阅读权限10最后登录
, 积分 5, 距离下一级还需 95 积分
TA的每日心情奋斗 10:31签到天数: 2 天连续签到: 0 天[LV.1]初来乍到威望0 活跃5 PP币23 PP豆0
才入手6s 银色64G一台,玩了几天,还没完全熟悉,第一次用.
在网上看大家对“嘿siri&功能都很看好,可我的手机 设置-&通用&&里面,找不到siri选项,spotlight里倒是有siri建议。
手机激活的时候被同事拿过去看了下直接激活了,同事一直用的是iphone,也不知道是不是跳过了siri设置。
现在想重新配置”嘿siri“,有什么办法啊?
积分230精华0主题帖子威望12 活跃294 PP币145 PP豆0 阅读权限10最后登录
, 积分 230, 距离下一级还需 70 积分
该用户从未签到威望12 活跃294 PP币145 PP豆0
设置-&通用,进去就看到了,或者你截图传论坛看看
积分5精华0主题帖子威望0 活跃5 PP币23 PP豆0 阅读权限10最后登录
, 积分 5, 距离下一级还需 95 积分
TA的每日心情奋斗 10:31签到天数: 2 天连续签到: 0 天[LV.1]初来乍到威望0 活跃5 PP币23 PP豆0
冻奶茶 发表于
设置-&通用,进去就看到了,或者你截图传论坛看看
就是看到大家的截图,再看自己手机设置,少了siri这一项。
现在上班不方便弄手机,稍后找时间上下图。
积分5精华0主题帖子威望0 活跃5 PP币23 PP豆0 阅读权限10最后登录
, 积分 5, 距离下一级还需 95 积分
TA的每日心情奋斗 10:31签到天数: 2 天连续签到: 0 天[LV.1]初来乍到威望0 活跃5 PP币23 PP豆0
手机上论坛帖不了图。
办公室电脑不给连接手机,抓的图传不上来。
baidu了下,有些说是 访问限制 设置了关闭 siri,所以设置里面没有siri
然后我就去设置访问限制,却提示需要密码,6s的密码不全是6位的么?访问限制密码是4位的,我不记得我有设置过4位的密码啊?
看来还得回家下同步软件把访问密码去初始化掉才知道是不是这问题。
积分2666精华0主题帖子威望17 活跃4527 PP币-1 PP豆0 阅读权限50最后登录
, 积分 2666, 距离下一级还需 334 积分
TA的每日心情奋斗 10:31签到天数: 312 天连续签到: 0 天[LV.8]以坛为家I威望17 活跃4527 PP币-1 PP豆0
多说无益 刷机去吧
积分5精华0主题帖子威望0 活跃5 PP币23 PP豆0 阅读权限10最后登录
, 积分 5, 距离下一级还需 95 积分
TA的每日心情奋斗 10:31签到天数: 2 天连续签到: 0 天[LV.1]初来乍到威望0 活跃5 PP币23 PP豆0
栗山未来丶o 发表于
多说无益 刷机去吧
刷机真不会,也不想去冒那个风险。
上周末,因为制作过铃声,在电脑上有同步过,不知道会不会有什么默认的配置被同步到手机了?
比如 访问限制密码,默认的都试过,不行。
看来还是得回到家里电脑才能明白问题出在哪。
积分12266精华1主题帖子威望609 活跃16753 PP币-3 PP豆0 阅读权限90最后登录
TA的每日心情奋斗 10:31签到天数: 585 天连续签到: 0 天[LV.9]以坛为家II威望609 活跃16753 PP币-3 PP豆0
重启再试试,不行就升级刷机
积分22精华0主题帖子威望0 活跃17 PP币49 PP豆0 阅读权限10最后登录
, 积分 22, 距离下一级还需 78 积分
TA的每日心情奋斗 10:31签到天数: 2 天连续签到: 0 天[LV.1]初来乍到威望0 活跃17 PP币49 PP豆0
还好我的还在,我也没设置
积分59精华0主题帖子威望0 活跃71 PP币240 PP豆394 阅读权限10最后登录
, 积分 59, 距离下一级还需 41 积分
TA的每日心情花心 15:55签到天数: 41 天连续签到: 0 天[LV.5]常住居民I威望0 活跃71 PP币240 PP豆394
没道理没有的
(83.99 KB, 下载次数: 154)
10:34 上传
点击文件名下载附件
积分2精华0主题帖子威望0 活跃2 PP币14 PP豆0 阅读权限10最后登录
, 积分 2, 距离下一级还需 98 积分
该用户从未签到威望0 活跃2 PP币14 PP豆0
zephyrw 发表于
没道理没有的
我的也和你一样
论坛雷锋好模范
论坛回帖之王
热心分享资源超过500个的会员
发表1000篇以上文章会员
发表1000篇以上文章会员
Copyright&
Guangzhou UC Network Technology Co., Ltd. All Rights Reserved. 广州优视网络科技有限公司 版权所有让 Siri 的声音更像真人,苹果是如何做到的?_凤凰科技
让 Siri 的声音更像真人,苹果是如何做到的?
用微信扫描二维码分享至好友和朋友圈
原标题:让 Siri 的声音更像真人,苹果是如何做到的?
编者按:虚拟助手最先是由Siri带火的,但现在的苹果已经被Amazon和Google拖到后面。不过以追求完美为目标的苹果自然不会就这么让Siri沉寂下去,过去几年的时间了,苹果的团队一直在攻关一个项目,那就是让Siri说话更像人。团队负责人认为,现在Siri已经取得了巨大飞跃,在不久后的iOS 11中,用户就能感受到它的风采了。Siri说话是怎么变得更像人的呢?《连线》杂志的这篇文章为我们。
Alex Acero第一次看《她》的时候是以一个正常人的方式去观看的。但第二次的时候,他根本就没有看电影。Acero是苹果负责Siri背后技术的主管,这次他就坐在那里,紧闭双眼,倾听Scarlett Johansson(斯嘉丽·约翰逊)是如何给她的人工智能角色Samantha配音的。他注意了她是如何跟Joaquin Phoenix扮演的Theodore Twombly交谈的,以及Twombly是如何回话的。Acero试图弄清楚Samantha是怎么让一个从来都没见过她的人爱上她的。
为什么声音会工作得那么好?当我问到Acero这方面他了解到什么东西时,他笑了,因为答案太明显了。他说:“因为自然!因为那不是机器人!”这对于Acero来说几乎都算不上是启示。这基本上只是确认了他的团队过去几年做的项目是对的:这个项目的目标就是让Siri听起来更像人。
今秋,当全球各地安装iOS 11的iPhone和iPad数量达到数百万的时候,该新软件就会给Siri换一个新的声音。它不会引入很多新功能或者把笑话讲得更好笑,但是你会注意到其中的不同。Siri现在讲话会有更多的停顿,在停顿前先把音节拉长,说起来有一种抑扬顿挫的感觉。字句听起来更加流利,并且Siri也会讲更多语言了。总之,听它讲和跟它讲都感觉更好了。
苹果用了几年的时间来重新构建Siri背后的技术,将它从一个虚拟助手变成了支撑你手机的一切人工智能的一个包罗万象的统称。它已经在不懈地扩张到新的国家和语言(尽管犯过不少错误,但Siri仍然是目前市面上最通俗的个人助理)。苹果也从一开始的慢慢地到现在的迅速地,致力于将Siri普及到每一个地方。而且Siri现在已经归苹果的软件负责人Craig Federighi掌管,这表明Siri对苹果的重要性现在已经跟iOS相提并论。
这项技术好到能让你跟你的虚拟助手坠入爱河还需要一段时间。但Acero和他的团队认为自己已经取得了一次巨大飞跃。他们还坚定地认为,如果自己能让Siri说话不那么像机器人而更像你认识和信任的某人的话,他们就能把Siri做得很棒,哪怕Siri会有失败的时候(注:因为人也会犯错)。而这个在AI和语音技术尚处早期阶段时,可能就是最佳场景了。
Siri长大了
为什么苹果喜欢控制自己产品的一切?如果你想找个好例子的话,只需看看Siri。自从推出6年后,Siri在这场虚拟助理的竞赛中大部分已经落后。Amazon的Alexa得到了更多的开发者支持;Google的Assistant知道更多的东西;这两个在很多不同公司许多类型的设备上都能找到。
苹果说这都是自己的错。Siri刚推出的时候,是另一家公司提供语音识别的后端技术。那家公司是谁?一切迹象均指向了Nuance,尽管苹果和Nuance均从未承认过有合作关系。不管这家公司是谁,苹果都乐于把Siri的早期问题归咎到它的身上。苹果负责产品营销的CP Greg Joswiak说:“这就像是在赛跑,有人在拖我们后腿。” Joswiak说苹果已经给Siri制订了一个大计划:“做你可以在手机上对话的助理,可以用更容易的方式帮你做这些事,”只是技术还不够好。他说:“你懂的,输入不行的话,输出也不行。”
几年前,Acero领导的这支苹果团队控制着Siri的后端以及体验改进。现在Siri的基础已经变成深度学习和AI,因此得到了巨大改进。Siri的裸语音识别可以与任何竞争对手匹敌,可正确识别95%的用户讲话。这款AI工作于两个不同的关键模式:语音转文本,也就是Siri弄清楚你说什么,以及文本转语音,也就是Siri会进行回话。
在众人的声音中(尤其是当这些系统变得愈发个性化时)分辨你的语音是Siri最重要的工作之一。Siri掌握的数据越多,苹果的模型就会越好,它就越能分辨不同的人,甚至能理解很重的口音。这还会变成一个安全问题:研究人员最近发现,他们能够以高到人类无法听见的频率跟Siri沟通,从而使得破解不被发现。Siri需要学会区分人和机器的语音,以及你的和别人的语音。
有一个办法有助于理解这些系统的工作方式,那就是看看苹果是怎么教Siri学习新语言的。在把Siri引入新市场——比如说上海时——团队首先会寻找已有的本地语言数据库。然后通过雇用配音员,让这些人读书、读报以及读网上的文章等来丰富这个库。
苹果的团队会转录那些录音,把单词跟声音对应上——更重要的是,要识别音素,也就是构成所有话语的独立声音(在英语中,“fourteen”是个单词,而“e”这个英就是音素)。他们试图以各种能想象得到的方式来捕捉这些音素:在词尾的时候变弱,在开始的时候加强,停顿前拉长,疑问句末变成升调等。每一种表达都有着略为不同的声波,苹果的算法会对此进行分析,找出任何特定句子的最合适表达方式。Siri说的每一句话都包含了几十或者几百个这样的音素,就像是用不同杂志里面的字母拼凑出来的勒索信。你听到Siri说的话里面可能没有一个字是通过录音出来的。
再给个例子:“You want to watch this?(你想看这个吗?)”和“I like your watch(我喜欢你的手表。)”第一句的情况下,Acero说到“watch”时声音会自然提高,但是在第二句的时候就会变成降调。Acero说:“单词还是一样的单词,但发音就完全不一样了。”在这两个句子中他都无法使用单词“watch”的同一份录音,或者甚至是相同的音素。“one Siiiix NINE fourteenth STREET PhilaDELphia”,发音就像你的老式GPS导航那样的系统是很难听的,尤其是单词数量比较多时。
即便在几年前,计算机和服务器也还不能提供足够的处理能力来遍历一个庞大的数据库,为每一次呼叫和响应找到完美的声音组合。不过现在他们可以了,Acero和他的团队想要到尽可能多的数据。所以在做出了初始模型之后,他们马上就以所谓的“仅收听模式”推出Siri。这种模式下你不能跟Siri对话,但是可以按下麦克风按钮然后下达语音指令或者进行web搜索。这个给苹果的机器提供了很多不同口音、不同品质的麦克风以及各种情况下的输入,这一切都让Siri做得比比人更好。苹果收集(自称是匿名模式下的)和转录这一数据,然后改进算法和训练神经网络。他们还给机器补充了位置相关数据以及说话习惯——比如3:0美国的说法是three-zero,而英国则是three-nil——然后继续调整系统,直到Siri对什么是上海话以及大家是怎么说上海话有着近乎完美的理解。
与此同时,苹果还进行了一场浩大的寻找合适配音员的行动。他们从成百上千人开始,让这些每个人都录一段Siri可能会讲到的话。然后Acero跟苹果的设计师和用户界面团队一起来决定最喜欢哪一个声音。这一块其决定作用的更多的是艺术而不是科学——他们一边听,一边试图找感觉,那种难以言喻的感觉,最好要有帮助感和亲切感,中气十足又不要太尖锐,有快乐感但又不能太卡通。
接下来的部分就是科学了。Acero说:“很多配音员的声音都很好听,但这并不意味着这些声音就适合于语音合成。”他们用自己建立的名为音素变异性的模型来对这些讲话进行测试,看看每一种细微的表达方式的声波左右侧的差异性如何。一个音素的变异性太多会使得把很多音素组合起来的时候很难发出自然的声音,但你在听它们讲的时候是听不出问题来的。只有计算机才能看出不同。Acero说:“这几乎就像在墙上贴墙纸,你得留意接缝才能确保对齐。”
在找到了发音同时令人和计算机感到满意的那个人之后,苹果用了几周的时间去录制声音,然后这就成为了Siri的嗓音。Siri支持的21种语言(针对36个国家进行本地化)都是按照这一流程进行的——这个数量超过了其所有主要竞争对手支持的语言之和。每个月加起来有3.75亿人在使用Siri。这是个很大的数字,对于一个严重瑕疵数不胜数,很多人直摇头的语音助手来说更是如此。
尽管如此,与全球10亿多的苹果设备相比这个数字仍略显苍白。从iPhone到Apple Watch,从Macbook到Apple TV,苹果销售的几乎所有东西都包含有Siri。不过分析师预计,很快就会有超过5亿的iPhone会被同时激活。Siri是一个流行且重要的功能,但还算不上无所不在。对于大多数人来说,这个功能绝对不是必不可少的;你对Siri的功能需求并不像对手机的需要那样。现在苹果已经有了一位自己信任的助理,它必须教会大家怎么去用Siri。
尽管问我吧
苹果推Siri的意图是什么呢?你想知道的一切都可以在这则广告https://36kr.com/p/5084887.html里面找到。影片跟踪了Dwayne Johnson(巨石强森)在伙伴Siri陪伴下一天的生活。强森用Siri查看日程安排,用Siri打Lyft,当然,开车的还是他;他还一边飙车一边查天气;在西斯廷教堂画壁画的时候用Siri收邮件;在两个手没有空的时候用Siri进行单位换算;在太空的时候进行Facetime还拍了个自拍。Siri称他是“Big、Bald和Beautiful先生”,希望这个声音到iOS 11的时候听起来不再那么的不舒服。
Joswiak说,从一开始苹果就希望Siri成为干脏活的机器。大家通过问一些琐碎的问题来比较虚拟助理的方式令他感到发疯,因为这使得Siri看起来很糟糕。他说:“我们设计Siri不是让你打破砂锅问到底的!”
相反,Joswiak仍然专注于帮助大家在一位自动化朋友的帮助下做更多的事。他指出Siri可以在Mac上执行复杂的文件搜索,护着即将推出的HomePad对音乐的深厚知识。另一个例子出自我们见面的几天之后,当时Siri的语音搜索和控制赢得了艾美奖的一项技术性奖项。它可以下达一些非常出色的指令““嘿Siri,回放2分钟,”然后你就能重新听一遍。
Siri不是万能的,甚至大部分事情都不能做。它最有用的地方是可以让你少敲几个字,少滑动几次屏幕,而不是替你解决复杂的琐事或者跟你辩论我们是不是生活在模拟世界里面。但因为Siri展现出了没有限制性——因为你可以问任何事情——用户自然就想什么都试试。Acero说:“用户知道自己可以说什么是很重要的。”他的工作之一就是要帮助Siri改善沟通技巧,同时在失败的时候要表现得优雅。他说:“我们在努力赋予Siri这类能力,也就是知道什么地方自己不知道。但这是个很困难的问题。”苹果网站,甚至包括它的商业广告,都是为了帮助大家更好地理解Siri可以做什么,不可以做什么。
另一个挑战是让大家记得Siri在着呢。Acero说:“大家做事都有自己的习惯。如果习惯敲字,如果突然改变这一习惯的话,适应是需要一段时间的。”所以苹果试图去推动用户朝着正确的方向走。在iOS 11里面,Siri的存在感会强很多,主动性也会大大加强。它会观察你浏览网页然后推荐Apple News故事给你阅读,或者帮助你替刚刚通过Groupon订购的按摩券添加日程安排。新的Siri会变形,在设备兼同步你的设置,所以不管你在使用哪一种设备,Siri一直都会知道你的习惯。
这些年来,苹果在让开发者跟Siri集成的事情上一直动作缓慢。Alexa以及程度略低的Google Assistant都在鼓励开发者替自己的助理开发应用或者把他们的助理纳入进去,但Siri却仍然对开发者紧闭大门。巨石强森能做的一切都只能在苹果自己的应用里面做。它拒绝承认你手机上Google Maps或者Outlook的存在,当然,没有HomeKit的话你也开不了任何的灯。去年,该公司谨慎地开了一道缝,让跟多的开发者进入,使得用户可以用Siri来跟Whatsapp通话,打Uber,或者通过Venmo转账。iOS 11之后大门会开得更大,但只是大一点点。
随着Amazon和Google取得开发者的支持以及在功能竞争中取得领先,这种动作之慢已经让苹果付出了在大家眼里失去领先地位的代价。至少Joswiak是表示出耐心的。他说问题不在于Siri能做多少事情。而在于“你怎么把事情做对?因为我们不想对用户规约过多。” 他对Amazon和Google苛刻的语法要求感到愤怒,比方说你得这么说:“Alexa,问一下Daily Horoscopes有关金牛座的情况。”或者“OK,让我跟Todoist谈谈。”他宁愿等到你想怎么讲就怎么讲,不管你想要什么都能如愿的时候。苹果一如既往的,如果只能做出半成品的话,宁愿什么也不做。
语法问题最终要回到Acerco倾听Samantha和Theodore Twombly在屏幕上谈恋爱时听到的同一样东西上。最好的计算机——即便是科幻小说里面的计算机——听起来也像人。他说:“它会在合适的地方停顿,它会有合适的语调,流畅的发音。而且声音里面只有一点点的金属感。”他希望做点好东西出来,然后提供给每个人。任何时候你想了解进展情况时,只需要看看Siri就行。
原文链接:
编译组出品。编辑:郝鹏程。
用微信扫描二维码分享至好友和朋友圈
凤凰科技官方微信
播放数:8841
播放数:1369
播放数:2270
播放数:5808920

我要回帖

更多关于 siri不好用了怎么办 的文章

 

随机推荐