什么苹果语音控制怎么关闭应用最后

语音控制好用吗 语音控制的现状分析
时间: 9:20:09来源:作者:Keung(0)
前段时间,中兴星星语音手机二代发布,作为主打语音控制的智能手机,星星二代具有不少语音控制方面的特色。而在近几年,在新手机面世时的广告语中,“交互新革命”“全新的交互体验”等名词层出不穷,在众多交互方式中最为突出的一种当属语音交互。语音交互,说白了就是采用语音助手等系统级应用或者第三方应用来对手机进行控制。自苹果的Siri打开了智能语音助手之门后,各类语音助手野蛮生长,互联网巨头、移动&运营商、手机厂商等众多企业纷纷涌入,手机应用市场内多达几十款之多的语音助手让人看得眼花缭乱,各类内置语音操控的智能手机也陆续问世。但是,我们会一个奇怪的现象――并没有多少人去用它。就连整体性能最优的苹果的Siri助手,我们也鲜少看到有人使用,这是为什么呢?本文就粗略来分析一下。不确定性目前,大多数语音助手对于自然语言识别率已经达到了一个较高的水准,对于常用的手机语音操控短句识别率较高并且拥有极高的响应速度。但是,识别并不等同于理解,对于一些复杂句式的长句,在人看来很正常很容易理解,机器可能就无法理解。于是,这就导致了一个不确定性的问题:语音助手大多采取一问一答的方式来处理问题,很多情况下你问了却没有回复,一方面是无法准确识别语音内容,另一方面就是系统可能不支持你的语音控制命令。在使用时,如果经常遇到这样的问题,那就自然有了“说了后未必能得到回复”或是“可能要再说一遍”的潜意识。重复几次失败后,人们自然会对这种理解能力的东西意兴阑珊了。针对不确定性的两个方面,首先固然是语音识别技术本身,自然语言的算法速率和准确率需要进一步提升,另外,还需要庞大的时间去机械地积累语料库,这些可能只能等待人工智能的进一步发展了。就算不用像人类这样聪明,其程度也必须要达到基本通过“图灵测试”(一种测试机器是不是具备人类智能的方法。其内容是,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试)。无法排除的环境干扰由于手机使用的场所十分多变,有可能时常处于声音极其嘈杂的环境下,所以要实现准确的识别功能,智能设备也需要像人耳一样具有排除噪声的能力。这就涉及到噪声的过滤,这类良好的噪声过滤的实现需要软硬件共同的努力:硬件上,已有的方法例如使用两个麦克风进行信号收集比对,混合处理,达到剔除噪声的目的;&软件上,主要依赖于各类滤波算法的使用,这也是最难的,目前大多还停留在实验阶段,并没有什么特别成熟的解决方案。另外,现行的语音操作过程甚至还强迫用户手动辅助完成,这根本是语音助手类应用致命性的缺陷。语音交互的根本目的在于解放人的双手,人机的语音交流应该是具备相较于“触摸”更远的交互距离。比如你的手机在桌上,你躺在沙发上。这时候你拿手机会比较麻烦,所以就会用到语音交互的方式。但较远的距离也势必会影响声音的传达,所以除了噪声过滤算法之外,模糊人声识别也会成为一个必要的技术方向。无法覆盖App功能在三大手机平台上,苹果的Siri、安卓的GoogleNow以及微软的Cortana可以说都算不错的语音助手。但是都有一个通病,就是基本只限于自身系统这个层级,无法渗透到APP中去。或者换个说法,也就是语音助手无法实现完全语音控制。举个例子,使用系统语音助手可以轻松打开一款第三方的音乐播放软件,但是打开这款软件后就没有与之相配套的语音命令了,例如“暂停”、“下一首”、“调高/低音量”或重复播放等等。从技术角度来说,这种完全语音控制APP几乎不存在任何障碍,几乎所有语音命令系统都能理解上述这些简单的词汇。解决这个也只需系统开发者提供相应的语音助手API(应用程序接口)即可,可是如今却没有一个厂商愿意这么做。其实,这涉及到一个业界生态的问题,虽然语音识别和屏幕触控都可以通过开发API的方式在非系统层级应用中使用。但语音识别是暂时是需要通过云端服务器来实时返回结果的,而不是像屏幕响应这样在本机上就可以处理完成结果。那么就算安卓或是iOS开发出了相应的语音识别API,各大应用服务商会允许谷歌或&是苹果深入到应用的数据上面吗?就像腾讯是以中国几亿QQ用户的关系链数据发家,它是否会允许苹果在语音识别的API上深入到其数据内部呢?所以这些也涉及到商业利益的问题。隐私及安全问题在上一节中提到,语音识别会通过云端服务器来返回结果。既然涉及到了云存储,那么又会带来隐私与安全的问题。任何一家公司都无法回避这样的问题,即使是“最好”的苹果公司也因为iCloud导致的好莱坞女星艳照事件而备受指责。撇开个人隐私不说,这还可能上升至国家信息安全的问题。在今年8月,苹果公司把中国用户的数据转存至中国电信的云服务存储器上。从关注信息安全的人士看来,苹果此举相当于“把球踢给了中国政府”。业内人士表示,如果不从法律法规上对跨境数据的流动进行规范和管理,那么即使苹果等境外互联网公司租用中国的&服务器,对于中国的信息安全局势而言,安全风险并不会降低,而是变得更高。回归本文,如果语音交互开放到一定程度,未来用户可能使用语音来输入账号、密码或者进行相对私密会话,这类语音信息的安全存储能否得到保证也值得关注。总结随着智能手机的发展,关于语音交互的革命仍然会继续,这将是一场持久战。一项新技术的诞生到被人们完全接受使用必定要经历一段阵痛。总的来说,语音控制的未来是光明的,这是一项造福于人类,改变人们生活方式的新型技术,让我们共同期待吧。- 或用以下帐号直接登录 -
三大语音助手为何难实现完全语音控制功能
来源: 搜狐IT作者:
7月1日,科技博客网站phoneArena刊载Michael H.的文章,对三大语音助手不提供完全语音控制功能进行了阐释。三星已经提供了部分类似功能,S Voice采用Nuance的技术  在多段Android Wear视频中,Google都表示在扩大语音命令使用范围。
  7月1日,科技博客网站phoneArena刊载Michael
H.的文章,对三大语音助手不提供完全语音控制功能进行了阐释。以下为文章全文:
  我是作家,这意味着我最擅长通过文字而非说话表达自己的思想。但我同时是个“懒人”,在完成工作时喜欢尽量减少使用计算设备。为此,我心中难免会有一个疑问:为什么Google
Now、苹果Siri和微软Cortana不能提供完全语音控制功能?
  我喜欢语音控制,这也是我换用Moto X的主要原因之一——喜欢其Touchless
Controls(无须触控操作)功能。用上Moto X的Touchless
Controls后,我有些“得寸进尺”。麻烦在于,只使用语音控制功能,我能完成的工作受到一定限制。语音命令有很多类,我可以通过语音命令发送电子邮件、浏览网站、提问、问路、设置定时、设置提醒、播放音乐等。麻烦在于,计算设备完成第一条命令后,我就不能通过语音命令未完成其他任务了。
  最近数年最好的创新之一是,Google把传统的语音识别技术应用在搜索领域。从技术角度看,这意味着Google能够理解代词,并把它们与之前的请求联系起来。因此,如果用户在一个语音命令中提到科怀伦纳德(Kawhi
Leonard),在下一个问题中提到“him”(他),Google能理解用户的意思,向用户提供所需要的信息。尽管大多数人没有完全意识到,但这是一项令人吃惊的技术。它使用户能与设备自然地交流。令人遗憾的是,这种交流无法拓展到更加有用的场景。
  自然控制
  语音控制技术能执行后续的命令,但目前的技术还存在相当多的限制。我没有遇到大量需要连续询问一个人或一个地方信息的情况。我的问题在于,其他语音控制命令不包含相似的后续场景选项。例如,我让Moto
X播放Me'Shell
Ndegéocello的一首歌曲,因为我尚未有机会听取其新专辑。第一条命令的执行不存在任何问题,问题在于,一旦开始播放后,可供我使用的语音命令就几乎没有了,只能通过语音命令播放其他歌手的歌曲。但我真正的意图是让设备完成下述功能之一,例如“暂停”、“下一首”、“调高/低音量”或重复播放。令人遗憾的是,我无法通过语音命令完成这些功能。
  我不明白造成这一问题的原因。从技术角度看,完全通过语音命令控制设备几乎不存在任何障碍。语音识别技术已经相当成熟。所有语音命令系统都能理解简单的词汇,例如,播放、暂停、下一个、上一个、重复等。Google最近拓展了其热词的使用范围,使用户能从任何地方启动“OK,
Google”。有传言称新款iPhone中的Siri将包含有相似的功能,Cortana没有理由不能为Windows
Phone用户提供相似的功能。始终接收语音命令已经成为标准,因此这不应当成为一个问题。
  我知道,更多地使用语音命令意味着电池续航时间的缩短,这令厂商感到担忧。但这似乎是一个相对容易解决的问题。设备始终处于语音命令接收状态是可能的,尤其是在设备配置协处理器或针对语音命令优化的处理器的情况下。解决这一问题的另一个方法是简单的API(应用编程接口)。
  Ubuntu
Touch就计划解决这一问题。打开一款应用后,用户希望使用的语音命令是有限的。新闻和其他阅读类应用不大量使用语音命令,但提供简单的语音命令——例如“后退”、“向下/向上滚动”、“搜索”、“分享给”,能给绝大多数应用增添丰富的功能。打开支持更多标准语音命令的应用——例如媒体消费类应用,支持的语音命令就更明确了,例如“播放/暂停”、“下一个/上一个”、“快退/快进”、“调高/调低音量”,甚至“跳至(某一时间)”。当然,即使动态命令也不会是个问题,因为应用内部的命令通常是1或2个单词,许多应用的命令甚至是重合的,能更便利地部署标准API。识别这样的命令不是个问题。
  谁会成为第一个吃螃蟹者?
  这并非是全新的功能。Windows
7和8提供了范围广泛得多的语音命令功能,用户只需使用语音命令即可操纵桌面。许多人会认为桌面系统的语音功能要强大得多,移动设备是另外一回事儿,但是,这种想法需要改变了。移动平台越来越先进,在许多方面弥补了与桌面系统之间的差距。Ubuntu
Touch的目标之一是在应用内支持更多语音命令,Canonical展示了可以通过语音命令控制的下拉菜单,支持“打开”、“保存”等命令。
  Google Now、Siri和Cortana缘何不能提供完全语音控制?
  Ubuntu Touch尚不支持完全语音控制功能。坦率地说,Ubuntu
Touch中的许多功能都尚未达到预期的目标。我的疑问是,缘何主流平台也做不到。
  苹果和Google分别在不断地扩展Siri和Google
Now的功能,Cortana发布时就带有给人留下深刻印象的功能。但是,三家公司无一计划提供完全语音控制功能,这颇令人感到失望。目前,我们最大的希望是,反复使用能提高语音命令被正确执行的机率,系统能包含全部相关信息。
  终有一天完全语音控制功能会问世,问题是哪家公司会首先提供这一功能。微软在Windows而非Windows
Phone中提供了完全语音控制功能。微软曾表示计划为其平台提供“类Kinect”控制功能,但尚未披露时间表。明年发布的Windows
Phone 9可能提供完全语音控制功能。
  Canonical在为Ubuntu开发完全语音控制功能,但尚未完成开发工作。目前没有明显的证据表明苹果在开发完全语音控制功能,但它可能至少在研发相关技术。三星也没有披露在开发完全语音控制功能的消息。三星已经提供了部分类似功能,S
Voice采用Nuance的技术
  在多段Android Wear视频中,Google都表示在扩大语音命令使用范围。在一段视频中,一名用户在自行车上发出“OK
Google, open the garage door”(OK
Google,打开车库门)的命令。令人遗憾的是,目前还很难判断视频的真正含义。
  Google可能向开发者开放语音命令,使语音命令更深入地整合在应用中,使开发者能创建定制的语音命令;Google也可能提供一套应用能执行的标准语音命令集,供其他应用使用。Google的展示表明,用户可以发出“OK
Google, call me a car”(OK
Google,帮我叫辆车)命令,并选择一款应用执行这一命令。尽管会有些乱,第一种选项会催生更多功能;第二种选项会使功能受到一定限制,但会带来更高的便利性。Google可能会选择第一种选项,增添更多完全语音控制功能。
  “什么”和“为什么”的问题很好回答:完全语音控制,因为我们都希望生活在《星际迷航》(Star
Trek)中。“如何实现”的答案是:始终接受语音命令和API。“谁”问题的答案是所有公司,其中Google可能会首先提供完全语音控制功能。最后一个问题就是“时间”了。
  根据披露的信息,Google很难在今年底前提供完全语音控制功能。完全语音控制功能可能是Android
L的一部分,Google在最近的I/O开发者会议上没有提及完全语音控制功能。完全语音控制功能与应用的深度整合需要在系统层面而非仅仅在API调用层面完成。Google似乎至少在为完全语音控制功能奠定基础。
  令人的遗憾的是,完全语音控制功能至少明年才会问世。(竹子)
责任编辑: 罗威
请文明发言,还可以输入140字
您的评论已经发表成功,请等候审核
小提示:您要为您发表的言论后果负责,请各位遵守法纪注意语言文明
新闻关键词
为进一步推动广东省大学生深入学习《习近平总书记系列重要讲话读本》(2016年版),增强中国特色社会主义的道路自信、理论自信、制度自信,为实现中华民族伟大复兴的"中国梦"贡献智慧和力量,广东省委宣传部、南方网决定在全省普通高等学校大学生中开展"党中央治国理政新理念新思想新战略知识竞赛"活动。通过之前几篇文章&&、、
&&&&我们可以知道Google为Android应用程序开发者提供了简单而强大的语音识别技术的API,我们可以利用这些Api,结合Google的云端技术来实现功能强大的语音识别和语音控制应用。
本篇就结合最近项目,实现一个简单的语音控制Demo应用,实现简单的语音控制。
功能点为:通过用户语音将用户输入的语音识别出来,并完成预定义的命令操作。
说明:1、这个应用采用的是Android语音识别技术实现方法的第一种方法:使用intent调用Google的语音识别程序,通过访问google云端数据来进行识别。
&&&& 2、手机必须要能上网
&&& &3、必须安装Google语音基础软件Google Action
&&&&&&&首先建立如下的一个activity,并在button下建立一个listview控件(用来回显语言识
别到的项目)。
设置预定义控制命令集。
在String.xml文件中
代码VoiceControl如下:
口令:打开照相机,执行预览结果如下:
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:99739次
积分:3222
积分:3222
排名:第8714名
原创:92篇
转载:882篇
评论:18条
(44)(48)(41)(140)(117)(55)(38)(133)(31)(55)(35)(81)(19)(100)(43)

我要回帖

更多关于 苹果6s语音控制是什么 的文章

 

随机推荐