叮咚音箱 麦克风阵列技术 为什么 没火

技术小站:
& 参加直播现场,与专家互动,学最新知识
& 学习业内最热门知识,还有好礼送
& 看视频,填问卷,拿好礼
& 海量精华技术资源 限时阅读下载
张飞电子工程师速成全集
10天掌握PCB AD画板
教你高速PCB项目整体设计
如何设计STM32单片机系统?
物联网操作系统从写到用
讲师:华清远见
讲师:林超文
讲师:郑振宇
讲师:李述铜
移入鼠标可放大二维码
麦克风阵列是什么 有哪些关键技术? - 全文
来源:雷锋网 作者:陈孝良日 14:40
[导读] 学术上有个概念是“传声器阵列”,主要由一定数目的声学传感器组成,用来对声场的空间特性进行采样并处理的系统。而这篇文章讲到的麦克风阵列是其中一个狭义概念,特指应用于语音处理的按一定规则排列的多个麦克风系统,也可以简单理解为2个以上麦克风组成的录音系统。
  亚马逊Echo和谷歌Home争奇斗艳,除了云端服务,他们在硬件上到底有哪些差异?我们先将Echo和Home两款音箱拆开来看,区别最大的还是麦克风阵列技术。Amazon Echo采用的是环形6+1麦克风阵列,而Google Home(包括Surface Studio)只采用了2麦克风阵列。这种差异我们在文章《对比Amazon Echo,Google Home为何只采用了2个麦克风?》做了探讨。但是好多朋友私信咨询,因此这里想稍微深入谈谈麦克风阵列技术,以及智能语音交互设备到底应该选用怎样的方案。
  什么是麦克风阵列技术?
  学术上有个概念是&传声器阵列&,主要由一定数目的声学传感器组成,用来对声场的空间特性进行采样并处理的系统。而这篇文章讲到的麦克风阵列是其中一个狭义概念,特指应用于语音处理的按一定规则排列的多个麦克风系统,也可以简单理解为2个以上麦克风组成的录音系统。
  麦克风阵列一般来说有线形、环形和球形之分,严谨的应该说成一字、十字、平面、螺旋、球形及无规则阵列等。至于麦克风阵列的阵元数量,也就是麦克风数量,可以从2个到上千个不等。这样说来,麦克风阵列真的好复杂,别担心,复杂的麦克风阵列主要应用于工业和国防领域,消费领域考虑到成本会简化很多。
  为什么需要麦克风阵列?
  消费级麦克风阵列的兴起得益于语音交互的市场火热,主要解决远距离语音识别的问题,以保证真实场景下的语音识别率。这涉及了语音交互用户场景的变化,当用户从手机切换到类似Echo智能音箱或者机器人的时候,实际上麦克风面临的环境就完全变了,这就如同两个人窃窃私语和大声嘶喊的区别。
  前几年,语音交互应用最为普遍的就是以Siri为代表的智能手机,这个场景一般都是采用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语音识别需求的声音信号。但是,若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,这会严重影响语音识别率。而且,单麦克风接收的信号,是由多个声源和环境噪声叠加的,很难实现各个声源的分离。这样就无法实现声源定位和分离,这很重要,因为还有一类声音的叠加并非噪声,但是在语音识别中也要抑制,就是人声的干扰,语音识别显然不能同时识别两个以上的声音。
  显然,当语音交互的场景过渡到以Echo、机器人或者汽车为主要场景的时候,单麦克风的局限就凸显出来。为了解决单麦克风的这些局限性,利用麦克风阵列进行语音处理的方法应时而生。麦克风阵列由一组按一定几何结构(常用线形、环形)摆放的麦克风组成,对采集的不同空间方向的声音信号进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。
  事实上,仅靠麦克风阵列也很难保证语音识别率的指标。麦克风阵列还仅是物理入口,只是完成了物理世界的声音信号处理,得到了语音识别想要的声音,但是语音识别率却是在云端测试得到的结果,因此这两个系统必须匹配在一起才能得到最好的效果。不仅如此,麦克风阵列处理信号的质量还无法定义标准。因为当前的语音识别基本都是深度学习训练的结果,而深度学习有个局限就是严重依赖于输入训练的样本库,若处理后的声音与样本库不匹配则识别效果也不会太好。从这个角度应该非常容易理解,物理世界的信号处理也并非越是纯净越好,而是越接近于训练样本库的特征越好,即便这个样本库的训练信号很差。显然,这是一个非常难于实现的过程,至少要声学处理和深度学习的两个团队配合才能做好这个事情,另外声学信号处理这个层次输出的信号特征对语义理解也非常重要。看来,小小的麦克风阵列还真的不是那么简单,为了更好地显示这种差别,我们测试了某语音识别引擎在单麦克风和四麦克风环形阵列的识别率对比。另外也要提醒,语音识别率并非只有一个WER指标,还有个重要的虚警率指标,稍微有点声音就乱识别也不行,另外还要考虑阈值的影响,这都是麦克风阵列技术中的陷阱。
  麦克风阵列的关键技术
  消费级的麦克风阵列主要面临环境噪声、房间混响、人声叠加、模型噪声、阵列结构等问题,若使用到语音识别场景,还要考虑针对语音识别的优化和匹配等问题。为了解决上述问题,特别是在消费领域的垂直场景应用环境中,关键技术就显得尤为重要。
  噪声抑制:语音识别倒不需要完全去除噪声,相对来说通话系统中需要的技术则是噪声去除。这里说的噪声一般指环境噪声,比如空调噪声,这类噪声通常不具有空间指向性,能量也不是特别大,不会掩盖正常的语音,只是影响了语音的清晰度和可懂度。这种方法不适合强噪声环境下的处理,但是应付日常场景的语音交互足够了。
  混响消除:混响在语音识别中是个蛮讨厌的因素,混响去除的效果很大程度影响了语音识别的效果。我们知道,当声源停止发声后,声波在房间内要经过多次反射和吸收,似乎若干个声波混合持续一段时间,这种现象叫做混响。混响会严重影响语音信号处理,比如互相关函数或者波束主瓣,降低测向精度。
  回声抵消:严格来说,这里不应该叫回声,应该叫&自噪声&。回声是混响的延伸概念,这两者的区别就是回声的时延更长。一般来说,超过100毫秒时延的混响,人类能够明显区分出,似乎一个声音同时出现了两次,我们就叫做回声,比如天坛著名的回声壁。实际上,这里所指的是语音交互设备自己发出的声音,比如Echo音箱,当播放歌曲的时候若叫Alexa,这时候麦克风阵列实际上采集了正在播放的音乐和用户所叫的Alexa声音,显然语音识别无法识别这两类声音。回声抵消就是要去掉其中的音乐信息而只保留用户的人声,之所以叫回声抵消,只是延续大家的习惯而已,其实是不恰当的。
  声源测向:这里没有用声源定位,测向和定位是不太一样的,而消费级麦克风阵列做到测向就可以了,没必要在这方面投入太多成本。声源测向的主要作用就是侦测到与之对话人类的声音以便后续的波束形成。声源测向可以基于能量方法,也可以基于谱估计,阵列也常用TDOA技术。声源测向一般在语音唤醒阶段实现,VAD技术其实就可以包含到这个范畴,也是未来功耗降低的关键研究内容。
  波束形成:波束形成是通用的信号处理方法,这里是指将一定几何结构排列的麦克风阵列的各麦克风输出信号经过处理(例如加权、时延、求和等)形成空间指向性的方法。波束形成主要是抑制主瓣以外的声音干扰,这里也包括人声,比如几个人围绕Echo谈话的时候,Echo只会识别其中一个人的声音。
  阵列增益:这个比较容易理解,主要是解决拾音距离的问题,若信号较小,语音识别同样不能保证,通过阵列处理可以适当加大语音信号的能量。
  模型匹配:这个主要是和语音识别以及语义理解进行匹配,语音交互是一个完整的信号链,从麦克风阵列开始的语音流不可能割裂的存在,必然需要模型匹配在一起。实际上,效果较好的语音交互专用麦克风阵列,通常是两套算法,一套内嵌于硬件实时处理,另外一套服务于云端匹配语音处理。
  麦克风阵列的技术趋势
  语音信号其实是不好处理的,我们知道信号处理大多基于平稳信号的假设,但是语音信号的特征参数均是随时间而变化的,是典型的非平稳态过程。幸运的是语音信号在一个较短时间内的特性相对稳定(语音分帧),因而可以将其看作是一个准稳态过程,也就是说语音信号具有短时平稳的特性,这才能用主流信号处理方法对其处理。从这点来看,麦克风阵列的基本原理和模型方面就存在较大的局限,也包括声学的非线性处理(现在基本忽略非线性效应),因此基础研究的突破才是未来的根本。希望能有更多热爱人工智能的学生关注声学,报考我们中科院声学所。
  另外一个趋势就是麦克风阵列的小型化,麦克风阵列受制于半波长理论的限制,现在的口径还是较大,声智科技现在可以做到2cm-8cm的间距,但是结构布局仍然还是限制了ID设计的自由性。很多产品采用2个麦克风其实并非成本问题,而是ID设计的考虑。实际上,借鉴雷达领域的合成孔径方法,麦克风阵列可以做的更小,而且这种方法已经在军工领域成熟验证,移植到消费领域只是时间问题。
  还有一个趋势是麦克风阵列的低成本化,当前无论是2个麦克风还是4、6个麦克风阵列,成本都是比较高的,这影响了麦克风阵列的普及。低成本化不是简单的更换芯片器件,而是整个结构的重新设计,包括器件、芯片、算法和云端。这里要强调一下,并非2个麦克风的阵列成本就便宜,实际上2个和4个麦克风阵列的相差不大,2个麦克风阵列的成本也要在60元左右,但是这还不包含进行回声抵消的硬件成本,若综合比较,实际上成本相差不大。特别是今年由于新技术的应用,多麦克风阵列的成本下降非常明显。
  再多说一个趋势就是多人声的处理和识别,其中典型的是鸡尾酒会效应,人的耳朵可以在嘈杂的环境中分辨想要的声音,并且能够同时识别多人说话的声音。现在的麦克风阵列和语音识别还都是单人识别模式,距离多人识别的目标还很远。前面提到了现在的算法思想主要是&抑制&,而不是&利用&,这实际上就是人为故意简化了物理模型,说白了就是先拿&软柿子&下手,因此语音交互格局已定的说法经不起推敲,对语音交互的认识和探究应该说才刚刚开始,基础世界的探究很可能还会出现诺奖级的成果。若展望的更远一些,则是物理学的进展和人工智能的进展相结合,可能会颠覆当前的声学信号处理以及语音识别方法。
  如何选用麦克风阵列?
  当前成熟的麦克风阵列的主要包括:讯飞的2麦、4麦和6麦方案,思必驰的6+1麦方案,云知声(科胜讯)的2麦方案,以及声智科技的单麦、2麦阵列、4(+1)麦阵列、6(+1)麦阵列和8(+1)麦阵列方案,其他家也有麦克风阵列的硬件方案,但是缺乏前端算法和云端识别的优化。由于各家算法原理的不同,有些阵列方案可以由用户自主选用中间的麦克风,这样更利于用户进行ID设计。其中,2个以上的麦克风阵列又分为线形和环形两种主流结构,而2麦的阵列则又有Broadside和Endfire两种结构,限于篇幅我们以后的文章再展开叙述。
  如此众多的组合,那么厂商该如何选择这些方案呢?首先还是要看产品定位和用户场景。若定位于追求性价比的产品,其实就不用考虑麦克风阵列方案,就直接采用单麦方案,利用算法进行优化,也可实现噪声抑制和回声抵消,能够保证近场环境下的语音识别率,而且成本绝对要低很多。至于单麦语音识别的效果,可以体验下采用声智科技单麦识别算法的360儿童机器人。
  但是若想更好地去除部分噪声,可以选用2麦方案,但是这种方案比较折衷,主要优点就是ID设计简单,在通话模式(也就是给人听)情况下可以去除某个范围内的噪音。但是语音识别(也就是给机器听)的效果和单麦的效果却没有实质区别,成本相对也比较高,若再考虑语音交互终端必要的回声抵消功能,成本还要上升不少。2麦方案最大的弊端还是声源定位的能力太差,因此大多是用在手机和耳机等设备上实现通话降噪的效果。这种降噪效果可以采用一个指向性麦克风(比如会议话筒)来模拟,这实际上就是2麦的Endfire结构,也就是1个麦克风通过原理设计模拟了2个麦克风的功能。指向性麦克风的不方便之处就是ID设计需要前后两个开孔,这很麻烦,例如叮咚1代音箱采用的就是这种指向性麦克风方案,因此采用了周边一圈的悬空设计。
  若希望产品能适应更多用户场景,则可以类似亚马逊Echo一样直接选用4麦以上的麦克风阵列。这里简单给个参考,机器人一般4个麦克风就够了,音箱建议还是选用6个以上麦克风,至于汽车领域,最好是选用其他结构形式的麦克风阵列,比如分布式阵列。
  多个麦克风阵列之间的成本差异现在正在变小,估计明年的成本就会相差不大。这是趋势,新兴的市场刚开始成本必然偏高,但随着技术进步和规模扩张,成本会快速走低,因此新兴产品在研发阶段倒是不需要太过纠结成本问题,用户体验才是核心的关键。
  本文作者陈孝良,工学博士,声智科技创始人。
德州仪器(TI)
供应链服务
商务及广告合作
Jeffery Guo
关注我们的微信
供应链服务 PCB/IC/PCBA
版权所有 (C) 深圳华强聚丰电子科技有限公司
电信与信息服务业务经营许可证:粤B2-干货 | 智能音箱大火的背后推手—麦克风阵列技术解析
麦克风阵列
前几年,语音交互应用最为普遍的就是以Siri为代表的智能手机,这个场景一般都是采用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语音识别需求的声音信号。但是,若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,这会严重影响语音识别率,更谈不上实现声源定位和分离。
所以,当语音交互的场景过渡到以智能音箱、机器人或者汽车为主要场景的时候,单麦克风的局限就凸显出来。为了解决单麦克风的这些局限性,麦克风阵列技术应运而生。
麦克风阵列,特指应用于语音处理的按一定规则排列的多个麦克风系统。对采集的不同空间方向的声音信号进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源定位测向、声源跟踪、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。如果把语音识别看成一个接收信息、解析信息、做出反馈过程的话,麦克风阵列解决的是听不听得到、多远距离属于合理范围、不受噪音影响的问题。
麦克风阵列技术的技术难点
传统的阵列信号处理技术直接应用到麦克风阵列处理系统中往往效果不理想,其原因在于麦克风阵列处理有不同的处理特点。
阵列模型的建立
麦克风主要应用处理语音信号,拾音范围有限,且多用于近场模型,使得常规的阵列处理方法如雷达,声呐等平面波远场模型不再适用,在近场模型中,需要更加精准的球面波,需要考虑传播路径不同引起的幅度衰减不同。
宽带信号处理
通常的阵列信号处理多为窄带,即不同阵元在接受时延与相位差主要体现在载波频率,而语音信号未经过调制也没有载波,且高低频之比较大,不同阵元的相位延时与声源本身的特性关系很大—频率密切相关,使得传统的阵列信号处理方法不再完全适用。
非平稳信号处理
传统阵列处理中,多为平稳信号,而麦克风阵列的处理信号多是非平稳信号,或者短时平稳信号,因此麦克风阵列一般对信号做短时频域处理,每个频域均对应一个相位差,将宽带信号在频域上分成多个子带,每个子带做窄带处理,再合并成宽带谱。
声音传播受空间影响较大,由于空间反射,衍射,麦克风收到的信号除了直达信号以外,还有多径信号叠加,使得信号被干扰,即为混响。在室内环境中,受房间边界或者障碍物衍射,反射导致声音延续,极大程度的影响语音的可懂度。利用麦克风阵列去混响的主要方法有以下几种:
基于盲语音增强的方法,即将混响信号作为普通的加性噪声信号,在这个上面应用语音增强算法。
基于波束形成的方法,通过将多麦克风对收集的信号进行加权相加,在目标信号的方向形成一个拾音波束,同时衰减来自其他方向的反射声。
经过去混响后的语音信号频谱
基于逆滤波的方法,通过麦克风阵列估计房间的房间冲击响应,设计重构滤波器来补偿来消除混响。
混响语音信号频谱
声源定位技术在人工智能领域应用广泛,利用麦克风阵列来形成空间笛卡尔坐标系,根据不同的线性阵列,平面阵列和空间阵列,来确定声源在空间中的位置。智能设备首先可以对声源的位置做进一步的语音增强,当智能设备获取你的位置信息可以结合其他的传感器进行进一步的智能体验,比如机器人会听到你的呼唤走到你的身边,视频设备会聚焦锁定说话人等等。
麦克风阵列技术相对于单麦克风系统有很多优点,已成为语音增强及语音信号处理的重要部分。语音增强和声源定位已经成为阵列技术中不可缺少的部分,在视频会议,智能机器人,助听器,智能家电,通信,智能玩具,车载领域都需要声源定位和语音增强。
当下,大部分语音信号处理都是基于平稳信号的假设,但是语音信号的特征参数均是随时间而变化,是典型的非平稳态过程。因为语音信号具有短时平稳的特性,所以可以用主流信号处理方法对其处理。因此,麦克风阵列的基本原理和模型方面还存在较大的局限,所以基础研究的突破才是未来的根本。
麦克风阵列受制于半波长理论的限制,限制了ID设计的自由性。很多产品采用2个麦克风其实并非成本问题,而是出于ID设计考虑。实际上,借鉴雷达领域的合成孔径方法,麦克风阵列可以做的更小,移植到消费领域只是时间问题。
当前无论是2个麦克风还是4、6个麦克风阵列,成本都是比较高的,这影响了麦克风阵列的普及。低成本化不是简单的更换芯片器件,而是整个结构的重新设计,包括器件、芯片、算法和云端。近年来,由于新技术的应用,多麦克风阵列的成本下降非常明显。
多人声的处理和识别
人的耳朵可以在嘈杂的环境中分辨想要的声音,并且能够同时识别多人说话的声音。但现在的麦克风阵列和语音识别还都是单人识别模式,距离多人识别的目标还很远。现在的算法思想主要是“抑制”,而不是“利用”,这实际上就是人为故意简化了物理模型,因此语音交互格局已定的说法经不起推敲,对语音交互的认识和探究应该说才刚刚开始,基础世界的探究很可能还会出现诺奖级的成果。若展望的更远一些,则是物理学的进展和人工智能的进展相结合,可能会颠覆当前的声学信号处理以及语音识别方法。
阵列麦克风对人工智能的意义
通过电扫阵列等空间定位技术可以获取声源的有效位置,智能设备在获取精准的声源位置信息,让我们的语音更加智能,通过算法获取高品质的语音信号质量。
麦克风阵列可以自动检测声源位置,跟踪说话人,同时可以获取多声源和跟踪移动声源的优势,无论你走到任何位置,智能设备都会对你的位置方向进行语音增强。
阵列麦克风增加了空域处理,对多信号空时频三维的处理弥补单信号在噪声抑制,回声抑制,混响抑制,声源定位,语音分离方面的不足,让我们的智能设备在复杂的环境中都可以获取高质量的语音信号,提供更好的智能语音体验。
在万物互联的今天,麦克风阵列技术已经走进了我们的日常生活。在智能音响、智能家居、机器人、可穿戴设备等应用热潮正兴起的时代,语音交互由于其便捷性,成为人机交互入口的第一选择,麦克风阵列技术自然也成为热门的前端技术。进击的麦克风阵列还会给人工智能带来什么,让我们拭目以待。
本期内容刊载于《智能家居》杂志第129期 激光电视搅动人类视觉革命 ,想要了解更多,欢迎扫码订阅
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点叮咚智能音箱灵动版A3 京东正式上线 - 产经要闻 - 科技讯
叮咚智能音箱灵动版A3 京东正式上线
随着亚马逊、Google、苹果等巨头相继推出智能家居服务,语音+人工智能的交互方式即将成为下一代的交互主流。然而国外的智能语音交互、智能家居平台正如火如荼地发展,国内的科技公司如何面对国外的挑战?京东与科
随着亚马逊、Google、苹果等巨头相继推出智能家居服务,语音+人工智能的交互方式即将成为下一代的交互主流。然而国外的智能语音交互、智能家居平台正如火如荼地发展,国内的公司如何面对国外的挑战?京东与科大讯飞的合资公司灵隆科技在这方面交出了一份学霸级答案:10月24日灵隆科技正式发布了叮咚系列全新产品&&灵动版智能音箱A3。其不仅在语音技术上搭载了全新的交互界面AIUI,并且延续京东智能在家庭入口上的布局,随着京东智能云语音服务开放平台的上线,第三方服务也将接入。从而基于音箱所扩展的应用场景变得异常丰富。
  用过智能语音音箱的用户都有这样的体验:在家里,通过按键去点播内容则需要随时拿着音箱去说话,失去了在家里的自由控制;有了远场语音交互,却因为高耗电量没办法随身携带到户外。国内外科技公司纷纷对于此问题束手无策,而灵隆科技这次发布会中展示的产品灵动版智能音箱A3,采用了分体式设计,将远场交互与便携完美地结合起来。
远场唤醒和便携两者兼得
  叮咚音箱灵动版A3拥有远程与按键两种语音唤醒方式。延续了叮咚音箱A1,采用了领先的麦克风阵列技术,实现有效的中远场识别;同时内置4400mh的大容量电池可满足8-10个小时的出行需求。
音质表现不弱国际品牌
  在音质表现上,叮咚音箱A3选用了丹麦品牌Peerless 25芯6mm全尺寸音圈,提供10W的功率和足够大的总冲程,使其可以达到更加澎湃的低音以及更为清澈的高音;振膜采用进口普利司通泡棉折环,以及特别设计的弧面拉丝阳极铝薄膜胴体,使喇叭具有低谐振频率的同时具有细腻而通透的高频听感;同时,灵动版采用德州仪器的3254DSP芯片,和3118功放解决方案,使其具有超过CD品质的48K采样率,而多段的DRC设计,让低音、人声、高音并不相悖,提高了音乐的立体感。
的进一步拓展
  本次发布会上,叮咚在智能家居领域又向前迈了一步,实现了与美的、小天鹅,以及智米的智能家居设备的联动,未来随处可见的智能家电都将可以通过音箱远场控制。
服务更加丰富
  除了音箱本身的听音乐、百科知识、控制家电等功能外,为了让叮咚的用户在生活中更加便捷,叮咚音箱灵动版A3提供了多种生活服务,如:LBS、查询外卖、语音笔记,未来更将上线京东折扣讯息以及京东订单的查询等功能。
连接方式满足更多场景
  本次发布的叮咚音箱灵动版A3,支持WiFi、蓝牙4.0、Line In 、TF卡多种连接方式,无论此时处于任何连接模式,只要说出&叮咚叮咚&,即随时急速响应,进入待操作模式。
  10月24日,叮咚音箱灵动版A3在发布的同时,已在京东商城上线预约,价格为698元,
换一换
12-18 18:11
12-18 17:53
12-18 17:47
12-18 17:32
12-18 17:30
11-23 12:13
11-09 16:42
10-26 16:31
07-11 16:32
08-06 16:17
12-18 20:46
12-18 20:37
12-18 19:56
12-18 19:50
12-18 19:28
12-18 17:32
12-18 17:23
12-18 17:13
12-18 17:06
12-18 16:50
12-18 16:35
12-18 16:21
12-18 16:09
12-18 16:11
12-18 15:42
12-18 15:34
12-18 15:30
12-18 15:20
12-18 14:36
12-18 13:58
12-18 13:43
12-18 12:03
12-18 11:57
12-18 11:50
12-18 11:46
12-18 11:28
12-18 11:20
12-18 10:33
12-18 10:39
12-18 10:26
& 科技讯版权所有问题是这样的: 麦克风阵列有声音,但是麦克风\输入没声。但是语音识别中,又是有声音的。请问怎么办_百度知道
问题是这样的: 麦克风阵列有声音,但是麦克风\输入没声。但是语音识别中,又是有声音的。请问怎么办
我有更好的答案
没看明白,描述得让人糊涂了。
为您推荐:
其他类似问题
您可能关注的内容
语音识别的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。该看到未来的布局 国产三大智能音箱横评(视频)
  【PConline横评】苹果的HomePod说了这么久终于还是来了,说到智能音箱,有全球范围内火热的亚马逊echo和谷歌的Google Home,而国内的智能音箱也是发展了不短的时间了啊。都说智能音箱是未来智能家居的入口,目前来说,各家音箱的语音识别和反馈做得怎么样了?发展了这么久各家掌握的资源到底有多少了?下面这篇横评将为你一一讲解。  为了更加清晰明了地展现测试过程,我们做了一个视频,有WIFI有流量的同学服用视频效果更佳。  没流量的朋友也不用担心,我们还做了图文版,图文版会更加完整补充整个测试的过程。一、工业设计  在智能音箱形成了百箱大战局面的今天,又恰逢流行消费升级了,现在买什么不得看一下好不好看呢?况且这还是一款家居家电当中的重要一环,那么音箱的颜值高低就成了影响其销量的非常重要的因素了。  叮咚2代:外形淡雅 还有点阵LED屏幕  叮咚2代的机身体积是三者中的中等水平,高16.2cm,重757g。圆柱形表面四周覆盖着一层编织布,3种颜色当中的北欧灰版本跟淡雅的家居风格很搭。  顶部是可触摸式的塑料盖板,可以进行切歌和调节音量等常规操作,值得一提的是,顶部盖板底下还布置了点阵式LED灯,盖板还充当了显示屏的作用。  机身侧面有一个12度的倾斜角,在设计上增加了立体感的同时还方便了用户查看显示内容,提升了触摸体验。  机身内部采用了7+1环形麦克风阵列,模拟成360度的拾音,麦克风的音质和拾音的能力我们在下面的视频里做了测试。  天猫精灵:体积小巧 底部发光  天猫精灵是三者当中体积最小最轻巧的,高度只要12.6cm,重量464g。圆柱形的音箱体,表面是类肤材质和编制网布的混搭,上半部分的类肤材质比较容易沾灰尘。  LED灯隐藏在箱体的底部,语音交互时向桌面投射光线,这种发光方式在3台音箱当中算是别出心裁了。  顶部是控制按键,包括静音键和加减音量键,可以看到顶部周围环形分布着6个麦克风,关于音量和音质可以看看视频和以下的图文部分。  小爱音箱:是音箱还是空净?  小爱是3台当中体型最大的,高度21.1cm,重760g,重量上倒是比京东叮咚大不了多少。但要吐槽的是,这外形就跟自家的空气净化器一个样子啊!这可能是空净的设计师兼职设计出来的吧。(小爱同学)(自家空净)  作为智能家居这么重要的入口,小爱这次的设计就显得不太走心了。顶部则是6个环形麦克风,还有播放、切歌和换频道的控制按键,以及一圈LED灯带。  小结:看完国内多家的智能音箱,你会发现它们在外形和配色上更多偏向小清新的家居风格。我们也看到了很多的编织物材质,这种有浓厚北欧家居气息的材质近年来也备受崇尚小资的年轻群体所喜爱。  但要知道的是,我们评测过的产品当中的大部分都从来没有用过这种材质,这也从侧面看得出各不同厂商对于智能音箱在家居中角色扮演的不同理解,以及厂商们的重视程度。
键盘也能翻页,试试“← →”键
总排行榜我在第15位
参考价:¥799
网友评分: 0
外设配件图赏
外设论坛帖子排行
最新资讯离线随时看
聊天吐槽赢奖品

我要回帖

更多关于 阵列麦克风tecohoo 的文章

 

随机推荐