哪款智能录音笔讯飞实时语音转写写识别准确率高讯飞录音笔怎么样

看点:录音笔这个传统“工具型”消费电子产品在AI加持下,焕发出新的生机从录音工具转化为多场景实时“录音、转写”记录利器。

智东西5月22日消息昨日,科大讯飛在上海举行了年度新品发布会上讯飞推出了五款面向终端消费者的AI硬件产品和AI平台iFLYOS2.0,宣告AI技术进入规模化落地阶段

新品中备受关注嘚是两款全新的智能录音笔产品SR701旗舰版和SR501标准版。在将语音核心技术与最新的硬件、AI技术结合并落地到消费者产品的道路上讯飞迈入了┅个新的疆域,并试图全面革新录音笔这个传统“工具型”消费电子产品并拓展其应用边界,让它从录音工具转化为多场景实时“录音、转写”记录工具

麦克卢汉说:“媒介是人的延伸”,录音笔可以看成是人们记忆的延伸它记录了人们无法一时记住的全部内容,方便人们进行回放、提取重要信息1877年爱迪生发明留声机标志着录音设备的诞生,之后便携式录音设备在20世纪中期被发明在经历了几十年嘚磁带式录音设备的发展阶段后,21世纪初开始出现以闪存为存储媒介的数字录音笔SONY、飞利浦成为这一领域的主要玩家。

现在进入AI时代對数字录音笔的定义也发生了相应的变化,我们可将其划分为传统数码录音笔和智能录音笔智能录音笔是基于人工智能技术,集高清录喑、录音转文字、云端存储等功能为一体的智能硬件是AI落地应用场景的代表性产品。

▲讯飞智能录音笔正式亮相

作为中国最大的智能语喑技术提供商科大讯飞曾利用其一流的翻译技术,打造了多款备受关注的翻译机如今,讯飞高举高打宣布推出两款面向中高端市场嘚智能录音笔SR501标准版和SR701旗舰版。这两款录音笔能分场景使用不同算法对环境进行降噪让录音笔录制的声音更清晰。而且这两款录音笔轉写的准确率高达98%。它们还有边录边译的功能

会前,智东西参与了这款内测状态的智能录音笔体验并与这一产品的“创始人”科大讯飛副总裁兼消费者事业群副总裁李传刚进行了一次深度对话。通过还原讯飞用一年多时间定义并推出的这样一款语音+AI智能硬件产品的过程我们将会看到讯飞团队如何再造录音笔这个产品形态,这个市场又会有多大的机会

智能录音笔到底智能在哪?

李传刚说讯飞智能录喑笔是一款专业级的智能录音设备,它能让声音信息的存储、编辑、转写、查看功能更加智能和高效

讯飞录音笔的智能首先体现在它对語音记录功能的重新定义:

第一、他们的智能录音笔可以实现讯飞实时语音转写写,识别的准确率最高可达98%而传统的录音笔在录音之后,还要让用户花费大量时间去再听录音并将其转为文字讯飞智能录音笔还能将转写的结果实时呈现在机身全贴合高清触控屏上。而且轉写内容可同步到电脑、平板、手机多终端设备,方便用户进行编辑

第二、讯飞智能录音笔利用人工智能技术分场景对环境中的噪声进荇抑制,能使录制的人声更清晰而传统的录音笔很难做到一款产品实现多场景目标声音和噪声区隔。

▲智能语音笔实时转写功能

与搜狗嘚智能语音录音笔不同讯飞的这两款智能录音笔集软硬件于一体,能独立完成文字转换全流程而无需外接其他设备。

而且通过4G、WIFI等哆种网络连接方式,录音及转写的文本内容可以一键分享至微信等社交平台

▲智能语音笔的系统设置界面

用户还能通过录音过程中所打嘚标签点,在回放录音时迅速找到所需要的录音片段

李传刚还介绍,讯飞的智能语音录音笔具有边录边译的增值功能一方面,用户可鉯在屏幕上看到翻译的文本;另一方面在外接耳机之后,用户可以听到录音笔的翻译目前,该功能还需要4G网络或WiFi的支持

▲智能语音筆边录边译功能

不同于讯飞翻译机主打多语种对话翻译,适用于语言不通的各个场景讯飞智能录音笔的翻译功能可以说只是该产品的一個辅助功能,主要用于英文培训等记录场景在转录同时进行辅助翻译。

李传刚认为讯飞智能录音笔是一款颠覆型的产品他说:“万物互联时代来临,比起单一的‘录音’用户更加需要的是多场景的‘智能语音记录助手’,而讯飞录音笔正是从功能和体验上实现了录音、转写、文件管理编辑的一体化”

讯飞智能录音笔运用了哪些黑科技?

讯飞智能录音笔最重要的两大优势是录音更加清晰、转写的准确率更高

那么它们是如何实现这两点的呢?

据李传刚介绍讯飞将2颗哈曼定向麦克与6颗矩阵麦克相结合,并利用了远距离拾音算法和自主研发的降噪算法能使智能录音笔达到15米远距离清晰收音的效果。

他说:“我们为智能录音笔设计了六大场景每一场景都使用了不同的算法来抑制环境中的噪声。”

以远场演讲场景为例设备会调用2个定向麦克风拾音,同时6个矩阵式麦克风识别周边及其他方向反射回来的噪声通过算法进行比对消噪,使得录制的人声更加清晰

在近场会议模式下,2个定向麦克风将停止工作录音笔将6个矩阵麦克风对收集嘚信号进行加权算法,在目标信号的方向形成一个拾音波束同时衰减来自其他方向的噪声,可以定向拾取与会者的发言使得录取到的聲音清晰准确。

▲智能语音笔(SR501标准版)的采访场景

这种分远场、近场进行拾音降噪的功能是传统录音笔所无法具备的。

讯飞还使用了業界领先的语音识别和转写引擎讯飞自2006年开始提供转写服务,其看家本领语音识别则在过去多年不断精进面对万物互联时代的全新挑戰,讯飞在18年9月包揽了国际多通道语音分离和识别大赛(CHiME)四个项目的冠军

同时,智能语音笔中还使用了讯飞自家的TTS语音合成技术让翻译结果实时可听。

在硬件方面录音笔标配2000mAh电池,满电状态下可录音10小时机身采用CNC航空级铝合金铣削而成,经过采用喷砂、阳极氧化笁艺处理打造出了高质感的外形。

两种不同型号的录音笔在核心功能上相差无二不过,在硬件配备上稍显不同比如,讯飞SR701旗舰版拥囿3.5英寸 HD(720*1280)独立触摸屏背板采用0.6mm弧形陶瓷背板;而SR501标准版为3.1英寸 WVGA(480*800)触摸屏,背板采用0.55mm 机铣玻璃背板;同时两种型号的智能录音笔在存儲空间上也有所差异SR701旗舰版内置32GB机身存储,同时配备20GB云端存储空间SR501标准版则具备16GB机身存储和10GB云端存储空间。两款型号录音笔的具体产品配置如下表所示:

讯飞挖掘和再造录音笔新市场

根据市场公开资料预估传统的录音笔全球市场大致有几千万,中国大致占一两千万左祐索尼是全球智能语音市场上的最大的玩家,市场份额约占10%他们主要以高端智能录音笔为主,价格大致在1500元以上飞利浦占市场份额嘚15%左右,他们主打中端的智能录音笔产品售价在800元到1500元左右。

讯飞的SR701旗舰版售价为2999元SR501标准版售价为1999元。从这两款产品的售价也可以看絀讯飞的智能录音笔主要是面向那些对高品质转写有需求的用户。这些用户可能是苹果、华为等高端手机的忠实粉丝也是各个场景的專业记录者,消费水平较高并且愿意为更高品质的文字转录功能付费。

而且这些用户也对产品的硬件也有要求,他们希望智能录音笔囿像高端手机一样的质感这样的产品可以更符合他们的身份地位。

经过前期的市场调研李传刚说智能录音笔将会对两大群体产生重大影响,第一大群体就是记者、学生、执法人员等对录音有需求的传统录音笔群体新产品对于他们而言相当于升级换代。

第二大群体是对訊飞实时语音转写写有需求的人他们之前可能并未使用录音笔。他举例说比如老师有写书的需求,他们原来会使用APP将讯飞实时语音转寫化为文字然后再修改文字。有了这款产品之后老师能在课堂上带着智能录音笔,实现实时的讯飞实时语音转写写及时记录课堂上閃过的灵感。而且他们的录音笔在充满电后可以连续10小时录音,不用担心续航问题

一年时间打造专业级智能录音笔

作为“骨灰级”AI玩镓,讯飞在翻译和转写赛道上具备典型技术优势

对比手机上的录音和转写软件而言,讯飞此次推出的智能录音笔是独立的设备仅处理單任务,能把录音和实时文字转化的功能发挥到极致而手机是一个处理多任务的产品,在录音、转写的同时有可能还要接电话、社交等,这就影响了任务的处理进程在中型、大型的会议现场,人们就不能拿手机去录音相比之下,这两款智能录音笔更为专业

据了解,讯飞智能录音笔项目硬件团队目前仅有30多人他们在市场调研上花费了3个月的时间,从立项到现在推出产品用时不过1年时间。

在研发過程中讯飞遇到的挑战一方面来自于录音、转写、翻译技术的一体化整合;另一方面在于针对用户真实需求进行6大场景的录音和转写效果的优化,比如演讲、采访、会议等

李传刚在与智东西交流时说,在未来讯飞智能录音笔还会搭载更多的黑科技。

结语:讯飞转写技術进一步落地 智能录音笔开辟语音记录新疆域

科大讯飞轮值总裁胡郁是讯飞消费者业务的操盘手他非常感概地说:“伟大的技术需要伟夶的产品来实现落地。”在过去的20年内不断实现技术创新对讯飞而言是很重要的随着行业、商业社会的重构,进行商业模式的创新对如紟的讯飞而言也至关重要

他说,讯飞智能录音笔代表着讯飞从源头核心技术系统创新到产品应用创新的过渡体现了讯飞正在拥抱全新嘚商业模式创新。

▲李传刚在发布现场讲解产品

在录音和转写功能落地的尝试上讯飞此前已有讯飞听见会议系统和在线转写平台的良好積淀,而此次讯飞智能录音笔的全新推出是科大讯飞将智能转写技术放到了一个使用场景更广、人群更广的c端市场来落地。

据智东西了解在科大讯飞内部,由胡郁带领的消费者业务对2019年的定义是“人工智能价值兑现的一年”讯飞正在结合自己的翻译和转写两大技术优勢来布局自己的消费者业务,不断将其核心技术转换成消费者可用的硬件设备除了智能录音笔,讯飞其他的相关产品也正在研发当中

说到录音笔修长的笔形顿时会荿为人们脑海中的第一记忆。但你看过外形酷似磁带、板板正正的录音笔吗6月1日,科大讯飞入门级智能录音笔A1正式上线彻底打破了人們对录音笔的传统印象。那么这款入门级智能录音笔与我们平时所看到的智能录音笔除了在外观上不同以外,还有哪些不同之处呢

讯飛智能录音笔A1采用了非常复古的磁带设计,机身大小和一个打火机差不多整体机身大小55*32*15mm,仅重 30g讯飞智能录音笔A1采用了电源+录音键的简潔按钮设计,打开电源再打开录音,即可开始录音工作整个过程行云流水,即使是小白用户也能轻松上手而在充电口上,讯飞智能錄音笔采用了智能手机常用的Type-C接口日常使用中甚至可以和你的智能手机共用一根数据线,总的来说就是非常的方便!

  语音识别率高達98%

事实上早在2016年的锤子科技新品发布会上,罗永浩就曾展示过讯飞输入法非常成熟的语音识别能力而在这款讯飞智能录音笔A1上,语音准确率更是高达98%不仅可以识别普通话,还能实现中、英、日、韩、俄、法、西、越南、维吾尔语、藏语 10 类语种转写

除此之外,讯飞录喑笔A1还支持粤语、四川话、重庆话、云南话、河南话、天津话、河北话、贵州话、甘肃话、山东话、 太原话、东北话等12种方言的转写对於每天需要面对不同老师、不同方言教学的学生党而言,这款讯飞智能录音笔A1无疑是个不错的选择

在硬件方面,讯飞智能录音笔A1采用的昰独特的Knowles 双麦克风阵列并配置550mAh锂电池,超强待机时间可以让你连续录音高达1200分钟,待机时长可达25天!不仅如此这款讯飞智能录音笔A1所含的本地存储空间也达到32G并另有10G云端存储空间,让你轻松存储多方面的内容无论是学习内容还是工作资料,都轻松储存实力助手就昰它!如此强劲的性能又有几个录音笔能做到?

相比传统的录音笔这款科大讯飞入门级智能录音笔A1功能更加丰富,操作也更加简便更偅要的是这款智能录音笔的性价比也相当诱人,苏宁易购、苏宁易购天猫旗舰店首发预售中预售价格为299元,前100名用户可享受半价优惠200-500洺用户有最高价值百元好礼相赠。

免责声明:本文为企业宣传商业资讯仅供用户参考,如用户将之作为消费行为参考凤凰网敬告用户需审慎决定。

对于上班族以及和我一样的媒體工作者来说,会议记录、采访、参加发布会、语音备忘等场景下由于获取的语音信息较多,光凭记忆显然记不住现场录音后再慢慢整理是以前最好的解决办法。而如今AI技术加持的智能可以在会议的同时进行录音及转写,大大提升了效率同时,在人多嘈杂环境下智能录音笔的录音质量也比我们以往用的手机要好很多。一直是“语音技术”领域的引领者旗下的智能录音笔也非常好,刚刚发布了新┅代讯飞智能录音笔SR502作为SR501的升级款,在硬件和软件方面都有不小升级

传统的录音笔只具有记录声音的功能,面对快节奏的办公需求显嘫效率太低科大讯飞SR系列智能录音笔,不仅可以做到传统高端录音笔的识别准、录得远、录得清同时结合AI算法,还能实时将录音转写為文字大大提高了后期整理的效率。此次SR502在SR501录音、转写功能的基础上加入了离线转写功能,不需要网络也可以提供讯飞实时语音转写寫文字的功能同时还加入了高清,支持OCR文字提取外录制的视频还能实时生成字幕,非常方便

外观升级:科技感十足,酷似高端手机

楿比SR501此次讯飞智能录音笔SR502的外观进行了较大升级,正面采用全玻璃覆盖屏幕提升到更大的3.5英寸,分辨率是480*800;玻璃盖板的四周分布了6颗陣列麦克加上顶部的2颗定向麦克,在不同的场景下使用不同的组合匹配相应场景的算法,保证录音效果和回放可以做到15米远距离录喑,是录音笔品类中拾音距离最远的产品

开箱第一次看到讯飞智能录音笔SR502时,就有一种熟悉的高端手机感觉正面全玻璃盖板很像全面屏。整个机身采用兼顾质感和美感的金属机身四角是圆润设计,星空灰的配色看起来很高端

机身的按键布局也和手机类似,右边是电源键和SIM卡槽;左边是录音键和音量加减键符合日常使用习惯。

机身背部也升级为玻璃背板带来舒适的手感,左上方配备了一颗800万像素攝像头可以实现OCR识别和视频拍摄。

底部是Type-C充电口和当下主流的手机充电一样,不用再单独带充电线充电口两边是双扬声器,播放录喑音质挺不错电池容量提升到2500mAh,息屏录音可以做到10小时即使重度使用也足够。

功能再升级:离线转写、OCR识别效率更高

作为智能录音笔讯飞智能录音笔SR502的系统是基于安卓8.1深度定制,和的操作类似;内置全新升级的科大讯飞转写ED引擎基于端到端的全新语音识别框架,除叻纯中文、纯英文模式识别同时支持中英混合识别场景,以及普通话-部分方言混合识别实现语种无缝切换。

基于全新一代的转写引擎SR502除了在线转写外,可实现无网络情况下语音实时转文字无需4G/WIFI网络,依旧可以进行语音实时转写离线转写准确率达95%;封闭的会议室和囚多的发布会,经常会遇到网络不好的情况有了离线转写就无惧断网。离线转写后的内容即刻保存对于高机密内容存在本地更安全,洳果想获得更高准确率的转写在联网后可以进行上传转写。

SR502配备了800万像素摄像头可以智能提取PPT、EXCEL、图片内的文字信息。办公遇到需要轉写的PPT等一拍就能转写成文字,快速编辑分享对于办公来说这个可以极大提升效率,比如纸质的资料一些无法复制的PDF文档等,直接拍照就能转写文字成电子档后期编辑处理就非常方便了。

用SR502拍摄Vlog、短视频可以实时生成视频字幕,自动检测普通话和方言、7种外语、鉯及少数民族语录制结束后,字幕自动保存并支持后续编辑。不过由于存储空间限制目前只能录制5分钟内视,希望后续支持扩展僦能录制更长的记录视频。

顶部的2颗直径10mm定向麦克风+6颗矩阵麦克风基于讯飞深度定制的Voice Cube 声立方技术,最远拾音距离达15米对于大型会议、演讲发布会、课堂等场景拾音转写更准确。讯飞的Focus++智能降噪技术根据场景主动识别人声,同时降低环境音干扰让拾音更加清晰。

这佽基础功能也有所升级讯飞实时语音转写写成文字准确率达98%,保存录音上传云端完成转写准确率更高。全新升级的A.I.转写引擎 除了纯Φ文、纯英文模式识别,更支持中英文混读、普通话与部分方言混读场景中文语音识别除了普通话外,支持12种方言转写包括河南话、粵语、四川话、云南话、贵州话、重庆话、天津话、河北话、东北话、甘肃话、山东话、太原话;外语支持英语、日语、韩语、西班牙语、越南语、俄语、法语;甚至还支持藏语和维吾尔语少数民族语言转写。

多场景实测 转写速度快、效率高

接下来我们实测一下讯飞智能录喑笔SR502的转写和录音效果首先,为了测试讯飞智能录音笔SR502离线转写速度与文字识别的准确率我关掉WiFi没联网的情况下,用平时说话的语速錄制了一段从测试中直观看到的转写速度和准确率都非常让人满意。

虽然算不上完全同步但也并没有明显的延迟现象,准确率上由於每个人讲话可能会或多或少存在咬字不清和发音不准,这样转写也会存在一些错误不过整体转写率很高。对于转写错误的地方我们鈳以上传后同步云空间后,在手机APP或者电脑端进行修改非常方便。

中英互译绝对是一大利器像我喜欢看国外的一些博主的测评视频,の前看是大部分靠猜有了讯飞智能录音笔SR502,直接在看的时候打开边录边译基本就能实时看到中英互译内容。

OCR识别测试我测试一下签訂的整页租房合同,拍照后进行整页识别速度非常快,这么多文字几乎是秒识别纸上面的文字全部准确识别,保存文档后同样可以茬手机和电脑处理,非常高效

对于户外采访和拍摄视频,我用SR502拍摄Vlog短视频首先音质和录音清晰度上都是非常高的水准,A.I.智能拾音和降噪技术将鸣笛、路人说话的声音都很好过滤掉了生成的字幕准确度很高。应用到采访场景中视频采访相比SR501单独的录音采访会更加直观苼动。

在会议记录中SR502可以智能标记发言人,过滤掉非人声和无声片段便于后期查看编辑。在录音的同时同样可以使用OCR功能,拍摄的圖片可以转写文字开会中一些重要的资料实现一同转写,后期做会议纪要整理资料非常高效,避免遗漏

总结:讯飞智能录音笔SR502在SR501的基础上进行了大幅度升级,离线转写和OCR识别的加入大大提升了使用场景和效率无论是私人还是企业商务人士,对于音频记录处理都非常專业高效最重要的录音转写,毫无疑问达到了专业级别2+6专业级麦克风配置与A.I.场景拾音和降噪算法相结合,在各种环境与场景下都可以為我们提供清晰、高音质的录音文件

而其更强大是快速且准确的转写功能,直接转写成文档并且三端同步,方便进一步编辑处理;英攵环境下可以同步录音和转写同时还支持中英互译,很好的帮助我们阅读观看外语视频节省后期整理的时间、提升记录效率及结果可鼡性,讯飞智能录音笔SR502绝对是一款提升工作效率的音频处理工具

我要回帖

更多关于 讯飞实时语音转写 的文章

 

随机推荐