国内有没有比较好的合成在线语音合成的评测平台?

国内做语音交互产品的公司有哪些?PS:特别是家居类单品的公司_百度知道
国内做语音交互产品的公司有哪些?PS:特别是家居类单品的公司
我有更好的答案
目前做语音识别国外最好的是nuance,国内最好的是科大讯飞,像产品的的话例如叮咚音箱,虽然叮咚的语音交互还没有很成熟,但也在当时产品上线时小小爆发了一下,所以说大家对于语音交互的产品也是很重视的;最后推荐大家关注一下IVYLINK这家公司,他们主要也是做人工智能语音交互的产品,小道消息,他们出品的智能音箱从语音交互到内容输出相对来说都会成熟了不少,大家可以期待一下喔!
国内目前做的最好的有两家,“科大讯飞”和“云知声”,“云知声”就是给“搜狗语音助手”和“xiaoi机器人”做语音识别支持的公司。科大讯飞股份有限公司(IFLYTEK CO.,LTD.),前身安徽中科大讯飞信息科技有限公司,成立于日,日变更为科大讯飞股份有限公司 ,专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成
。科大讯飞信息科技股份有限公司现任董事长兼总裁为刘庆峰先生,是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业,主要股东包括:中国移动、中科大资产经营有限公司、上海广信、联想投资、盈富泰克等。在语音技术领域是基础研究时间最长、资产规模最大、历届评测成绩最好、专业人才最多及市场占有率最高的公司,其智能语音核心技术代表了世界的最高水平。语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样简单。语音技术主要包括语音合成和语音识别两项关键技术。让机器说话,用的是语音合成技术;让机器听懂人说话,用的是语音识别技术。此外,语音技术还包括语音编码、音色转换、口语评测、语音消噪和增强等技术,有着广阔应用空间。搜狗语音助手是一款智能语音对话软件,从本地生活信息、地图,到百科知识、便民工具查询,再到新闻、图片等传统搜索内容,搜狗语音助手将这些都整合到自己的智能检索库中。用户可以通过语音——就像与朋友说话一样——轻松自然地向搜狗语音助手提问,眨眼之间便可得到精准的回答。不仅如此,他还能像一个私人助理一样为你管理生活日程,也能为你发短信、拨打电话。在你无聊的时候,还能与他聊聊天。
本回答被网友采纳
为您推荐:
其他类似问题
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。国内提供语音识别接口的有哪些公司?_百度知道
国内提供语音识别接口的有哪些公司?
我有更好的答案
  国内目前做的最好的有两家,“科大讯飞”和“云知声”,“云知声”就是给“搜狗语音助手”和“xiaoi机器人”做语音识别支持的公司。  科大讯飞股份有限公司(IFLYTEK CO.,LTD.),前身安徽中科大讯飞信息科技有限公司,成立于日,日变更为科大讯飞股份有限公司 ,专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成
。  科大讯飞信息科技股份有限公司现任董事长兼总裁为刘庆峰先生,是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业,主要股东包括:中国移动、中科大资产经营有限公司、上海广信、联想投资、盈富泰克等。在语音技术领域是基础研究时间最长、资产规模最大、历届评测成绩最好、专业人才最多及市场占有率最高的公司,其智能语音核心技术代表了世界的最高水平。  语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样简单。语音技术主要包括语音合成和语音识别两项关键技术。让机器说话,用的是语音合成技术;让机器听懂人说话,用的是语音识别技术。此外,语音技术还包括语音编码、音色转换、口语评测、语音消噪和增强等技术,有着广阔应用空间。  搜狗语音助手是一款智能语音对话软件,从本地生活信息、地图,到百科知识、便民工具查询,再到新闻、图片等传统搜索内容,搜狗语音助手将这些都整合到自己的智能检索库中。用户可以通过语音——就像与朋友说话一样——轻松自然地向搜狗语音助手提问,眨眼之间便可得到精准的回答。不仅如此,他还能像一个私人助理一样为你管理生活日程,也能为你发短信、拨打电话。在你无聊的时候,还能与他聊聊天。  
辽工大在校生
国内目前做的最好的有两家,“科大讯飞”和“云知声”,“云知声”就是给“搜狗语音助手”和“xiaoi机器人”做语音识别支持的公司。
本回答被提问者采纳
中科信利也提供,核心技术来源于中科院声学所,不逊讯飞。很多大公司采用。
上海闻通信息科技有限公司,他们应该有这个实力,但不知道有没有做。
来自:求助得到的回答
科大讯飞,上市公司,直接输百度可查
世界上最优秀的了排前几位,还有我忘了,川大智胜,上市公司,
其他2条回答
为您推荐:
其他类似问题
您可能关注的内容
语音识别的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。选择语音评测技术服务商,必须考虑的4大因素!
驰声科技  
& & & &外语科目在近年来的中高考改革中一直备受关注,考核重点越来越注重语言的实际应用能力。从高考改革来看,目前已有16个省份公布了高考改革方案,“3+3”高考模式成为趋势。外语和语文、数学科目保持统一高考、分值不变,不分文理科,且外语科目提供两次考试机会。从中考改革来看,越来越多的地区将听力与口语考试共同纳入到英语考试的项目中,采取“人机对话”的方式,更科学地考察学生的英语听说能力。在这样的大环境下,口语能力已经成为必备的应试要求。从体制内到体制外的教学中,都越来越重视口语能力的提升。
& & & &随着大数据、人工智能等新技术的兴起,在教育领域的成功应用之一的智能语音技术,对口语学习的教学和评测起到了革命性的变化。语音技术对于一个语言类学习产品而言,就像是发动机对于汽车。驰声科技是国内最早进入教育行业的语音公司之一,利用自主研发的语音技术帮助客户实现人机互动的智能学习产品。近期国内一家少儿学科英语的巨头选择放弃免费平台,耗资百万与驰声科技合作,只为更好的用户体验,使评价结果更加精准、客观。
& & & &这也让我们思考,在客户选择一家可持续合作的战略伙伴时要考虑的因素:
1、用户体验是否更好
& & & &比如选择语音云平台时,如果不想用户在使用中的体验因堵塞或无响应而下降,就要考虑这两点:(1)云平台的连通性。如果您的用户遍布全国,但是高峰期的时候,会有多少用户连不上?(2)云平台的可扩展性。如果您今天已经拥有10万用户,但预计年底增长到100万用户,用户是否会连不上?
2、内核支持的题型和反馈维度是否丰富
& & & &语音内核能否支持丰富的题型,比如中高考英语口语考试必考的口头作文、看图说话等开放题型。评测反馈的维度是否丰富,不仅能够指出错误,还能看到错在哪里,真正对学习提升起到指导作用。
3、内核支持的开发平台、开发框架和开发语言是否全面
& & & &如果您的开发平台和架构不常见,选择语音内核时不仅要考虑能否支持还要考虑对方在这方面的是否有丰富的积淀。
4、合作的可持续发展性及日后是否会形成竞争关系
& & & &选择合作伙伴时,不仅要考虑当下的合作,还要考虑日后能否支持您业务的快速发展,并且会不会存在竞争的可能性。
& & & &好的合作伙伴一定是和客户一起成长,一起成功。驰声科技已经服务了培训机构、出版、教育软件、在线教育、教育硬件、考试服务等领域的一大批优秀的客户,如新东方、好未来、培生、外研社、《学英语》报社、浙教社、江苏凤凰、51Talk、一起作业网、蓝鸽、乐视、新加坡联合教育局、英国开放大学等等。市场上每10个语言类学习应用中,有6个使用的是驰声科技的语音技术。与市场上其他同业相比,总结驰声科技的优势在于:
一、高峰期20%的在线并发冗余,让客户从容面对访问高峰期
& & & &驰声科技提供高并发高可用性高连通性,大数据存储、清洗、分析的基础方案和云平台。对于用户量大的在线评测客户,为保证客户的应用运行顺畅、稳定,驰声科技会额外支持20%的在线并发冗余,让客户从容面对访问高峰期。
二、语音评测引擎的种类和反馈维度的丰富性
& & & &在教育行业的语音技术授权领域,驰声科技的团队从2007年开始专研,并一直耕耘到现在,现拥有业界最多的语音技术授权合作伙伴。相比近两年开始起步,或者从没有对外大规模授权业务的业内友商们,驰声科技的语音评测引擎的种类丰富,反馈维度也是最多的。比如发音评测,不仅可以进行综合评分,还能定位到具体单词的出错点,并诊断出具体错误。
三、拥有自主知识产权的语音评测技术
& & & &在语音评测技术领域拥有众多的专利、软件著作权、软品等证书数十个,如:一种错误自感知的声调发音学习方法和系统专利证书、一种口语考试的分布式自动评分系统及其方法专利证书、一种用于口语学习的元数据处理方法和系统专利证书等等。语音评测内核覆盖了中英文等多种语言,适用于平时练习,口语考试等多场景应用。
四、评测引擎支持最齐全的平台、开发框架和开发语言
& & & &驰声科技的评测引擎支持最齐全的平台、开发框架和开发语言,比如支持Android平台,驰声科技不仅仅支持市面上相对常见的Intel和Arm架构,还支持众多的不常见但仍拥有不少用户的架构。而面向不同开发框架,例如ANE、CoCo2D等等,驰声科技都支持。今年为了配合VR技术,首家推出了Unity 3D的SDK。
五、 评分性能获得中高考口语考试的洗礼和认可
& & & &驰声科技是全国范围内,真正有超过10万人中高考口语考试实施经验的,并在这种高利害关系口语考试中评分性能得到官方认可的两家厂商的其中之一。自从2012年教育部在全国试点中高考口语考试以来,驰声科技参与了湛江中考、肇庆中考、中山中考、沈阳中考、广州中职考试、广西高考验证、银川中考等多地区的考试评分及服务,服务了数百万的考生。
六、始终坚持作为第三方独立语音技术服务提供商
& & & &大部分竞争对手在语音技术授权市场活跃均未超过三年,导致转行的原因在于研发语音技术投入是比较巨大,产品的价值链条很长。
& & & &目前,驰声科技是唯一一个没有在App Store发布任何2C产品的教育语音技术公司。未来,驰声科技会继续坚持作为第三方独立的语音技术服务提供商。
七、驰声科技背后强力的支持――网龙集团
& & & &2015年,驰声科技加入国内互联网百强企业――网龙网络有限公司,有稳定的财务体系,每年在研发、服务、品牌推广上拥有可持续性的投入费用,是可持续性发展的合作伙伴。
教育行业的技术授权领域是一个剩者为王的领域,驰声科技已经在这个战场奋斗了9年,不仅懂语音技术,更懂教育。
上一篇:下一篇:
微博二维码
苏州驰声信息科技有限公司 Copyright & 2018 All Rights Reserved
我们随时准备为您提供帮助
联系销售专家
全球联系方式
社交媒体目录语音识别开放化开发平台有哪些? - 知乎有问题,上知乎。知乎作为中文互联网最大的知识分享平台,以「知识连接一切」为愿景,致力于构建一个人人都可以便捷接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,发现更大的世界。379被浏览<strong class="NumberBoard-itemValue" title="4分享邀请回答445 条评论分享收藏感谢收起5811 条评论分享收藏感谢收起您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
藏语统计参数语音合成的合成语音的音质评测毕业论文.pdf 67页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
&#xe600;下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
藏语统计参数语音合成的合成语音的音质评测毕业论文
你可能关注的文档:
··········
··········
西北师范大学硕士学位论文
统计参数语音合成为了语音合成领域的主流合成方法,该方法能够利用有限
的训练语料合成出不同说话人、不同风格和不同情感的语音,具有容易改变合成
语音的音质、模型占用存储空间小等优点。论文以藏语的统计参数语音合成的合
成语音质量的评测为研究目标,提出了一种面向藏语统计参数语音合成的语音基
元自动标注方法,考察了不同基元、不同时间标注对藏语统计参数藏语合成系统
合成的语音音质的影响,同时引入说话人识别方法对合成语音和源说话人的语音
的相似程度进行了评测。论文的主要工作与创新如下:
提出了一种面向藏语统计参数语音合成的语音基元自动标注方法。在基
于隐 Markov
模型(Hidden Markov Model, HMM) 的藏语统计参数语音合成的声
学模型训练中,引入了 DAEM(Deterministic Annealing Expectation Maximization)
算法,对没有时间标注的藏语训练语音进行自动时间标注。以声母和韵母为合成
基元,在声母和韵母的声学模型的训练过程中,利用 DAEM
算法确定HMM模
型的嵌入式重估的最佳参数。训练好声学模型后,再利用强制对齐自动获得声母
和韵母的时间标注。实验结果表明,该方法对声母和韵母的时间标注接近手工标
注的结果。
考察了不同语音基元和不同的基元时间标注对藏语合成语音音质的影
响。分别利用自动标注了时间边界和手工标注了时间边界的藏语语料库训练声学
模型,实现基于HMM 的藏语统计参数语音合成系统。在此基础上,分别考察了
以声、韵母为合成基元和以音节为合成基元对合成语音音质的影响。同时也考察
了手工时间标注和自动时间标注对合成语音音质的影响。结果表明,在训练语料
少时,两种不同基元合成的藏语语音音质都比较差。随着训练语料的增加,两种
不同基元合成的藏语语音音质都在提高。最终在一定训练语料情况下,两种不同
基元可以合成语音音质近似的语音。同时,以音节为基元时用自动标注时间的训
练语料合成的藏语语音与用手工标注时间的训练语料合成的藏语语音音质还有
一定的差距。
提出了一种利用说话人识别方法评测合成语音与目标说话人的相似程度
的方法。采用经验模态分解法(Empirical Mode Decomposition, EMD)和短时分析
相结合的说话人识别方法对合成语音进行说话人识别,通过识别结果判断合成语
音与目标说话人的相似程度。结果表明,合成的藏语语音与目标说人具有较高的
相似程度。
关键词:音质评测;藏语语音合成;统计参数语音合成;隐马尔可夫模型;退
火性期望值最大化算法
西北师范大学硕士学位论文
statistical
parametric
synthesis,
synthesize
正在加载中,请稍后...

我要回帖

更多关于 在线语音合成 的文章

 

随机推荐