《电子技术应用》
您所在的位置:首页 > 通信与网络 > 其他 > 思必驰以智能语音技术 开启语声新纪元

思必驰以智能语音技术 开启语声新纪元

2020-08-30
来源:21ic

或者我们可以把第一次工业革命看作是人类开始系统的思考人类与机器的交互,那或是人机交互的开端,这也许是从人类不自觉情况下开始的,但是从此之后人机交互的进展就再也没有停止过。

  我们发现,人类和机器的交流,最开始发生在工厂内。改善人机交互体验的动机是提升工作效率。发展到如今,人机交互的研究已经不单单是为了提升工作效率那么简单。进入21世纪之后,人机交互的思路发生了新的改变。随着技术的进步,各种感应器的出现,开始让让人机交互进入新的阶段。那就是机器可以主动“体会”用户的意图了。虽然目前这种体会还非常的简单,可能只是自动选择屏幕,或者自动调节亮度这样简单。但是这是人机交互的一个本质性的变化。人和机器的交互,不再是简单的“你说我听”。

  此外交互方式的变革也是值得我们注意的,当用户向手机或者计算机发问的时候,输入的方式也改变了。鼠标比键盘方便,触控比鼠标方便,语音输入可以说更加的省时省力。在这一背景下,2015年7月29日,国内顶尖智能语音技术公司——思必驰,在深圳举办【语声纪元】新技术发布会,各路智能硬件大咖齐聚深圳,共迎智能语音交互技术领域的革新一刻,从智能语音技术的角度共同讨论人工智能的发展与未来。

 

1.jpg

  据思必驰CEO高始兴透露,思必驰作为一家领先业界的智能语音技术公司,是国际上最早提出”交互人工智能“并开始研发的技术公司。 现在,随着智能硬件时代的全面到来, “人机交互”的概念也被炒得火热。在移动互联时代,由于交互模态和交互目标的丰富,用户对人机交互的自由度和丰富性的需求日益提升,已经不满足于简单的搜索功能,而是正在逐渐向“任务处理”变迁,思必驰顺应趋势积极开发优势技术。

  现在,移动互联网大潮来了,思必驰觉得是个机会,把思必驰几乎所有的人力、精力和财力向移动互联、智能硬件去专注,去投,专注在扎实的语音技术上,希望服务于广大的移动互联和智能硬件的开发者,做最极致的体验。而智能家居、可穿戴、车载则是目前思必驰最为关注的三大领域。

  

2.jpg

  思必驰CEO高始兴

  2015年,物联网和智能硬件的大风来了,但是思必驰看到市面上诸多的智能硬件在人机交互方面做得还不够好,没达到完美,甚至可以说距离良好的用户体验差距还非常大,甚至可以说,我们现在看到市面上的人机语音交互,还非常的基础。

  思必驰联合创始人、首席科学家俞凯教授则认为,在智能硬件整个生态圈里面,交互是重要的一环,而且,我们认为智能硬件需要一颗心,不仅仅是让每款产品有一个耳朵、嘴巴,还要有大脑,会思考。思必驰当初创业的梦想就是让每个设备能有智能语音,自然与人对话起来。让智能设备有嘴巴、有耳朵、有大脑,这是我们一直以来的梦想和使命。

  俞凯教授强调, “所以我希望思必驰能够一直努力,做好我们的技术,做好我们的方案,做好我们的服务,我们自己跟合作伙伴能够紧密联系起来,一起让每个智能硬件有极致的交互体验。”

  但是目前语音技术面临着巨大的挑战。真正的自由和稳定的人机交互系统不仅需要解决语音的“感知/表达”,即传统的语音识别和合成,更需要解决认知理解和抽象思维的智能。这需要经历两个阶段,一个是传统语音技术的优化,使其更加人性化;二是对话技术的使用,采用认知交互智能提升任务完成的水平和用户体验。

  

3.jpg

  思必驰联合创始人、首席科学家俞凯教授

  此次新技术发布俞凯教授分享了思必驰最新技术突破,包括远场及抗噪技术突破、更先进的回声消除和麦克风阵列算法组合、基于统计的参数化语音合成方法、多轮交互和根据上下文的语义解析。并现场演示了“语音输入板”,赢得满堂喝彩。

 

4.jpg

  俞凯教授现场演示“语音输入板”赢得满堂喝彩

  远场及抗噪技术突破:在国际通用的噪声标准测试库上,思必驰的最新结构化抗噪语音识别技术刷新了国际记录,取得目前世界单系统最好成绩。模型算法的优化突破,使得思必驰仅用软件解决方案就可以达到以往采用语音降噪芯片才能达到的效果,大幅提升了识别率,降低了成本。

  更先进的回声消除和麦克风阵列算法组合:先进的回声消除算法和麦克风阵列算法结合,可以有效的跟踪用户位置,增强语音信号质量,实现高性能的通用语音识别。软硬件结合的多种解决方案,更给出了更多的选择和可能性。仅靠软件且单麦克风条件下,通过大数据整合以及智能算法,思必驰仍然可以达到极为优秀的使用体验,识别速度与准确率均处在世界领先水平。

  基于统计的参数化语音合成方法:传统语音合成是采用拼接技术,录制大规模的语音库,切片后在合成的时候把片段拼起来,这就往往需要大量的标准语音。思必驰采用最新的基于统计的参数化语音合成方法,可以实现模型规模的大幅压缩,语音连贯性的大幅提升,能够自由训练个性化的语音。

  多轮交互和根据上下文的语义解析:在真实场景下,传统语音识别加自然语言处理的方案并不能很好地实现自由的“人机交互”。思必驰在领先的传统语音识别合成技术的基础上,引入交互认知智能,通过情境理解和多轮交互,面向最终任务完成度和用户体验进行系统设计和优化。

  

5.jpg

  会场展示的智能产品吸引了众多眼球

  此外,易观智库的高级分析师封莉、欧瑞博CEO王雄辉、映趣科技CEO王小彬、威仕特CEO闻政亲临现场助阵,分享他们的产品经验极对语音技术的看法。如今的智能硬件市场已从最初的产业蓝海逐渐转变为下一个产业风口,产业生态系统尚未完善,需要多方合力,思必驰正积极联合各方合力,力争推动智能硬件的快速发展。思必驰、FACE++、微动、ablecloud、72变、中发时代联合主办即将于8月中下旬正式启动上线的一档大型活动——“创星计划”,旨在培育中小型开发者成长,推促进智能硬件领域蓬勃发展的创业孵化器计划。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。