《电子技术应用》
您所在的位置:首页 > 可编程逻辑 > 业界动态 > ADI:智能语音大有前途,深度学习/机器学习需先行

ADI:智能语音大有前途,深度学习/机器学习需先行

2017-09-06
关键词: ADI 智能语音

“语音作为交流的方式,如今首先被应用于各种消费设备上作为发现信息、分享交流的方式、控制环境的手段。在不久的将来,人机对话必将会应用于各领域,它将成为智能系统的‘耳朵’去听人说了什么,提供‘大脑’去想人需要或想干什么,提供‘嘴巴’去回应人的需求或操作其他系统。我们现有的客户已遍布智能家居、安全城市、安全家居、安防、文化娱乐等领域。”ADI消费产品事业部市场经理Lie Dou如是说。

59aeb150e0117.png

ADI消费产品事业部市场经理Lie Dou

智能语音四面开花,仍需技术先行

当下,智能音箱火热;未来,我们将坐在沙发上用声音遥控电视、空调、灯具等。智能语音在各个领域的渗透与背后的技术密切相关。

ADI消费产品事业部语音用户界面主管Brian Donnelly表示:“智能语音有两种方案,一种是智能语音算法在系统处理器里面编译执行;另一种是智能语音算法在专门研制的DSP里编译执行。基于智能语音DSP的方案具有待机功耗低,搭配AP不受限制、选择性广, 可有效分担处理器运算量等优点。ADI的基于智能语音DSP的 “Sublime Voice“远场智能语音识别解决方案已经量产。由于在硬件中嵌入了机器学习与深度学习算法,因此可以高效而准确地捕获语音命令。该解决方案已被国内外的客户设计和应用于机顶盒、条形音箱和电视、智能机器人,智能音箱、住家和办公楼自动控制、家用白电等产品中。

59aeb09865e3c (1).JPG

ADI消费产品事业部语音用户界面主管Brian Donnelly

语音市场火热的当下,值得思考的是,语音交互与识别在落地的过程中暴露出一些局限性。局限背后有哪些原因呢?又要如何改进呢?

Brian Donnelly提及智能语音的两个衡量维度是有效率与准确率,有效性是指正确捕捉到“唤醒词”,准确性是指正确理解和识别语音和命令的意思。而且背后的最大的挑战来源于在远场(5-10米)与背景噪音强的应用场景,当然,还存功耗的问题。这需要高品质和有效的算法包括对信号声源的捕捉(DOA)和对环境噪音的去除。ADI在已有产品与下一代产品中都利用机器学习与深度学习算法加强对语音识别算法的加速。所以ADI 的Sublime Voice方案可以使用较少DSP资源进行复杂的计算。某些场景下,计算效率可高达90%。ADI可在降低系统的功耗的情况下,提高了语音交互识别反应速度,提高系统计算大样本的能力,提高了语音识别的准确率。

ADI的Sublime Voice 参考设计方案基于4个拾音采样麦克风可有效地捕捉来自360度方向上的语音指令。它在技术指标上完全达到了7个麦克风产品的水平的同时又使得产品的设计容易达到小型化和拾音麦克风布局的多样化。

Lie Dou向与非网记者表达了智能语音技术的愿景:我们坚信,智能语音在未来将大展宏图。它是最自然的人类彼此进行交流互动的方式,也应为我们和我们周围的电子设备系统交流最自然的方式。我们努力的目标是以更低的功耗实现更强、更优化的硬件计算能力,以配合智能化的软件做更多和更大样本的计算。这样可以使智能语音被更快、更广的推广到远场低信噪比的应用场景中去。

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。