《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 业界动态 > 一种基于语音识别芯片AP7003的家电语音控制器设计

一种基于语音识别芯片AP7003的家电语音控制器设计

2008-03-13
作者:何 超,贾德文,李加强

  摘 要: 基于新型的低成本低功耗语音识别" title="语音识别">语音识别芯片AP7003开发了一种简单实用、能供普通房屋使用的家电语音控制器。介绍了该家电语音控制器的设计原理、基本功能及其操作说明,使用中识别率达到75%以上。
  关键词: 语音识别 家电语音控制  特定人识别  智能房屋

 

  AP7003是功能比较简单的语音识别芯片" title="识别芯片">识别芯片,其芯片电路中仅集成了MCU、A/D、D/A、ROM,并在MCU中固化语音识别程序,方便使用。基于该芯片开发了一种低成本的家电智能语音控制器,使用户能通过语音实现对家用电器的控制。
1 语音识别芯片AP7003
1.1 语音识别芯片AP7003简介
  AP7003是一款新型、低成本语音识别专用芯片,经预处理后可识别12组不同的字词,每组时长1.5秒,可连词或单词识别。其I/O口有2个普通输入、4个触发输入、12个输出、2
个LED驱动。采用2.4~2.5V的工作电压,具备低功耗模式,指令优化,方便用户使用。
  AP7003包括AP7003-1(由CPU串行控制)和AP7003-2(由按键直接控制)两种型号。它具有高度的可编程性,使用简单方便,可广泛应用于语音控制的家电、玩具、自动答录等领域
。其中用AP7003-2构成的语音识别电路,结构简单、外围元器件少,设计、制作、调试及操作十分容易。因此选用AP7003-2为家电语音控制器的核心。
1.2 AP7003的结构
  AP7003内置有麦克风放大器、A/D转换器、语音处理器和I/O控制器等电路,其功能框图如图1所示。AP7003-2为双列直插40脚封装,引脚功能见表1。

 

表1 AP7003-2引脚功能

引脚名称 功能描述
GNDD
LED1
LED2
POB1~POB4
PIT1~PIT4
VDDD
CAPV
OSC1
PIM1~2
TEST
POSL
GNDA
TREF
A2OUT
A1IN
A1OUT
MICP
VDDA
POA1~POA12
PORES
数字地
低电平LED1驱动端
低电平LED2驱动端
输出端口" title="输出端口">输出端口B
低电平触发输入端,带上拉电阻
正电源
与地之间必须连接一电容以调整内部电压
振荡器频率控制端
模式控制输入端
测试端
输出端口A的输出模式选择器
模拟地
语音输入的临界控制端
第二个放大器输出端
第一个" title="第一个">第一个放大器的负极输入端
第一个放大器输出端
麦克风的正极电源
模拟电压端
输出端口A1~A12
高电平" title="高电平">高电平输入端


1.3 AP7003-2典型应用电路
  AP7003-2有两种按键模式,PIM1接高电平,为12 键模式;PIM1接低电平,为8键模式。这里采用12键控制模式,其典型应用电路如图2所示。POSL接低电平,POA1~POA12输出
为低电平有效;POSL接高电平,POA1~POA12输出为高电平有效。


  语音识别电路的操作分为两大部分,首先必须将标准字句录入,其次才进入识别操作模式。在需要做识别操作时,目标字句必须已存入内部的12 个存储区,可以用键盘来选择
存储区或用适当的命令控制将字句录入,每个存储区可以存放长达1.5s的字句。
2 家电语音识别控制器的系统设计
  根据AP7003-2的性能和特点,设计了一个低成本的家电语音识别控制器,可以实现电灯、电视机等电器的语音控制。考虑到市场上购买的电器都为成品,无法进行二次开发,
很难对这些电器进行改造,因此只能通过语音控制开关或电源插座来间接实现对这些电器的语音控制。该套语音控制系统与原来的手动开关并用,在不影响原有功能和可靠性的基础上,增加语音控制功能,以方便用户,提高生活水平。
2.1 家庭语音识别控制器的功能
  AP7003-2具有12个输出口,每2个输出口控制一种电器(一个控制开,一个控制关),因此一片AP7003-2可以控制6种不同的电器。当所需控制电器多于6种时,增加语音识别芯
片数量即可。根据用户需求和所用硬件的性能,设计的家庭语音识别控制器具有以下功能:
  (1)语音识别控制器安装在房屋的墙壁上,通过双绞线与所控电器如走廊灯、客厅灯、电视等相连。对语音识别控制器发出语音指令便可以控制这些电器的动作;
  (2)语音识别控制器可以准确识别出“走廊灯开”、“走廊灯关”、“电视开”、“电视关”等语音指令,并有相应的控制信号输出,准确地控制各种电器的开关;
  (3)根据使用场合和所控对象的不同,可设置不同的语音命令进行识别。
2.2 家庭语音识别控制器的结构
  家庭语音控制电路的核心是AP7003-2语音识别集成电路。外围电路由语音输入电路、状态转换控制电路、键盘控制电路和输出控制电路等组成。语音控制电路原理图如图3所示


  语音输入电路的功能是采集说话者的声音并滤波后送入控制芯片进行处理。参照AP7003-2的典型应用电路图进行设计,语音输入电路由麦克风MIC,电阻R5、R6、R7,电容C4
、C5等组成。
  状态转换控制电路的功能是控制按键个数、输出口输出电平、输出后是否清零以及状态灯等,由三极管T1,发光二极管D1、D2,电阻R1、R2、R3、R4,电容C1、C2、C3等组成

  键盘控制电路的功能是用户在训练语音控制器时输入相应的指令,各按键功能在后面会详细介绍。采用薄膜小键盘,与端口PIT1~3和POB1~4相连,其设计参照AP7003-2的典型
应用电路。
  输出控制电路的功能是根据语音控制芯片的输出信号控制电器的动作。由三极管T2~T7、继电器J1~J6和RS触发器RS1~RS6等组成。
2.3 语音控制电路的工作原理
  标准语音控制命令事先可用按键控制,通过用户的训练,由外部的麦克风MIC录入,存储在内部的存储器中。
  正常使用时,AP7003-2处于识别操作模式,用户发出的语音命令由MIC转换成模拟电信号送至AP7003-2内部,经MIC放大器放大及A/D转换器后变为数字信号。输入的语音被声音
处理器特征抽样,同存储在内部的目标字句的抽样特征进行比较,必须与所选择的识别目标字匹配,才会将输出信号送至相应的PA口(POA1~POA12),否则芯片不会有输出。
  因为POSL端接高电平,所以相应的PA口输出为高电平。同时,LED2端由高电平变为低电平(发光二极管D2点亮指示识别成功),晶体管T1导通,PORES端变为高电平,PA口复位为低
电平,等待下一命令的输入。
  由此可见,当语音识别成功后,PA端实际输出一个高电平脉冲。若控制“开”的端口(POA1)输入脉冲至RS触发器的R端,此时控制“关”的端口(POA2)仍为低电平,因此触
发器的Q端输出高电平,晶体管T2导通,继电器J1的触点闭合,电灯点亮。若POA2输入脉冲至RS触发器的S端,此时POA1仍为低电平,因此触发器的Q端输出低电平,晶体管T2截至,继电器J1的触点断开,电灯关闭。
3 家庭语音识别控制器操作说明
3.1 按键设置功能说明

  该语音控制器采用12键控制模式。语音控制器上电后,POB1~POB4均被置成低电平。当有键按下时,芯片按POB1→POB2→POB3→POB4的顺序依次发出键盘扫描信号,扫描信号为
16ms低脉冲加64ms间隔,且循环进行,按键信号从PIT1~PIT4输入芯片。键盘阵列如表2所示,各按键功能如表3所示。

 

表2 AP7003-2键盘阵列

端口 POB1 POB2 POB3 POB4
PIT1
PIT2
PIT3
KEY1
KEY5
KEY9
KEY2
KEY6
KEY10
KEY3
KEY7
KEY11
KEY4
KEY8
KEY12

表3 AP7003-2键盘功能
键号 键名 按键功能
1
2
3
4
5
6
7
8
9
10
11
12
C
存储语句1
存储语句2
存储语句3
存储语句4
存储语句5
存储语句6
存储语句7
存储语句8
设置级别1
设置级别2
清零
待机
清空内存
选择第一个存储体存储录入的语音
选择第二个存储体存储录入的语音
选择第三个存储体存储录入的语音
选择第四个存储体存储录入的语音
选择第五个存储体存储录入的语音
选择第六个存储体存储录入的语音
选择第七个存储体存储录入的语音
选择第八个存储体存储录入的语音

设置语音识别的匹配度,进入语音识别初始状态

清除POA1~POA12和LED2的状态,进入语音识别初始状态
将芯片转入省电模式
清除12个存储体内容,进入存储目标词状态


3.2 使用说明
  (1)本家庭语音识别控制器采用5V直流电,使用前需装入2节5#电池。经过改造,也可采用直流变压器供电。
  (2)在使用语音控制器之前,用户应先对语音控制器进行训练,输入标准语音。另外,本语音控制器采用特定人识别方式,如果发出指令的用户更换,需重新进行训练。具体做法为;先按下C键,清空内存,进入存储目标词状态,此时LED1点亮。然后按下1键,此时LED1和POA1有效,输入标准语音,如“走廊灯开”,存储到第一个存储器。依次按下其他按键,存入新的标准语音。
  (3)校核训练情况。标准语音存储后,系统进入识别状态,LED1亮。依次说出刚才训练的语句,看相应动作能否执行。若能执行,则说明训练成功;否则说明相应语句训练不成
功,需重新按下对应键进入训练状态,直到识别成功。
  (4)训练成功后,即可进入识别模式状态进行工作。当需要进行语音控制时,说出相应语句,如“走廊灯开”等。若识别成功,则LED2点亮,执行相应动作,打开走廊灯。
  (5)语音控制其对外部麦克风(MID)的分贝值有一定的要求。使用经验表明,本语音控制器选用55dB的麦克风时效果较好。经多次验证,本语音控制器具有较高的识别率,一
般可达75%以上。
参考文献
[1] 李胜.语音控制应用系统设计.机械工程学报,2002,(S1).
[2] Aplus Integrated Circuits INC.AP7003-2(Voice Recognition IC)Application Note.2000,9.
[3] 吴少军,张维平,沈永福.新型语音识别电路AP7003及其应用.电子技术应用,2001,(7).
[4] 李文联.语音识别集成电路AP7003及其应用.电子技术应用,2003,(8).

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。