基于六元空间阵列的声源定位系统实现-AET-电子技术应用

基于六元空间阵列的声源定位系统实现

2020年电子技术应用第2期

余秋婷，熊俊俏

武汉工程大学电气信息学院，湖北武汉430205

摘要： 声源定位技术是语音识别技术的基础，针对复杂噪声和混响的室内环境造成声源定位精度不理想的问题，提出了一种基于麦克风阵列的声源定位系统。首先阐述了声源定位原理，然后提出了改进的广义互相关算法。该算法利用两信号之间的相关性，估计出麦克风之间的时延，进而得到声程差，并根据几何关系确定声源在空间中的位置，最后在嵌入式平台上进行实验。实验结果证明，该方法能较准确地得到声源位置，且距离和方位角的误差分别不超过+5°和±15 cm。

关键词： 声源定位麦克风阵列时延估计嵌入式系统

中图分类号： TN641
文献标识码： A
DOI：10.16157/j.issn.0258-7998.190864
中文引用格式： 余秋婷，熊俊俏. 基于六元空间阵列的声源定位系统实现[J].电子技术应用，2020，46(2)：58-61.
英文引用格式： Yu Qiuting，Xiong Junqiao. Realization of sound source locating system based on six-dimensional space array[J]. Application of Electronic Technique，2020，46(2)：58-61.

Realization of sound source locating system based on six-dimensional space array

Yu Qiuting，Xiong Junqiao

School of Electrical and Information Engineering，Wuhan Institute of Technology，Wuhan 430205，China

Abstract： Sound source localization technology is the basis of speech recognition technology. For the problem that the sound source localization accuracy is not ideal for complex noise and reverberant indoor environment, a sound source localization system based on microphone array is proposed. Firstly, the principle of sound source localization is expounded, and then an improved generalized cross-correlation algorithm is proposed. The algorithm uses the correlation between the two signals to estimate the delay between the microphones, and then obtains the sound path difference, and determines the position of the sound source in space according to the geometric relationship. Finally, the experiment is carried out on the embedded platform. The experimental results show that the method can obtain the sound source position more accurately, and the distance and azimuth errors are not exceeded positive and negative 5 degrees and plus or minus 15 cm.

Key words : sound source localization；microphone array；time delay estimation；embedded system

0 引言

听觉是人感知外界环境，并与外界环境进行交互的重要方式，根据不同物体发出的声音，人们可以判断出声源的方位。而在某些特定场合，就需要机器来准确定位出声源的位置^[1]。因此，基于麦克风阵列的声源定位技术得到了广泛的关注和快速的发展，对其开展研究具有很强的实践价值^[2]。

目前，常用的基于麦克风阵列的声源定位方法有3种：基于最大输出功率的可控波束形成定位方法^[3]、基于高分辨率谱估计技术的定位方法^[4]和基于时延估计的定位方法^[5]。其中，基于时延估计的定位方法由于运算量小、实时性好、易于实现等优点而成为最普遍的使用方法^[6]。其方法首先估计了声源到达各个麦克风的时延，再根据几何关系得到声源的位置。文献[7]提出了一种改进时延估计的声源定位方法。该方法首先设计了四元十字型麦克风阵列，然后在广义互相关的基础上引入二次相关算法来削弱环境噪声产生的干扰，同时采用自适应滤波算法来提高环境混响的时延精度，从而获得更准确的声源位置。但缺少界面的直观显示。文献[8]首先提出了GCC-IMLPT算法，并通过仿真验证了该算法的性能，且选取了计算量小、实时性较好的球形插值法来得到声源位置，然后研究了麦克风拓扑结构，确定麦克风阵列的大小，最后在实际环境中测试了系统的性能，但由于系统是在计算机上实现的，不方便携带。当前，优化算法提高定位精度，实现界面的直观显示，以及方便携带成为考虑的热点问题。

本文提出一种基于麦克风阵列的声源定位系统。采用改进的广义互相关算法获取时延，进而得到声程差，并根据几何关系确定声源在空间中的位置，最后在嵌入式平台上进行实验。实验结果证明，该方法能较准确地得到声源位置。

1 声源定位系统原理

1.1 声源定位原理

由于同一个声源传播到位置不同的各个麦克风时会产生时间差，这个时间差称为时延。时延与声速相乘即可得到声程差。由双曲线的性质可知，双曲线上任意一点到两个焦点的距离之差的绝对值为双曲线的实轴长。因此，声源在以任意两个麦克风为焦点，声程差为实轴长的多条双曲线的焦点上^[9]。声源定位原理图如图1所示，S为声源。

1.2 改进的广义互相关算法

广义互相关算法是目前最常用的一种时延估计方法。广义互相关算法是通过将两路声音信号从时域变化为频域，并求得两信号之间的互功率谱，再进行加权，这样可以降低噪声和反射带来的误差，然后经过反傅里叶变换，将频域转换回时域得到互相关函数并计算峰值，峰值所对应的位置即时延^[10]。广义互相关时延估计基本原理和流程图如图2所示。

由于声源不断产生声音信号，麦克风接收到声源传来的声音信号。假设麦克风1、2接收到声音信号的理想模型为：

在理想情况下或在弱噪声和弱混响的环境下互功率谱可近似表示为：

互功率谱加权函数(PHAT)通过对信号互功率谱归一化，去除信号的幅度信息，只保留了信号的相位特性，对噪声和混响有一定的抑制作用^[11]。

2 空间定位方法

目前有2种方法估计声源位置：通过搜索的方式和通过几何的方式。由于本文采用的是三维阵列，故采用几何的方法估计声源位置。

本文采用球形插值法对声源位置进行估计。球型插值法根据多个麦克风相对参考麦克风的时延和各个麦克风的矢量位置得到一个误差方程组，并求其最小二乘解^[12]。

如图3所示，声源的坐标点用s(x，y，z)表示，麦克风m₀放在原点处作为参考点，m_i表示其他麦克风的坐标位置，i∈[1，5]，各麦克风与参考麦克风之间的声程差用d_i表示。

声源s应该满足矢量方程：

3 实验结果与分析

3.1 实验设备

本文系统在硬件上主要包括三维阵列、麦克风模块、数据采集卡以及计算机。三维阵列模型如图4所示，相邻两麦克风之间的距离为50 cm，麦克风采用MAX9812麦克风模块，为全向性麦克风，20 dB固定增益放大。选用 USB DAQ多功能数据采集卡采集声音数据，采集卡的输入端通过6根数据线与麦克风阵列相连，输出端通过USB连接计算机，USB DAQ采集卡具有8路差分16位高速同步模拟信号采集，8 个AD620高精度差分放大器，16路数字信号单向输入，16路数字信号单向输出。单通道的采样频率最大可达200 kHz。本实验只使用了其中6路通道。