专利名称:应用于救援的基于麦克风阵列的语音定位装置的制作方法
技术领域:
本发明属于声音定位技术领域,特别是一种应用于救援的基于麦克风阵列的语音定位装置。
背景技术:
单麦克风系统获得高质量的声源信号要求声源和麦克风之间的位置相对固定,当麦克风距离声源很远,或者存在一定程度的混响及 干扰的情况下,会使拾取信号的质量严重下降。为了解决单麦克风系统的这些局限性,人们提出了用麦克风阵列进行语音处理的方法,因为麦克风阵列系统较之单麦克风系统具有许多优点麦克风阵列系统具有空间选择特性;允许目标在一定范围内移动而不改变接受方向;便于对移动目标的自动探测、定位。国外主要将麦克风阵列技术用于语音获取、语音识别、声源定位等方向。1985年Flanagan将麦克风阵列弓I入到大型会议的语音增强中,并开发出很多实际产品。1987年Silverman将麦克风阵列引入到语音识别系统,1992年又将阵列信号处理用于移动环境下的语音获取,后来将其应用于说话人识别。1995年Flanagan在混响环境下用阵列信号处理对声音进行捕获。1996年Silverman和Brandstein开始将其应用于声源定位中,用于确定和实时跟踪说话人的位置。尤其在声源定位这一领域,国外的研究确实比我们先走一步,国内主要将麦克风阵列技术用在视频监控等方向。如中国兵器工业集团、海康威视公司等都有相关产品的研发。而在声探测和识别方面相对于国外较为落后,到目前为止还没有自主产权的麦克风阵列产品。现有的麦克风阵列语音定位系统大多采用Codec类的音频编解码器作为采集信号的核心,这种设计在两路以上声音信号采集中很难做到真正同步,而且信号放大增益不是连续可调的,只有固定的几个增益值可选,采样频率也不是连续可控的,仅有几个固定的采样频率值可供选择,在某些对声音信号增益值或者采样频率值有特定要求的环境下使用起来有很大不便;当需要采集两路以上声音信号时,Codec编解码器必须首先传出自己的硬件ID号,然后才能传输出采集的数据,以便数字信号处理单元识别是哪路采集电路传回的数据,这使得每次启动采集都需要执行这种步骤,在一定程度上降低了系统性能,影响了系统的实时性。语音听觉定位相比于现有的视觉图像定位具有不可替代的优势,首先,视觉场被限定在小于180°的范围内,且不能穿过不透光的障碍物,容易受到环境光线强弱的影响,因此单纯依靠机器人视觉获取外界信息来进行定位的精度相对较低。相比于语音定位系统,一些生命探测仪系统主要依靠捕捉人体超低频电波产生之电场(由心脏产生)来找到“活人”的位置,遇到金属障碍物时,由于这种电场易受到金属的干扰,甚至被屏蔽,因而生命探测仪检测距离受到严重影响,语音定位系统具有相对结构简单,易于实现,相对经济,不易因障碍物而影响检测距离等优势。现有的语音定位装置大都应用于视频电话会议,无线通信等领域,而将基于麦克风阵列的语音定位技术应用于人员搜救或救援机器人领域是该领域的一个重大进步,不可否认,所述语音定位系统在人员搜救或救援机器人执行任务搜救被困人员时提供被困人员的具体位置,为搜救提供确切的目标位置,很大程度上提高了救援效率,也为救援争取了宝贵的时间,因此所述语音定位系统在人员搜救或救援机器人领域具有重大的实际意义和应用价值;除了所述语音定位技术极少应用与人员搜救或救援机器人领域外,发明人还发现,在现有的麦克风阵列拾取声音是都需要传回麦克风的位置信息,或者传回与麦克风相连的采集电路的ID号,用于识别是哪一路的麦克风传回的信号;现有麦克风阵列定位装置大都只能定位单个目标,而且使用时对环境的信噪比要求比较高,这在实际使用时带来很多不便。
发明内容本发明的目的在于提供一种在信噪比不高的救援环境下,能实现多目标的定位,且速率快,成本低,精度高,具有一定的实时性,易于实现的应用于救援的基于麦克风阵列的语音定位装置。实现本发明目的的技术解决方案为一种应用于救援的基于麦克风阵列的语音定位装置,所述系统包括麦克风阵列、前置选频放大电路、多通道同步采样模块、数据信号处理单元、数据存储模块和目标位置实时显示模块;数据信号处理单元与数据存储模块、多通道同步采样模块和目标位置实时显示模块三个模块相连;多通道同步采样模块还与前置选频放大电路相连;麦克风阵列仅与前置选频放大电路相连。本发明与现有技术相比,其显著优点(I)将基于麦克风阵列的语音定位技术应用于人员搜救或救援机器人领域,与传统的视觉定位和基于电场的生命探测相比具有不可替代的优势,是人员搜救或救援机器人领域的一大进步。(2)所述麦克风阵列定位装置应用于人员搜救或救援机器人上,能适用于信噪比不闻环境。(3)所述麦克风阵列定位装置具有可调的放大增益,同时不需要传回麦克风的位置信息,这是与现有麦克风阵列定位技术相比本发明所具有的突出优点之一。(4)所述麦克风阵列定位装置支持多通道高速同步采集,采集速率可以通过软件控制,最大速率可达语音频段最大频率的50多倍。(5)所述麦克风阵列定位装置具有高效存储结构,能够记录并保存多通道的采集数据,能够通过数字信号处理单元导出到系统外以便做进一步分析。(6)所述麦克风阵列定位装置具有一定的实时性,能在目标位置实时显示模块上实时显示目标相对与麦克风阵列的位置信息。(7)所述麦克风阵列定位装置,能够通过算法改进,实现多目标的定位,这是本与现有麦克风阵列定位技术相比本发明所具有的又一突出优点。
以下结合附图对本发明作进一步详细描述。
图I为本发明应用于救援的基于麦克风阵列的语音定位装置的结构示意框图。[0019]图2为本发明应用于救援的基于麦克风阵列的语音定位装置的麦克风阵列结构示意图。图3为本发明应用于救援的基于麦克风阵列的语音定位装置的存储模块示意框图。图4为本发明应用于救援的基于麦克风阵列的语音定位装置的数字信号处理单元与实时显示模块连接接口示意框图。
具体实施方式本发明一种应用于救援的基于麦克风阵列的语音定位装置,所述系统包括麦克风阵列、前置选频放大电路、多通道同步采样模块、数据信号处理单元、数据存储模块和目标位置实时显示模块;数据信号处理单元与数据存储模块、多通道同步采样模块和目标位置实时显示模块三个模块相连;多通道同步采样模块还与前置选频放大电路相连;麦克风阵列仅与前置选频放大电路相连。数据信号处理单元通过并行的外部存储器接口与数据存储模块连接,数据信号处理单元通过SPI协议接口与多通道同步采样模块相连接,数据信号处理单元通过通用串口与目标位置实时显示模块相连接。麦克风阵列采用平面十字型结构,且呈对称布置,相对应位置的麦克风为一对。多通道同步采样模块启用与麦克风数量相等的通道数。多通道同步采样模块的每对通道共用一组前置选频放大电路。数字信号处理单元的核心部件是数字信号处理器,其具有支持多个不同类型外部存储器扩展的接口,内部携带支持直接存取访问模式的内部总线,所述数字信号处理器自带多个可扩展为通用串口和SPI协议接口的多通道缓冲串口模块;其与目标位置实时显示模块相连接的接口同时具备RS232数据输出能力。数据存储模块包括三类不同功能的存储器即同步动态随机存储器、电擦除可编程只读存储器和同步静态随机存储器。目标位置实时显示模块自带通用串口,目标位置实时显示模块串口中具有能反馈工作状态的硬件电路,具有支持触摸输入的硬件电路。其信号走向为麦克风阵列拾取所处环境声音信号,每个麦克风拾取一路声音信号,均传送到前置选频放大电路内,前置选频放大电路对信号的放大具有高精度、高信噪抑制比、低零点漂移和在语音频段内低相位漂移特点,其输出的信号中语音频段以外的冗余信息已被滤除,语音频段内的信号将被放大,且放大增益是可调可控的,经过放大的信号被送入多通道同步采样模块,按照设定的采样频率进行采样,被量化的信号以数据形式存于数据存储模块内,系统的语音定位算法启动前,用户需从目标位置实时显示模块上输入解算参数,得到这些参数后,系统在数据存储模块内进行定位解算,解算出目标位置信息后在目标位置实时显示模块上实时显示。结合图1,本发明是一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述系统包括麦克风阵列、前置选频放大电路、多通道同步采样模块、数据信号处理单元、数据存储模块和目标位置实时显示模块,其中麦克风阵列采用平面十字型结构,前置选频放大电路采用可调放大增益设计,数据存储模块内由多种类型存储芯片构成,数字信号处理模块采用高性能的数字处理芯片(DSP),目标位置实时显示模块除了能够实时显示目标位置以外,还作为目标定位解算参数输入设备。本发明麦克风阵列的语音定位系统,除麦克风阵列外,其他组件均集成在一块电路板上。图I中前置选频放大电路,采用高精度、低零点漂移和在语音频段内低相位漂移的放大电路设计,在多目标的定位算法中,某些算法需要用到声音信号的相位信息,前置选频放大电路的设计已经考虑到这个问题,因而采用在语音频段内低相位漂移的硬件电路设计,该设计在语音频段内的相位漂移几乎接近常值,即使遇到某些情况需要提高信号相位的精度,也可在算法中运用相位补偿加以改进。多通道同步采样模块与数字信号处理单元之间采用SPI协议接口。结合图2,本发明应用于救援的基于麦克风阵列的语音定位装置的麦克风阵列采用平面十字型结构,考虑到成本和精度的平衡,选择采用六个麦克风传感器,分布如图2所示六个麦克风分为三对,第一麦克风I和第二麦克风2组成一对,第三麦克风3和第四麦 克风4组成一对,第五麦克风5和第六麦克风6组成一对;水平方向分配四颗麦克风传感器,分别为第一麦克风I、第二麦克风2、第三麦克风3和第四麦克风4,垂直方向分配两颗麦克风传感器,分别为第五麦克风5和第六麦克风6 ;第一麦克风I和第二麦克风2之间的距离与第五麦克风5和第六麦克风6之间的距离相等,第三麦克风3位于第一麦克风I和原点的中心位置,同样第四麦克风4位于第二麦克风2和原点的中心位置,相应地,为匹配麦克风数量,采用六通道同步采样,且采样输出顺序按照既定的设计顺序输出,因此,在采样模块数据输出时,不需要再对数据来自哪一路麦克风的问题进行判断,因此没有必要将麦克风的位置信息传给数字信号处理模块,省略了判别与麦克风相连的米集电路的ID号。麦克风与采集通道的分配如下第一麦克风I占用第一通道,第二麦克风2占用第二通道,第三麦克风3占用第三通道,第四麦克风4占用第四通道,第五麦克风5占用第五通道,第六麦克风6占用第六通道。在实际的救援环境下,待救人员的水平方向位置信息的重要性要远远大于垂直方向的位置信息,因此如图2所示,在水平面方向分布了四颗麦克风传感器,垂直方向分配了两颗传感器。显然水平方向的四颗麦克风能够大大提高水平面内的定位精度,为营救被困人员提供比垂直方向更为准确的位置信息,很大程度上提高了营救的成功率。如图3,本发明应用于救援的基于麦克风阵列的语音定位装置,其数据存储模块由三种类型的存储器构成,分别是同步动态随机存储器,电擦除可编程只读存储器,同步静态随机存储。这种存储结构很大程度上提高了数据存储效率。所述基于麦克风的语音定位系统具有一定的实时性,数字信号处理器采用高主频的DSP作为核心处理器,图3所示的3类存储器通过外部存储器扩展总线与数字信号处理器相连,为提高数据存取速度,这种外部存储器扩展连接方式均采用并行方式。所述外部存储器从存储速度上看同步静态随机存储器读写速度最快,其次是同步动态随机存储器;从集成度上看同步动态随机存储器集成度最高,价格便宜,同步静态随机存储器集成度最低,价格昂贵。所述系统内3类存储器的功能不同,电擦除可编程只读存储器用存储需要固化在所述语音定位系统内的程序代码,系统一旦加电会自动从电擦除可编程只读存储器内加载程序启动定位功能。同步静态随机存储器用于保存从传回的原始声音数据,由于其有断电不丢的特性,因此这些数据可以导出到本系统外,用于其他进一步的分析或作为记录保存起来;除此之外,同步静态随机存储器还保存用户从显示模块上输入的解算参数;若用户在一次解算前没有输入解算参数,则系统默认将自动采用上次保存的解算参数。同步动态随机存储器用作系统定位解算空间,多目标定位算法的计算量大,所需解算空间大,因此数据存储模块采用2片大容量同步动态存储器。所述数据存储模块内3类存储器间的数据交换可以通过数字信号处理器内部的总线以直接存取模式快速实现。结合图4,本发明应用于救援的基于麦克风阵列的语音定位装置,其目标位置实时显示模块通过UART串口与数字信号处理单元相连,同时该UART串口还作为本系统数据导出口,具有RS232数据输出能力。目标位置实时显示模块具有用户输入界面,用户能够通过输入界面输入系统定位解算的参数。实施例I :一种应用于救援的基于麦克风阵列的语音定位装置,包括麦克风阵列、前置选频放大电路、多通道同步采样模块、数据信号处理单元、数据存储模块和目标位置实时显示模块;数据信号处理单元与数据存储模块、多通道同步采样模块和目标位置实时显示模块3个模块相连;多通道同步采样模块还与前置选频放大电路相连;麦克风阵列仅与前置选频放大电路相连。数据信号处理单元通过并行的外部存储器接口与数据存储模块连接,数据信号处 理单元通过SPI协议接口与多通道同步采样模块相连接,数据信号处理单元通过通用串口与目标位置实时显示模块相连接。麦克风阵列采用平面十字型结构,共有六个麦克风,并分为三对,第一麦克风I和第二麦克风2组成一对,第三麦克风3和第四麦克风4组成一对,第五麦克风5和第六麦克风6组成一对;水平方向分配四颗麦克风传感器,分别为第一麦克风I、第二麦克风2、第三麦克风3和第四麦克风4,垂直方向分配两颗麦克风传感器,分别为第五麦克风5和第六麦克风6 ;第一麦克风I和第二麦克风2之间的距离与第五麦克风5和第六麦克风6之间的距离相等,第三麦克风3位于第一麦克风I和十字型结构原点的中间位置,同样第四麦克风4位于第二麦克风2和十字型结构原点的中间位置。多通道同步采样模块启用与麦克风数量相等的通道数;多通道同步采样模块的六个采样通道分为三对,第一通道与第二通道为一对,第三通道与第四通道为一对,第五通道与第六通道为一对;麦克风阵列包含的六个麦克风和多通道同步米样模块的六个通道对应,麦克风与采样通道的对应关系分别是第一麦克风I占用第一通道,第二麦克风2占用第二通道,第三麦克风3占用第三通道,第四麦克风4占用第四通道,第五麦克风5占用第五通道,第六麦克风6占用第六通道;多通道同步采样模块的每对通道共用一组前置选频放大电路。数字信号处理单元的核心部件是数字信号处理器,其具有支持多个不同类型外部存储器扩展的接口,内部携带支持直接存取访问模式的内部总线,所述数字信号处理器自带多个可扩展为通用串口和SPI协议接口的多通道缓冲串口模块;其与目标位置实时显示模块相连接的接口同时具备RS232数据输出能力。数据存储模块包括两个同步动态随机存储器、一个电擦除可编程只读存储器和一个同步静态随机存储器。目标位置实时显示模块自带通用串口,目标位置实时显示模块串口中具有能反馈工作状态的硬件电路,具有支持触摸输入的硬件电路。实施例2 : —种应用于救援的基于麦克风阵列的语音定位装置,包括麦克风阵列、前置选频放大电路、多通道同步采样模块、数据信号处理单元、数据存储模块和目标位置实时显示模块;数据信号处理单元与数据存储模块、多通道同步采样模块和目标位置实时显示模块3个模块相连;多通道同步采样模块还与前置选频放大电路相连;麦克风阵列仅与前置选频放大电路相连。数据信号处理单元通过并行的外部存储器接口与数据存储模块连接,数据信号处理单元通过SPI协议接口与 多通道同步采样模块相连接,数据信号处理单元通过通用串口与目标位置实时显示模块相连接。麦克风阵列采用平面十字型结构,共有四个麦克风,并分为两对,水平方向和垂直方向各布置一对,其中,两对麦克风之间的距离相等。多通道同步采样模块启用与麦克风数量相等的通道数;多通道同步采样模块的四个采样通道分为两对,第一通道与第二通道为一对,第三通道与第四通道为一对;麦克风阵列包含的四个麦克风和多通道同步采样模块的四个通道一一对应,麦克风与采样通道的对应关系分别是第一麦克风占用第一通道,第二麦克风占用第二通道,第三麦克风占用第三通道,第四麦克风占用第四通道;多通道同步采样模块的每对通道共用一组前置选频放大电路。数字信号处理单元的核心部件是数字信号处理器,其具有支持多个不同类型外部存储器扩展的接口,内部携带支持直接存取访问模式的内部总线,所述数字信号处理器自带多个可扩展为通用串口和SPI协议接口的多通道缓冲串口模块;其与目标位置实时显示模块相连接的接口同时具备RS232数据输出能力。数据存储模块包括一个同步动态随机存储器、一个电擦除可编程只读存储器和一个同步静态随机存储器。目标位置实时显示模块自带通用串口,目标位置实时显示模块串口中具有能反馈工作状态的硬件电路,具有支持触摸输入的硬件电路。实施例3 : —种应用于救援的基于麦克风阵列的语音定位装置,包括麦克风阵列、前置选频放大电路、多通道同步采样模块、数据信号处理单元、数据存储模块和目标位置实时显示模块;数据信号处理单元与数据存储模块、多通道同步采样模块和目标位置实时显示模块3个模块相连;多通道同步采样模块还与前置选频放大电路相连;麦克风阵列仅与前置选频放大电路相连。数据信号处理单元通过并行的外部存储器接口与数据存储模块连接,数据信号处理单元通过SPI协议接口与多通道同步采样模块相连接,数据信号处理单元通过通用串口与目标位置实时显示模块相连接。麦克风阵列采用平面十字型结构,共有十个麦克风,并分为五对,水平方向布置三对,垂直方向布置两对,其中,水平方向六个麦克风摆放点连同十字型结构原点在水平方向内等间距分布,十字型结构原点位于中间两个麦克风之间;垂直方向四个麦克风摆放点连同十字型结构原点在垂直方向等间距分布,间距与水平方向间距相同,十字型结构原点也位于中间两个麦克风之间;每个方向上,与十字型结构原点等距的两个麦克风组成一对。多通道同步采样模块启用与麦克风数量相等的通道数;多通道同步采样模块的十个采样通道分为五对,第一通道与第二通道为一对,第三通道与第四通道为一对,第五通道与第六通道为一对,第七通道与第八通道为一对,第九通道与第十通道为一对;麦克风阵列包含的十个麦克风和多通道同步采样模块的十个通道一一对应,麦克风与采样通道的对应关系类似于实施例1,每对麦克风占用一对采样通道,分别是第一麦克风占用第一通道,第二麦克风占用第二通道,第三麦克风占用第三通道,第四麦克风占用第四通道,第五麦克风占用第五通道,第六麦克风占用第六通道,第七麦克风占用第七通道,第八麦克风占用第八通道,第九麦克风占用第九通道,第十麦克风占用第十通道;多通道同步采样模块的每对通道共用一组前置选频放大电路。数字信号处理单元的核心部件是数字信号处理器,其具有支持多个不同类型外部存储器扩展的接口,内部携带支持直接存取访问模式的内部总线,所述数字信号处理器自带多个可扩展为通用串口和SPI协议接口的多通道缓冲串口模块;其与目标位置实时显示模块相连接的接口同时具备RS232数据输出能力。 数据存储模块包括两个同步动态随机存储器、一个电擦除可编程只读存储器和一个同步静态随机存储器。目标位置实时显示模块自带通用串口,目标位置实时显示模块串口中具有能反馈工作状态的硬件电路,具有支持触摸输入的硬件电路。
权利要求1.一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述系统包括麦克风阵列、前置选频放大电路、多通道同步采样模块、数据信号处理单元、数据存储模块和目标位置实时显示模块;数据信号处理单元与数据存储模块、多通道同步采样模块和目标位置实时显示模块三个模块相连;多通道同步采样模块还与前置选频放大电路相连;麦克风阵列仅与前置选频放大电路相连。
2.根据权利要求I所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的数据信号处理单元通过并行的外部存储器接口与数据存储模块连接,数据信号处理单元通过SPI协议接口与多通道同步采样模块相连接,数据信号处理单元通过通用串口与目标位置实时显示模块相连接。
3.根据权利要求I所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的麦克风阵列采用平面十字型结构,且呈对称布置,相对应位置的麦克风为一对。
4.根据权利要求I所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的多通道同步采样模块启用与麦克风数量相等的通道数。
5.根据权利要求I所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的多通道同步采样模块的每对通道共用一组前置选频放大电路。
6.根据权利要求I所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的数字信号处理单元的核心部件是数字信号处理器,其具有支持多个不同类型外部存储器扩展的接口,内部携带支持直接存取访问模式的内部总线,所述数字信号处理器自带多个可扩展为通用串口和SPI协议接口的多通道缓冲串口模块;其与目标位置实时显示模块相连接的接口同时具备RS232数据输出能力。
7.根据权利要求I所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的数据存储模块包括三类不同功能的存储器即同步动态随机存储器、电擦除可编程只读存储器和同步静态随机存储器。
8.根据权利要求I所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的目标位置实时显示模块自带通用串口,目标位置实时显示模块串口中具有能反馈工作状态的硬件电路,具有支持触摸输入的硬件电路。
9.根据权利要求3所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的麦克风阵列共有六个麦克风,并分为三对,第一麦克风(I)和第二麦克风(2)组成一对,第三麦克风(3)和第四麦克风(4)组成一对,第五麦克风(5)和第六麦克风(6)组成一对;水平方向分配四颗麦克风传感器,分别为第一麦克风(I)、第二麦克风(2)、第三麦克风(3)和第四麦克风(4),垂直方向分配两颗麦克风传感器,分别为第五麦克风(5)和第六麦克风(6);第一麦克风(I)和第二麦克风(2)之间的距离与第五麦克风(5)和第六麦克风(6)之间的距离相等,第三麦克风(3)位于第一麦克风(I)和十字型结构原点的中间位置,同样第四麦克风(4)位于第二麦克风(2)和十字型结构原点的中间位置。
10.根据权利要求7所述的一种应用于救援的基于麦克风阵列的语音定位装置,其特征在于所述的同步动态随机存储器设有两个。
专利摘要本实用新型公开了一种应用于救援的基于麦克风阵列的语音定位装置,包括麦克风阵列、前置选频放大电路、多通道同步采样模块、数据信号处理单元、数据存储模块和目标位置实时显示模块;数据信号处理单元与数据存储模块、多通道同步采样模块和目标位置实时显示模块三个模块相连;多通道同步采样模块还与前置选频放大电路相连;麦克风阵列仅与前置选频放大电路相连;本实用新型在信噪比不高的救援环境下,能实现多目标的定位,且速率快,成本低,精度高,具有一定的实时性,且易于实现。
文档编号G01S5/18GK202794508SQ20122045403
公开日2013年3月13日 申请日期2012年9月7日 优先权日2012年9月7日
发明者郭健, 倪晶静, 吴益飞, 陈庆伟, 韩国盛, 邹亦萍 申请人:南京理工大学