系统结构如图1所示,主要包括DSP模块、音频处理模块、JTAG接口、存储模块及电源模块等。模拟语音信号通过MIC或IANE IN输入AIC-23,经过模/数转换后通过MCBSP串口输入C5416,经过实际所需的算法进行处理和补偿后,得到听障患者所需要的语音信号,再通过AIC23数/模转换,通过扬声器或耳机输出声音信号。
1.2 C5416与AIC23的接口设计
图2是C5416与AIC23的接口原理图。由于AIC23采样输出的是串行数据,因此需要协调好与之相配的DSP的串行传输协议,MCBSP是最适合做语音信号传输的。将AIC23的第22脚MODE接高电平,接收来自DSP的SPI格式串口数据。数字控制接口(SCLK,SDIN,CS)与MCBSPl连接,控制字共16位,由高位开始传输。数字音频口LRCOUT,LRCIN,DOUT,DIN,BCLK与MCBSP0相连。在工作方式上,DSP为主模式,AIC23为从模式,即BCLK的时钟信号由DSP产生。
串口时钟由BCLKX0,BCLKR0并联到AIC23的BCLK时钟,这样在发送和接收数据时都可产生串口时钟信号。输入/输出同步信号LRCIN与LRCOUT,用来启动串口数据传输,接收DSP的帧同步信号。
BFSX0和BFSR0,BDR0和BDX0分别与AIC23的DIN和DOUT连接来实现DSP与AIC23之间的数字通信。
2 系统实现
2.1 语音的基本特性
声音是一种波,能被人耳听到声音的振动频率为20 Hz~20 kHz。语音是声音的一种,他是由人的发音器官发出的,具有一定语法和意义的声音。语音的振动频率最高可达15 kHz。
语音按其激励形式的不同分为:浊音、清音、爆破音。而人的声音特性基本是由基因周期和共振峰等因素决定的。当发浊音时,气流通过声门使声带发生振动,产生准周期激励脉冲串。这个脉冲串的周期就称为“基因周期”,其倒数即为“基因频率”。
人类的声道和鼻道都可以看做是非均匀界面的声道管,声道管的谐振频率称为共振峰。改变声道的形状就产生不同的声音。共振峰用依次增加的多个频率表示.如F1,F2,F3,等,称之为第一共振峰,第二共振峰等。为了提高语音接收质量,必须采用尽可能多的共振峰。实际中,头三个共振峰是最重要的,具体情况因人而有差异。
2.2 语音增强
在实际的应用环境中,语音会不同程度的受到环境噪声的干扰。语音增强就是对带噪语音进行处理,降低噪声的影响,改善听觉环境。
实际语音遇到的干扰可能包括以下几类:
(1)周期性噪声:如电器干扰,发动机旋转引起的干扰等,这类干扰在频域表现为一些离散的窄峰。特别是50 Hz或60 Hz交流声会引起周期噪声。
(2)冲击噪声:如电火花,放电产生的噪声干扰,这类干扰在时域表现为突然出现的窄脉冲。消除这种噪声可以在时域中进行,即根据带噪语音信号幅度的平均值确定阈值。
(3)宽带噪声:通常指高斯噪声或白噪声,其特点是频带宽,几乎覆盖整个语音频段。它的来源很多,包括风、呼吸噪声和一般的随机噪声源。