其中
且
附加随机变量Zkl的引入以及附加随机变量与语音和噪声的动态特征不相关假设的使用降低了动态模型补偿问题的求解维数。这种维数的降低同Gauss-Hermite数字积分的应用,使得新的DPCM成为一种十分有效的动态模型补偿方法。
4 算法评估
算法评估实验采用基于孤立字的6状态HMM来做识别器。每个状态有4个高斯密度函数。选取24个MFCC(12个静态特征,12个动态特征)作为语音特征。训练阶段,用纯净语音训练出纯净语音模型。在识别阶段,使用纯净语音模型作为基本模型来识别。
使用TI—digits为算法评估语音库,选用数据库中有16个人(8男8女)的5081个短句,其中包含20个孤立词,数字‘0’到‘9’和10个附加命令如‘go’、‘help’、‘repeate’等。训练集含有641句,测试集包括5081句。算法分析窗口的长度为32ms,帧速率为9.6ms/帧。选取NOISEX-92中的White、Pink和Destoryerengine 3种噪声作为评估的环境噪声。使用200帧非重叠的噪声来估计噪声模型。全局信噪比定义为:
其中Pm(k)是第m帧的纯净语音功率普,N(k)是估计的噪声能量平均谱,H是每句的语音帧数,L是FFT的长度,g是缩放因子让所加的噪声符合指定的全局信噪比。带噪语音由(20)生成。
其中y(i)是带噪语音,x(i)和n(i)分别是纯净语音和噪声。对于文中语音的动态特征参数是依据(21)获得。
为了比较DPCM方法的性能,采用5种识别方法:失配情况下的识别,Log—Add PMC,Log—Normal PMC,以及Log-AddPMC与Log—Normal PMC和DPCM相结合的方法。
图2给出了White Noise环境下Gauss—Hermite积分项数n与识别率及算法复杂度关系。从图中可以看出随着积分项n的增加,两种方法的识别率都没有明显的变化。但是算法的复杂度却随着n的增加而增加。结果说明n=2的Gauss—Hermite积分可以提供足够的计算精度。因此在DPCM 中采用n=2, 即