·上一文章:激光枪射击游戏电路设计
·下一文章:自举电路增大输入阻抗方法解析
语音激活检测VAD(Voice Activity Detection)指采用一定的信号处理技术来检测信号中是否包含语音信号,并且从背景噪声中找出每一段语音的开始和终止,以明确找出语音信号存在的范围。目前该技术被广泛应用在语音编码、语音增强、语音合成、回声抵消以及语音通信等领域。
语音激活检测的研究历史很长,从最早的基于短时能量、过零率的判断,到基于语音模型和统计知识的各种复杂算法,语音激活检测算法的原理和实现方法都在不断地更新。近年来,一些学者提出了基于支持向量机[1]、小波理论[2]、神经网络[3]和循环累积量[4]等理论的检测方法,对语音检测方法的研究给出了新的思路。如何在保证算法鲁棒性的同时降低算法的复杂度是一个极具挑战性的问题,也是目前语音激活检测中的热点问题。本文设计了一种基于分带谱熵的语音激活检测算法,该方法采用分带谱熵作为判决参数,达到了较高的判别准确率及较低的算法复杂度。
1 特征提取
特征提取的框图如图1所示。首先对加噪语音进行分帧和加窗处理,然后进行时频变换,由参考文献[5]知,与常用的FFT相比,用离散余弦变换谱熵来区分噪声与语音具有更大的隔离度,因此本文选用离散余弦变换(DCT)。离散余弦变换的定义式为: