首 页文档资料下载资料维修视频包年699元
请登录  |  免费注册
当前位置:精通维修下载 > 文档资料 > 家电技术 > 单元电路介绍 > 其它电路
一种基于分带谱熵的语音激活检测算法
来源:本站整理  作者:佚名  2011-02-21 08:35:46



语音激活检测VAD(Voice Activity Detection)指采用一定的信号处理技术来检测信号中是否包含语音信号,并且从背景噪声中找出每一段语音的开始和终止,以明确找出语音信号存在的范围。目前该技术被广泛应用在语音编码、语音增强、语音合成、回声抵消以及语音通信等领域。
    语音激活检测的研究历史很长,从最早的基于短时能量、过零率的判断,到基于语音模型和统计知识的各种复杂算法,语音激活检测算法的原理和实现方法都在不断地更新。近年来,一些学者提出了基于支持向量机[1]、小波理论[2]、神经网络[3]和循环累积量[4]等理论的检测方法,对语音检测方法的研究给出了新的思路。如何在保证算法鲁棒性的同时降低算法的复杂度是一个极具挑战性的问题,也是目前语音激活检测中的热点问题。本文设计了一种基于分带谱熵的语音激活检测算法,该方法采用分带谱熵作为判决参数,达到了较高的判别准确率及较低的算法复杂度。
1 特征提取
    特征提取的框图如图1所示。首先对加噪语音进行分帧和加窗处理,然后进行时频变换,由参考文献[5]知,与常用的FFT相比,用离散余弦变换谱熵来区分噪声与语音具有更大的隔离度,因此本文选用离散余弦变换(DCT)。离散余弦变换的定义式为:    


    在DCT变换之后,对DCT系数进行分带,分成32个子带,然后分别计算它的能量,其计算公式为:

关键词:

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分)
Copyright © 2007-2017 down.gzweix.Com. All Rights Reserved .
页面执行时间:37,386.72000 毫秒