1.数字化
脉冲编码调制(PCM)和增量调制(ΔM)常见的波形编码,其编码速率在16kbit/s-64kbit/s。 参量编码:又称声源编码,是以发音模型作基础,从模拟话音提取各个特征参量并进
行量化编码,可实现低速率语音编码,达到2kbit/s-4.8kbit/s。但话音质量只能达到中等。
混合编码:是将波形编码和参量编码结合起来,既有波形编码的高质量优点又有参编码的低速率优点。其压缩比达到4kbit/s-16kbit/s。泛欧GSM系统的规则脉冲激励,长期预测编码(RPE-LTP)就是混合编码方案。
在语音编码中,对话音质量的评价一般按听音者的主观感觉来定级。
质量等级
分数
收听注意力等级
优
5
可完全松驰,不需要注意力
良
4
需要注意,但不需要明显集中注意力
满意(正常)
3
需要中等程度注意力
差 2 需要集中注意力
劣
即使努力去听,也很难听懂
上面提到的RPE-LTP编码可达到4分。
(1)脉冲编码调制(PCM编码)
脉冲编码调制有如下三个步骤:
1)抽样 抽样定理:对一个时间上连续的信号,若频带限制在FM内,要完全恢复原
信号,必须以大于或等于2Fm的频率进行抽样。
例如,一般话音的频率为300Hz-3400Hz,如要完全不失真恢复话音信号,抽样频率
至少为6800Hz,为保险起见,一般取8000Hz。
2)量化 模拟信号经抽样后在时间上是离散的,但其幅度的取值仍是连续的,为了使模拟信号变成数字信号,还必须将幅度离散化,即将幅度用有限电平来表示,实现样值幅度离散化的过程称为量化。量化犹如数学上的四舍五入,即将样值幅度用规定的量化电平表示。
3)编码 将模拟信号抽样量化再编码成数字代码,称为脉冲编码调制(PCM)。64kbit/s的PCM是最成熟的数字语音系统,主要用于有线电话网,它的话音质量好,可与模拟语音相比,其抽样速率为8kHz,每个抽样脉冲用八位二进制代码表示,每一路标准话路的比特率为8000×8=64kbit/s。
对无线传输系统来说,由于频带的限制,必须采用低速高质的编码技术。
(2)参量编码
前面所述的波形编码的话音质量较高,技术实现上也较简单,但其速率较高。这意味着信号所占频带较宽,严重影响系统的容量,不能应用于频率资源有限的无线通信系统。为提高系统容量,必须采用低速高质的语音编码方法。
人们对语音的研究发现,提取出语音信号的特征参量进行编码,而不是对语音信号的时域波形本身编码,可以大大降低编码信号的速率,这种语音编码方式称为参量编码。
参量编码的基础是语音信号特征参量的提取与语音信号的恢复,这涉及到语音产生的物理模型。
为提取特征参量作语音分析,利用了语音信号的平稳特征,即认为语音在10ms-20ms 的时间内其特征参数不变。这样,可将实际语音信号划分为10ms-20ms的时间段,对每
个段内分别进行参量提取。
参量编码可达到很低的速率,但其语音质量较差,主观评定等级低于3分。
(3)混合编码
这是近年来发展的一类新的语音编码技术。在这种编码信号中,既含有语音特征参量信息,又含有部分波形编码信息,其编码速率达8kbit/s-16kbit/s,语音质量可达到商用话音标准。GSM数字蜂窝移动系统中的语音编码技术采用混合编码,称之为规则脉冲激励――长期预测(RPE-LTP)编码,其速率为13kbit/s,语音质量达到4分
进行混合编码的器件称之为语音编码器。其输入信号是模拟信号的PCM信号,对移动台来讲,抽样速率为8000Hz,采用13比特均匀量化,则速率为8000×13=104kbit/s。
在编码器中,编码处理是按帧进行的,每帧为20ms,即对104kbit/s语音数据流取20ms一段,然后分析并编码,编码后形成260比特的净话音数据块,编码后的速率为260/20ms=13kbit/s。