数字视频是一种用二进制数进行编码、压缩、再传输的图像信源。它较传统的模拟制式图像信源相比,更适合多次中继的远距离通信,易于多次复制,并且抗干扰能力强,保密性好,有效地提高了电视的质量。
数字化技术在视频图像中的运用成功,不仅需要二进制数的支持,而且图像变换编码及图像编码的标准也为之起着关键性的作用。视频序列力像在时间上有很强的相关性,利用块运动估计 和运动补偿技术可以比较有效地去除图像帧间冗余度,实现高码率压缩比,这种技术已广泛用于视频压缩的一些国际标准中,如H.261,H.263,MPEG-1,MPEG-2等。在这些视频压缩国际标准中视频系统编码器的复杂性最主要取决于运动估计。运动估计是活动图像编码和计算机视觉领域中的一项关键技术。计算机视觉的研究侧重于由物体的二维运动来估计其三维运动,活动图像编码的研究侧重于由物体和摄像机的相对运动而形成的二维运动。因此,数字视频是十分复杂的编码技术的支持。
1.二进制数的引入
在人们的日常生活中,对数的运用,总有一个进位的概念,用以表示数码的量级。在实际应用中,根据不同事物的需要,人们创立了多种数的进位制。我们最常用、最熟悉的是十进制,例如10mm为1cm,10cm为1dm,10dm为1m等。但是,日常生活中,并不都是采用十进制的,如1年等于12个月,则是十二进制;1小时等于60分钟,1分钟等于60秒,是60进制;鞋是以双计算的,即1双等于2只,是二进制。
在我们最常用、最熟悉的十进制数中,共有10个不同的数字符号0、1、2、3、4、5、6、7、8、9,由且由低位向高位是“逢十进一”。
在十进制中由0、1、2、3、4、5、6、7、8、9这十个数字符号,加上正负号、小数点等就可以构成一个数。例如1999这个数,通常读为一千九百九十九。用数学公式表达,则为:1999=1×103+9×102+9×10+9
在十进制中任一个正整数N都能够写成
N=an×10n+an-1×10n-1+...+a3×102+a1×10+a0
其中0≤ai≤9≤,而I是0到几中的任一个数.
如将3475写成数学公式的表达形式时,则当i≥4时有ai=0,a3=3,a2=4,a1=7,a0=5,即3475=3×103+4×102+7×10+5。
在十进制中,由于利用0、1、2、3、4、5、6、7、8、9这十个数字符号可以表示出任意大小的数,因而十进制普遍应用,似乎没有必要搞其他进位制,事实上在电子数字计算机出现以前,除了少数数学家以外,确实没有人考虑其他进位制。
随着电子计算机技术的出现,十进制数已不能适应电子数字计算,为此二进制计算方法便应运而生,并且愈来愈显著起来。在二进制计数方法中,只有两个数字符号0、1,而且由低位向高位是“逢二进一”,同一个数所在的位数相差一位,其值就有二位之差。所以,在二进制的数:
0就是零;
1就是一;
10就是二;
100就是四;
1000就是八;
10000就是十六;
100000就是三十二;
1000000就是六十四;
10000000就是二百二十八;
......等等。
由于在二进制中10就是二,1就是一,所以在十进制11=10+1等于二加一就是三。对于由1111这四个数字符号所组成的数在十进制和二进制中,它们所表示的量值是不同的。在十进制中1111是一千一百一十一,而在二进制中1111=1000+100+10+1却是八加四加二再加一,也就是十五。
在数学界,当g是正整数而g不等于10时,将用(a)g来表示a是用g进位法写的,因此(a)2是表示a是用二进位法写的。为了方便起见,当a是用十进位法写时,我们还用平常的写法,也就是a。
在电子计算机中采用二进制,是因为这种进位制具有下面一些优点:
1.二进制数只0、1两个数字字符号,十进制却有0、1、2、3、4、5、6、7、8、9十个数字符号。电子计算机不可能像人一样,一眼就识别这十个符号。在计算机内只能用物理元件的不同稳定状态来表征这些不同符号。因此,对于一个十进制数就需要一个具有十种不同稳定状态的物理元件,而对于二进制数只要一个具有两种不同稳定状态的物理元件即可。显然,后一种物理元件是容易实现的。如电灯的“亮”与“暗”和开关的“接通”与“断开”都是电灯和开关的两种不同稳定状态,如果用“亮”或“接通”表示1,则“暗”或“断开”就表示0,所以用电灯或开关就可以表示一个二进制数。
2.采用二进制,可以用较少的物理元件表示较多的数,所以采用二进制可以节省设备而使电子计算机的结构比较简单,也有利于工作可靠性的提高。
3.二进制数的四则运算和十进制数相同,因为它只有0和1两个数字符号,因此只要记住“逢二进一”的原则,就可以进行任何运算了。
要使人们习惯采用的十进制量化模拟视频在电子数字计算机中进行运算,道德必须把需要运算的十进制数“翻译”成二进制。根据二进制计数方法的定义,十进制的0、1、2、3、4、5、6、7、8、9这十个数字符号,可用二进制数表示为:
0=(0)2
1=(1)2
2=(10)
3=2+1=(10)2+(1)2=(11)2
4=(100)2
5=4+1=(100)2+(1)2=(101)2
6=4+2=(100)2+(10)2=(110)2
7=6+1=(100)2+(1)2=(111)2
8=(1000)2
9=8+1=(1000)2+(1)2=(1001)2
在实际应用中,可基于2的乘次方采用试减法来将十进制数换成二进制数。2的乘次方通常是:
21=2
22=4
23=8
24=16
25=32
26=64
27=128
28=256
29=512
210=1024
211=2048
212=4096
213=8192
214=16384
...=...
如将24化为二进制数:根据2的乘次方知道,不大于24的最大数是24=16。由24-16=8和2的乘次方知道,不大于8的最大数是23=8。由于
24=16+8=1×24+1×23+0×22+0所以,24=(11000)2
再如将92化为二进制数:根据2的乘次方知道,不大于92的最大数是26=64,由92-64=28,再由2的乘次方知道,不大于28的最大数是24=16。由28-16=12,再由2的乘次方知道,不大于12的最大数是23=8。由12-8=4,再由2的乘次方知道,不大于4的最大值是22=4。由于
92=64+16+8+4
=1×26+0×25+1×24+1×23+1×22+0×2+0
所以(92)=(1011100)2
从十进制数转化为二进制数来看,后者一个最大特点是码位较高。这也是较十进制数在应用计算时的一个不利因素,它要求计算机的硬件有一个较高的质量。
至于二进制数转换成二进制数,方法就比较简单了,只要把它用2的乘次方的多项式表示,求出结果就行了。
如:(10011)2化成十进制数时
分解(10011)2=1×24+0×23+0×22+1×2+1
由有:24+2+1=16+2+1=19
所以(10011)2=19
2.数字视频的编码技术
随着数字化技术的发展和成熟,视频和音频的数字化已使数字高清晰度电视(HDTV)成为现实。高清晰度电视是新一代电视,其扫描线在1000行以上,每行1920个像素,宽高比为16:9,较常规电视更符合人们的视觉特性,使图像质量与35mm首映电影相当。但是由于像素数大幅度增加,使本来数码位就较高的二进制编码形成极大的编码数据,使HDTV的信息量可达常规电视的5倍以上,传输时占用频带宽,存储时占用媒体容量大,特别是对计算量最庞大的运动估算的运动算算法来说,编码器无疑要有非常高的处理速度,这样给实际应用开发带来了极大困难。因此,必须对HDTV图像进行压缩编码。
自美国于90年代初提出第一套数字HDTV方案DigICipher开始,经过几年时间的数字图像压缩技术的发展和MPEG-2标准的制定,限制全数字高清晰度电视实现的信源编码已经不再是挡路石。
在我国高清晰度电视的研究开始于80年代末,到了90年代,在算法方面已经有了一定成果。从用图像子图划分的方法,将一幅图像划分成几块,到采用一种并行处理结构,降低了运动估算及处理速度,完成了基于MPEG-2的高清晰度电视图像信源压编码软件。我国的“高清晰度电视功能样机”项目正是在这样的背景下提出的,并针对我国的国情,使其核心技术图像信源编码器的主要技术要求设定为:
分辨率:1440×1152
场频:50Hz
扫描方式:隔行扫描
幅型比:16:9
在我国目前的经济、技术条件和现实情况下,经过论证,采用了将高清晰度电视画面按“十字”划分的编码方案,同时利用SDTV(标准清晰度)专用视频编码器。如图1-5所示“十字”划分方案,是在编码端,首先将高清晰度画面按图1-5的划分方法,分为四个SDTV(标准清晰度)子画面,然后分别用SDTV编码器进行编码,按MPEG-2中的MP@ML格式进行活动图像压缩,得到四个压缩后的码流,接着将四个视频码按ML@H14L格式重新进行拼接和同步,形成一个高清晰度电视的视频码流。如图1-6所示。
在“十字”划分的编码方案中,MPEG-2MP@ML的编码器的十分关键的。一般有两种实施方案,其一是采用基本的DCT专用芯片,运动估计,加上高性能的数字信号处理(DSP)芯片进行设计;其二是采用现有的MPEG-2编码芯片或芯片组。第一种方案虽然有很大的灵活性,但在设计上比较复杂,而第二种方案设计简单,但灵活性很差。由于经过划分之后的高清晰度图像信源的编码被转化为四个MPEG-2MP@ML的图像信源编码,因此,信源编码的主要任务就变成了MPEG-2MP@ML编码器的设计实现。
由于HDTV编码系统,是由四个MP@ML的编码器加上一些辅助电路构成,因此MP@ML的编码器又称为编码器。子编码器由三个主要模块组成:其一是运动估计模块;其二是运动补偿模块;其三是混合编码模块。
运动估计模块的主要功能和作用是:对输入的信号进行数据格式转换,然后根据MPEG中图像序列处理顺序和显示顺序的关系对帧数据进行重新排序,再将4:2:2格式的数据转换成4:1:1格式,然后进行整像素的运动估计,并将亮度信号、色度信号、运动矢量、帧启动和同步信号等送给运动补偿模块。
运动补偿模块是以输入的整像素的运动矢量为基础,进行半像素的运动估计,并得到相应的平均绝对差值(AMD)。以MAD为标准进行运动补偿方式的选择,选定运动补偿方式后以宏块为单位进行运动补偿,并将选定的运动补偿方式、运行矢量、补偿后的图像差值信号送到后面的混合编码模块。
混合编码模块的作用,除对输入补偿后的图像数据、运动矢量、同步信号及其他格式和控制信号等做DCT处理并进行量化外,还将得到的系数做逆量化和IDCT处理,将重建数据存入帧存中。得到的系数还要进行激程编码,然后进行HufFMan编码,得到的数据与其他控制住处形成MPEG-2码流向后一级输出。
在以十字划分方案的高清晰度电视视频编码器的基础上,由四路MPEG-2MP@ML码流到一路MPEG-2MP@High1440码流的合成技术是十分关键的。要符合MPEG-2标准的码流,就必须保留或修改四路码流的信头信息,合并slice层的数据。
为便于slice的合成,将一个SDTV标准清晰度画面(有效像素720×576)的子画面划分为36个slice,这样最后合成的1440×1152大小的HDTV画面将含36×4=144个slice,每行两个slice。
如果用1、2、3、4分别表示图1-4中的左上、右上、左下、右下位置的子编码器,则在一帧时间内,应首先依次读取子编码器1、2、3、4输出的码流中slice层以上的信头信息,修改子码流中的信头数据,使之成为MP@High1440码流的信头数据,然后输出到HDTV级的传输缓存中,而丢弃码流1、2、3中的这些信头信息。接着依次将码流1和码流2在同一垂直位置上的slice层数据进行拼接输出,直到读完和拼接完码流1和码流2中的一帧码字。然后对码流3和码流4进行拼接,直到完成一个HDTV帧的码流拼接。如此特环,周而复始。
在十字划分方案的高清晰度电视视频编码中,由于采用了SDTV专用视频编码器,所以在HDTV画面的十字边界不能作过界的运动补偿(MC),否则会造成十字边界处宏声的预测误差增大,从而有可能引起十字边界附近宏块重建质量下降,造成十字交叉处图像质量不易被接受。在高清晰度电视功能样机的研究中,四个视频子编码器采用的是IBM公司的MPEG-2专用视频压缩编码芯片,由于受到专用芯片本身的限制,量化级Q的控制无法做到宏块级,所以目前只能在GOP一级进行码率分配,通过保持解码后重建子图间图像质量的均衡,尽可能地减少由十字划分所带来的可能出现的十字叉效应,即十字边界处图像质量的损失。
3.图像压缩码的国际标准
近几年来,随着超大规模集成电路的不断发展,多媒体技术逐渐深入到人们的生活中,并引起越来越多的关注。多媒体的各项应用都离不开高效的图像压缩算法。在视频领域,也正在进行从模拟到数字的转换,从VCD、DVD到HDTV。视频数字化后,由于其数据量很大,不适合存储和实时传输,所以要对其进行压缩编码。为了使图像压缩编码有一个国际标准,ITU和ISO从80年代末期开始了图像压缩的标准化工作,并相继制定了H.261,H.263,MPEG-1,MPEG-2,MPEG-4,JPEG等若干标准,基本上适应了中高码率信道上图像存储、传输的要求。这一系列国际标准的推出极大地促进了视频压缩编码实时实现技术的研究和发展,最终使数字视频技术进入了实用阶段。
(1)H.261编码标准:H.261是一种高集成度全数字化视频编解标准,于1990年7月由可视电话编码专家组提出,建议为ITU-TH.261,全称为“Video CODEC for audiovisual servicesat 64-1920kbps”。它具有覆盖整个ISDN(综合业务数字网)基群信道的功能,适合于有会话业务的活动图像压缩编码,广泛应用于会议电视睡可视电话。它是1948年以来电视图像压缩编码领域40年研究的结晶,其基础和核心是混合编码技术,即带有运动补偿的帧间预测编码+变换编码+量化+可变长编码。其视频压缩编码算未能原理如图1-7所示。
H.261建议要求输入CIF或QCIF格式的图像,CIF格式的空间分辨率为352像素×288行,QCIF格式的空间分辨率为176像素×144行。
H.261建议采用层次化数据结构,将图像数据划分为四个层次:图像层(P)、块组层(GOB)、宏块层(MB)和块层(BIOCK)。
H.261建议的参考模型8(RM8)提出了传输缓存器占有率与反馈的量化系数之间的线性关系描述,并据此来控制传输缓存器输入码流的速率,即传输缓存器由空到满时,量化系数线性地由小变大。但是,由于其采用线性的方法控制一个非线性动态的视频编码器传输缓存器,至使传输缓存器无法工作在最佳状态。这是H.261建议的一个主要缺陷。
目前,基于H.261的数字视频编码系统VP/H261已经研制成功。它可以在线切换CIF和QCIF图像格式、在线切换传输码率。在CIF图像格式下,传输码率不低于384kbps时,能以25帧/s的帧率实时编解码活动图像,图像质量令人满意;在QCIF图像格式下,传输码率不低于128kbps时,能以25帧/s的帧率实时编解码活动图像,图像质量较姨;传输码率为64kbps时,能以8-15帧/s的帧率实时编解码活动图像。
(2)H.263编码标准:H.263是一种极低码率窄带电信信道视频编码建议。它是由国际电信联盟标准组(ITU-T)于1995年提出的关于码率低于64kbps的窄带电信信道视频编码标准草案,并于1996年进一步得到完善。
H.263 是已有图像压缩标准的总结和提高,它的压缩算法采取的是基于波形编码的技术,即DCT/MPC的混合编码技术,基本上是H.261的扩展与改进。
H.263信源编码器处理的是逐行扫描、帧频为29.97Hz的活动图像,帧频容限为±5×10-5.图像信号分成亮度分量和两个色差分量(Y,U和V)编码,色信号格式为Y:U:V=4:2:0。
H.263采用的图像格式共有5种:
1.CIF图像格式:亮度分量,像素数/行为352,行数/帧为288;色度分量,像素数/行为176,行数/帧为144;
2.QCIF图像格式:亮度分量,像素数/行为176,行数/帧为144;色度分量,像素数/行为88,行数/帧为72。
3.SUb-QCIF图像格式:亮度分量,像素数/行为128,行数/帧为96;色度分量,像素数/行为64,行数/帧为48。
4.4CIF图像格式:亮度分量,像素数/行为704,行数/帧为576;色度分量,像素数/行数352,行数/帧为288。
5.16CIF图像格式:亮度分量,像素数/行为1408,行数/帧为1152;色度分量,像素数/行为704,行数/帧为576。
在这5种格式中,每行的像素数与525行或625行信源的亮度和色差信号行下程部分分别以6.75MHz和3。375Mhz取样时的样点数兼容。其画面的幅形比均为4:3。
在H.263规定中,所有的解码器必须能工作在QCIF和SUb-QCIF两种格式,而编码器必须能工作在QCIF和SUb-QCIF两者之中的一种格式。
H.263标准中规定视频信源编码原理,主要由运动补偿预测、离散余弦变换、量化、熵编码和编码控制几部分组成。如图1-8所示。
被编码的每一帧图像划分成很多宏块,一个宏块包含了4个亮度块和两个空间上相应的色差块。每个亮度块或色差块相当于8像素×8行的Y、CB和CRO在QCIF格式中,一帧图像99个宏块,宏块的编号按逐行水平扫描顺序排列。数据传输时,按编号逐个宏块输出。
H.263的视频编码流是十分复杂的,它由图像、块组、宏块、块共四层从高到低分层构成。
(3)JPEG编码标准:JPEG标准,即ISO/IEC1091-1标准。它是对静态图像制订的,但也可用于对连续运动图像进行压缩,压缩时将连续图像的每一个帧视为一幅静止图像进行压缩,若压缩器/解压器速度足够快,还可以实时处理视频信号,构成以JPEG为基础 的实时视频存储/回放系统。
JPEG标准压缩后的视频图像数据量大大减小,对同样的硬盘可以存储更长时间图像,因而在现代数字视频编辑、处理中大量运用了该种编码标准。在因特网上只允许用两种图像格式,JPEG就是其中之一。
JPEG标准提供了4种压缩算法:
1.基线有损压压缩算法。该种算法在DCT离散弦变换的基础上建立的。其压缩运算过程是:
a.以8×8像素块为单位,对图像数据进行离散余弦变换,将数据转换到频率域,得到64个DCT矩阵。
b.对DCT系统进行排序、量化,使数据得到第一次压缩。
c.采用了可变长编码技术,对量化后的DCT系数进行编码。其特点是,对出现概率最的码字分配以较短的码长,对出现概率低的码字分配以长的码长,这样编码后的数据将大大少于编码前的数据,从而达到数据压缩的目的。
2.扩展有损压缩算法,
3.无损压缩算法。
4.分层压缩算法。
JPEG标准可以用于对不同像素结构、不同色度空间、不同扫描方式图像进行压缩,但在不同应用领域对图像压缩的要求也不同,采用的量化表及可长编码技术也不同。为了便于在不同系统间压缩数据文件的交换处理,JPEG标准中定义了几种标记段及相应标记。如在JPEG基线系统中定义的一些标记为:
1.图像开始标记SOI,它主要用于表示JPEG数据文件的开始,是JPEG文件的第一个标记,也是JPEG文件的第一个字。SOI只有标记没有段体。
2.帧开始段SOFO,它主要由若干字节组成,用来定义每个色彩分量使用的量化表及其块数。
3.扫描开始段SOS,它也主要由若干字节组成,用来定义每个色彩分量使用的可长编码技术。
4.图像结束标记EOI,它紧随压缩数据最后一个字节,也是JPEG文件的最后一个字,用以表示JPEG数据文件的结束。
5.应用定义段APPn。在JPEG标准中允许一幅图像数据中最多有16个APP段,APP在压缩时插入用于说明该JPEG文件的应用场合等,解压缩时该段直接由解码器读出传递给使用者。
6.说明段COM。COM也是在压缩时期插入用于该JPEG文件进行注释、备忘等,解压缩时该段直接由解码器读出传递给使用者。
7.量化表定义段DOT,记录编码时用到的量化表,解码时传递给解码器使用。
8.Huffman表定义段DHT,记录编码时用到该表,解码时传递给解码器使用。Huffman编码,是一种可变长编码技术。
(4)MPEG-1标准:MPEG是Moving,Picture Expert Group的缩写词,意为活动图像专家组,他隶属于国际标准化组织(ISO)和国际电工协会(IEC)名下。由该组织规定的视频编码标准就被称为MPEG标准。MPEG标准是现在运用比较广泛的运动图像压缩技术,它的主要特点是利用了DCT算法减少图像空间(二维症面)的信息冗余度,利用运动估算与运动补偿来减少图像在时间方向上的冗余度,以达到大幅度压缩图像信息的目的。目前已有MPEG-1,MPEG-2,MPEG-4等几种标准。它们都是在不断发展中形成的。
MPEG-1标准是由活动图像专家组于1990年正式公布,其图像传输速率规定为1.5Mbps,音频信号速率为64.128-192Mbps,基本分辨率为352×288,主要用于VCD。MPEG-1没有采用国际广播协会确定的CCIR601分辨图像的指标(NTSC为704×480,PAL为704×576),而是采用了适当降低图像清晰度标准的方案,使用较低数据率的1/4分辨图像的标准(NTSC制为352×240,PAL为352×288),水平和垂直清晰度均降低一半,并作VCD视盘机的图像信号标准。
MPEG-1由三个主要部分组成:
1.MPEG系统,该系统规范说明如何净符合MPEG标准视频和音频部分的一条或多条数据流与定时信息结合,形成单一的复合流,以便于数据的存储或传输,在MPEG-1的数据流中又分成系统层和压缩层。系统层主要包含定时信息和其他需要分离的音、视频流,以及重播时同步音、视频的信息;压缩层主要含有被压缩的音、视频数据。
2.MPEG视频该视频部分提供了一种统一的编码格式,用来描述存储在各种数字存储媒体上的经过压缩的视频信息,主要用于对连续传输速率为0.9-1.5Mbps的数字视频序列均含有序列头标、一至多个图像组以及序列结束码,而视频序列的基本编码单元是图,为偶数,而B-Y矩阵和R-Y色差矩阵、R-Y色差矩阵。Y矩阵的行和列均为偶数,而B-Y矩阵和R-Y矩阵无论是在水平方向或是垂直方向均为Y矩阵的一半的尺度。为了保证画面质量,获取高的压缩比,采用了失真算法,使用帧内编码(减少空间相关)和帧间编码(减少时间相关)相结合的办法。帧内编码图像,即为I图像,它在编码时不对其他图像进行参照,它提供编码序列的直接存取(访问)点,并从这一点开始解码。预测编码图像(P图像)使用运动估计与补偿预测进行有效编码,预测时使用过去的帧内编码图像或预测编码图像,并且P图像一般又用作进一步预测的参考。双向预测编码图像(B图像)提供最高的压缩比,但是它需要过去参考图像和将来参图像进行运动补偿,而双向预测编码图像从不用作预测时的参考。
在MPEG-1中,每一幅视频画面都有一个头标和多个画面的切片,通常是垂直方向分片,NTSC制把每帧图像切成15片,而PAL制把每帧图像切成18片。切片同样由一个头标和若干宏块组成,每片分成22个宏块,它的排列从左到右,从顶到底。每一个宏块的亮度部分含有16行,每行有16个像素,这样使用16×16大小的宏块作为运动补偿的单位。同时还把每一个宏块再分成4份,谓之像块,这样一个宏块含有4个亮度Y的像块和两个色差像块,每一个像块均为8×8=64个像素,由此可以算出在PAL制画面中,像素数为64×6×22×18=152064个像素;在NTSC制画面中像素数为64×6×22×15×=126720个像素。
3.MPEG音频,使用子带方法把伴音信息压缩到比特率为64kbps和192kbps。在VCD光盘录制过程中,图像信号压缩到原来的1/120-1/130,而声音信号也要压缩到原来的1/6。
(5)MPEG-2标准:MPEG-2建议(草案)由活动图像专家组于1993年11月提出,主要用于数字电视广播、数字CATV的机顶盒STB及DVD播放机。在这个标准中,图像传输速率为5-10Mbps,音频信号速率为56-256Mbps,基本分辨率为720×480.
MPEG-2标准的核心部分与MPEG-1基本相同,但功能上比MPEG-1有了很大的扩充。它不仅支持普通的CIF、CCIR601等分辨格式,而且还可以支持清晰度分辨率;不仅支持面向存储媒介的应用,还广泛地支持各种通信环境下数字视频信号的编码与传输,如卫星广播、数字地面广播、DVD等等;不仅支持恒定比特率传输模式CBR,还可支持变化比特率传输模式VBR。MPEG-2另一个重要特点是其比特流的可分级性,这意味着编码器可以忽略比特流中的增强部分,只解码全部比特流中的基本部分,仍可得到有用的图像序列,只不过这时所得到的图像分辨率低一些,或者帧速率低一些,或者质量低一些。
在MPEG-2中,视频比特率的范围约在2-80Mbps;视频格式有多种,同时还规定了不同的档次和等级。在所规定的档次中有两个:
1.主要档次,称为MP,是Main Profile的缩写词。
2.专业档次,称为PP,是Professional Profile的缩写词。其亮色比例采用4:2:2格式。
在所规定的等级中有4个:
1.高等级,称为HL,是High Level的缩写词,指图像尺寸不大于1920×1152。
3.主要等级,称为ML,是Main Level的缩写,指图像尺寸不大于352×576。
4.低等级,称为LL,是Low Level的缩写,指图像尺寸不大于352×288,
最常用的主要档次(MP)/主要等级(ML)可以简写为MP@ML,其中@为英文at。
在NPEG-2标准中,重建图像显示清晰度的提高,往往需要以视频比特率为代价。例如:
1.超级VCD,480像素×576行/25帧,视频比特率为1.89Mbps,压缩比为44:1,重建图像显示的清晰度为350线。
2.高密度数字激光视盘DVD,720像素×576行。25帧,视频比特率为3.5-4.5Mbps,压缩比为36:1-28:1,重建图像显示的清晰度为400-450线。
3.数字SDTV(标准清晰度电视),720像素×576行/25帧,视频比特率为4.0-5.0Mbps,压缩比为3:1-25:1,重建图像显示的清晰度为400线。
4.数字HDTV(高清晰度电视),1920×1080行/30帧,视频比特率为18.8Mbps,压缩比为40:1,重建图像显示的清晰度为1000线。
在采用MPEG-2国际标准进行视频压缩编码,而且压缩编码的算法确定时,如何恰当地选取视频比特率数值,是数字化电视业务的一个关键。
(6)MPEG-3标准:MPEG-3建议(草案) 主要对MPEG-2进行了修补,使得图像传输速率为15-45Mbps,音频信号速率为56-256Mbps,基本分辨率为1920×1080。主要应用于HDTV(高清晰度电视)。
(7)MPEG-4标准:MPEG-4是一个多媒体通信标准。其应用十分广泛,既可以应用于高质量的数字电视,又可以应用于极低码率的移动多媒体通信系统,还可以以立互方式进行工作。MPEG-4标准中,对称动通信信道,视频的数码率为5-64Kb/s;对影视应用视频的数码率可高达2Mb/s。
由于预见到通用可编程DSP技术的发展,及相对于用软件实现标准的明显优势,活动图像专家组于1993年7月便开始了制定MPEG-4标准,1997年1月,MPEG-4的第一片正式分布,但MPEG-4的工作尚未结束。第二版的标准还在制定之中。MPEG-4将是一个多媒体通信时代被广泛应用的国际标准。其实现技术还有待于进一步的研究与开发。
另外,MPEG-7也将成为未来国标标准,目前正处于开发探讨阶段。
综上所述,随着多种国际编码标准的实施,我国数字高清晰度电视视频编码器的实时实现已成为必然。其实现方法为:先将1440×1152的HDTV画面划分成4个720×576的SDTV子画面,由4个MPEG-2MP@ML子编码器并行编码,最后将4路码流合成为高清晰度电视码流。为了较彻底地解决十字边界效应问题,子图像重建质量均衡策略主要采用了:1.过界运动估计/运动补偿;2. 码率分配和量化控制策略。
随着微电子技术的发展,我国高清晰度电视最终采用1920×1152/4:2:2格式。