MPEG的发展动态及其未来预测
规定了传送码流的实时接口。
MPEG-2视频编码标准是一个按等级划分的系列,按编码图像的分辨率分成4个“级”:低级(LL:low level),输入信号的像素为ITU-R601格式的四分之一;主级(ML:main level),输入信号的像素为ITU-R601;高级-1440(H14L:high-1440 level)为4:3模式电视高清晰度格式;高级(HL:high level)为16:9模式电视的高清晰度格式。按所使用的编码工具的集合分成5个“类”:简单类(SP:simple profile),只有基准帧I和预测帧P;主类(MP:main profile),比SP增加了双向推测帧B;信杂比分层类(SNRP:SNR scalable profile);空间可分层类(SSP:spatial scalable profile);高类(HP:high profile)。“级”与“类”的若干组合构成MPEG-2视频编码标准在某种特定应用下的子集。对某一输入格式的图像,采用特定集合的压缩编码工具,产生规定速率范围内的编码码流。MPEG-2的编码码流分为6个层次。从上至下依次为:视频序列层(Sequence);图像组层(GOP:GroupofPicture);图像层(Picture);像条层(Slice);宏块层(MacroBlock)和像块层(Block)。
MPEG-2的编码流程:在帧内编码的情况下,编码图像仅经过DCT,量化器和比特流编码器即生成编码比特流,而不经过预测环处理。DCT直接应用于原始的图像数据。在帧间编码的情况下,原始图像首先与帧存储器中的预测图像进行比较,计算出运动矢量,由此运动矢量和参考帧生成原始图像的预测图像。而后,将原始图像与预测像素差值所生成的差分图像数据进行DCT变换,再经过量化器和比特流编码器生成输出的编码比特流。
1.3 MPEG-4
MPEG-4标准的目标是:支持多种多媒体应用(主要侧重于对多媒体信息内容的访问),可根据应用的不同要求现场配置解码器。MPEG-4旨在为视(音)频数据的通信、存取与管理提供一个灵活的框架与一套开放的编码工具。
在MPEG-4图像与视频标准中,视频表示工具的目标,是为多媒体环境下的纹理、图像和视频数据的有效存储、传输及管理提供标准化的核心技术。尤其强调这些工具对图像和视频内容的原子单元(称为视频对象VO)的编解码能力。对任意形状的视频对象进行有效的表示,以支持所谓基于内容的功能集。而此功能集支持内容(即场景中的物理对象VO)的单独编码和解码,这一特性为交互性提供了有力的底层机制支持,也为在压缩域对图像或视频的VO内容进行灵活的表示和管理提供了有利条件。MPEG-4图像与视频标准统一支持传统矩形和任意形状图像与视频的编解码。对于基于内容的应用,输入的图像序列可能具有任意形状和位置。形状可以用8位透明分量表示(一个VO由多个其它对象构成时)或用一个二值掩模描述。另外,通过对场景中每个物理采用适当的和精细的基于对象的运动预测工具,可以大大提高某些视频序列的压缩比。对于MPEG-4扩展的基于内容的编码可视为传统的VLBV内核或HBV工具由矩形输入向任意形状输入的逻辑延伸。从这个意义上,基于内容的编码是VLBV和HBV内核的超集。
MPEG-4标准在原有的基础上增加了七个新的功能。增加的各个功能的特点:
(1)基于内容的操作与比特流编辑支持无需编码就可进行基于内容的操作与比特流编辑。(2)自然与合成数据混合编码。提供将自然视频图像同合成数据(文本、图形)有效结合的方式,同时支持交互性操作。(3)增强的时间域随机存取。MPEG-4将提供具有效的随机存取方式:在有限的时间间隔内,可按帧或任意形状的对象,对一音、视频序列进行随机存取。(4)提高编码效率。在与现有的正在形成的标准的可比拟速率上,MPEG-4标准将提供更好的主观视觉质量的图像。(5)对多个并发数据流的编码。MPEG-4将提供对一景物的有效多视角编码,加上多伴音声道编码及有效的视听同步。在立体视频应用方面,MPEG-4将利用同一景物的多视点观察所造成的信息冗余,在足够的观察视点条件下有效地描述三维自然景物。(6)错误易发环境中的抗错性“灵活多样”是指允许采用各种有线网和各种存储媒体,MPEG-4将提高抗错误能力,尤其是在易发生严重错误环境下的低比特应用中(移动通信链路)。MPEG-4是第一个在其音、视频表示规范中考虑信道特性的标准,目的不是取代已由通信网提供的错误控制技术,而是提供一种对抗残留错误是紧韧性。(7)基于内容的尺度可变性。内容尺度可变性意味着给图像中的各个对象分配优先级
《MPEG的发展动态及其未来预测(第2页)》