MPEG4 面向网络传输的特性及应用
下面加以详细说明:
MPEG-4中所见的视音频已不再是过去MPEG-1、MPEG-2中图像帧的概念,而是一个个视听场景(AV场景),这些不同的AV场景由不同的AV对象组成。其对象包括自然图像、自然音频,合成声音、合成图像以及带有附加码流的对象如流动文本或用于表面模型活动的流动参数。
在视频编码上引入视频对象平面( VOP,Video Object Plane)、视频对象(VO)的概念,视频对象平面(VOP,Video Object Plane)是视频对象(VO)在某一时刻的采样。VOP是MPEG-4视频编码的核心概念。
进行 MPEG-4编码,首要任务就是把视频图像分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应的编码方法独立进行编码,来实现高效高质量压缩。如对3d对象使用3d动画适用的演算法,对前景VO压缩编码尽可能保留细节和平滑;而背景VO则采用高压缩率的编码策略,对于相同的背景只传输一次,减少信息量。
MPEG-4在对视频图像对象进行编码时,实际上是对一幅图像以最简单的模型编码方式进行编码,对象物被描述成具有矩形外观的的单个视频对象,这就是纹理编码。而传统编码方式中的矩形图在MPEG-4中被看作是VO的一种特例,这正体现了传统编码与基于内容编码在MPEG-4中的统一。
MPEG-4编码中使用场景描述信息来说明各对象在一个复杂多媒体场景中的组合。
下面看一图
MPEG-4 在接收端的系统结构
在图中接收端除了对各自对象进行解码外,还对场景描述信息进行解码。 MPEG-4的场景描述用来确定对象在时间和空间上的位置。它基本上采用VRML虚拟现实造型语言,这种语言规格用来描述包括3D材料、声音和图像的复合场景组合。场景描述像其他流动数据一样在一个基本流中传输,但处理的方式与其他信息不同,接收终端需使用此信息来建立场景结构,对多个视频对象及音频对象进行合成。重要的是在MPEG-4中,场景描述可以构造和升级,从而实现在更高层次上的互动性。
为了更好的说明基于对象的编码方式对交互性的意义,这里列举萨尔诺夫公司开发的用于处理 MPEG-4 AV 的工具(下图)。
该处理工具可实现
• 压缩 /解压缩不同的视觉对象为 MPEG4数据流
• 将视频对象拖入窗口,同时可调整对象的大小、帧频、码率、透明度、层次
• 替换不同的背景
• 把自然的图片与视频对象与计算机合成的纹理和动画对象混合在一起
• 生成每一个视频对象的原数据
借助这套处理工具,用户可在更高的语义程度上交互使用数字视频,其可被广泛应用于交互电视,数字演播室等领域。
五、 MPEG-4标准在专业视频领域的应用
MPEG-4标准的开发目标是实现多媒体业务在各个领域的应用,涉及面非常广泛,不同的应用对应的码率、分辨率、质量和服务也不同。为了满足各种应用的需求,MPEG-4标准相当庞大,划分为不同的部分与等级,或者说它提供了分类的方法。将整个标准划分为一套子标准,利用这些子标准可以针对某些具体的应用组成不同的方案。设备厂商在应用MPEG-4标准进行产品研发时,可根据应用领域的不同,适当选择标准工具的子集。标准的每一个部分都分别有各自最适合的应用场合。例如
《MPEG4 面向网络传输的特性及应用(第2页)》