MPEG-7与媒体资产检索
MPEG-7与媒体资产检索
1、 引言 随着电视技术与IT技术的不断融合,以及IT技术日新月异的发展,实现视音频信息的数字化管理即所谓的媒体资产管理已成为可能。但要实现对庞大的视音频数据进行组织、管理及检索,仅仅有数字化的视音频信息是远远不够的,这时便提出了所谓的"元数据(Metadata)"技术。"元数据"就是描述数据的数据,即有关视音频信息的描述信息。但现在多数媒体资产管理系统都是按照传统的管理信息系统的方式组织和管理元数据的,即将视音频信息进行编目,再将编目信息(元数据)存入数据库以备日后的检索和管理。这种方式对于版权、作者、主题等等文本信息是很有效的,但是要实现真正的面向内容的管理就力不从心了。针对这一问题,MPEG (Moving Picture Experts Group)推出了基于内容的多媒体描述标准MPEG-7。MPEG-7标准重点在于AV(Audiovisual)信息的描述和定义,以明确的结构和语法来定义AV信息的内容。它的正式名称是"多媒体内容描述接口(multimedia content description interface)"。通过MPEG-7格式定义的信息,使用者可以有效地搜寻、过滤和定义想要的视音频资料。 2、 MPEG-7 MPEG-7于2001年推出,它本身并不试图定义一种新的数字压缩方法,而主要是针对基于内容的多媒体描述问题。 2.1 MPEG-7标准的范围 MPEG-7是MPEG继MPEG-1、MPEG-2、MPEG-4之后制定的新标准,但它与前三个标准不同,它超越基于波形或基于样本、基于压缩(如MPEG-1和MPEG-2)甚至是基于对象(如MPEG-4)的表示,也超越具体的存储方式(如可以应用于存储在磁带、影片等上模拟信号也可以应用于存储在磁盘、光盘上的数字信号,甚至可应用于存在于纸上的图形、图片),其目的是建立一种基于多媒体内容的描述方式,以便更有效地支持多媒体资料在产生、存储、交换、传输等过程中的各种应用,这些应用包括搜索引擎、编辑工具和个性化的检索机制等。但MPEG-7并不涉及这些就在具体的应用本身,而是仅仅定义了多媒体内容的描述方法,图1是关于MPEG-7标准内容的抽象描述。 MPEG-7对多媒体信息的描述目前主要包括以下几个方面(当然,随着应用的不断深入,MPEG-7也在不断的扩充和完善): ● 有关媒体制作方面的信息(如媒体的制作商、标题等);● 有关媒体使用方面的信息(如媒体的版权、使用记录等);
● 有关媒体存储方面的信息(如媒体的编码方式、存储格式等);
● 有关媒体时间域、空间域方面的信息(如媒体中的场景切换、区域分割等);
● 有关媒体特征方面的信息(如媒体的灰度、纹理、音频特征等);
● 有关媒体内容表述方面的信息(如媒体中包括的对象、事件及其之间的相互关系等)。
2.2 MPEG-7描述
MPEG-7定义了一组的描述方法和工具,主要包含:
● 描述子D (Descriptors):用来描述多媒体内容的各种特征。
● 描述方案DS (Description Schemes):用来描述D之间的结构及关系。
● 描述定义语言DDL(Description Definition Language):用来定义D和DS的语言。 一个MPEG-7描述(descriptions)由一组DS实例组成,并与AV素材的内容链接,以使用户能够快速、有效地访问需要的AV素材。描述可以与AV素材存储在同一存储系统中,也可以异地、远程存储。 2.2.1描述子 MPEG-7定义了一组标准的描述子,下表列出的是一些MPEG-7的视觉描述子: 类型 特征 描述子视觉结构 网格分布二维/三维多视图时间序列三维空间坐标系时间插值 颜色 颜色空间颜色量化颜色直方图主颜色可扩展颜色颜色结构颜色分布 《MPEG-7与媒体资产检索》