---世纪新锐文档区欢迎你的到来!交流经验 资源共享!如果你有网站 欢迎转载 更欢迎链接 谢谢你!

芯锐科技——明智之选 好伙伴!
    <--- 返回

数字电视的国际标准(2)

南京邮电学院信息工程系 余兆明

2.5. MPEG-2标准

    MPEG-2是由 MPEG开发的第 2个标准。按计划于 1994年 l1月正式确定为国际标准,MPEG- 2是"活动图像及有关声音信息的通用编码"(Generic Coding of Moving Pictures Associated Audio Information)标准。 MPEG-2标准制定始于 1990年7月。在此之间,国际电信盟电信标准化部门(ITU-T)成立了一个有关 ATM的图像编码专家组。从此开始了JTC1 ITU-T的合作。从1991年5月开始征集有关图像编码算法(Video Coding Algorithms)的文件,有32个公司和组织提供了非常详细的研究结果和 D1格式的编解码图像录像带。 1991年l l月,在日本的 JVC研究所进行了对比测试,确定带有运动补偿预测和内插的DCT最成熟和性能最好。在1992年 1月的会上又定下了 MPEG-2是"通用"(generic)标准。MPEG-2的声音和系统部分的工作始于1 992年7月。MPEG为制定 MPEG-2经常与有关国际组织,如ISO、IEC、ITU-T、 ITU-R等开会协调,并注意到了与 MPEG-1的兼容一致。国际电联的无线电通信部门(ITU-R)从广播电视方面提出的不同需求构成了 MPEG-2的档次/等级(Profile/Level)概念的基础。ITU-R在 MPEG-2的质量检验、测试方面做了大量工作。MPEG-2的委员会草案ISO/IEC CD 13818是 1993年 l1月产生的。按计划在 1994年1 l 月 7日至 l 1日的新加坡会议上,批准为国际标准ISO/IEC IS 13818。此后还要对 MPEG-2进行扩展。

广告:>>2.6. MPEG-4标准

    MPEG-4标准将支持 7个新的功能。可粗略划分为 3类:基于内容的交互性、高压缩率和灵活多样的存取模式。现分别介绍如下:

1. 基于内容的交互性(Content-based interactivity)

    (1) 基于内容的操作与比特流编辑支持无须编码就可进行基于内容的操作与比特流编辑。例如:使用者可在图像或比特流中选择一具体的对象(Object)(例如图像中的某个人,某个建筑等等),随后改变它的某些特性。
    (2)自然与合成数据混合编码 提供将自然视频图像同合成数据(文本、图形)有效结合的方式,同时支持交互性操作。
    (3)增强的时间域随机存取 MPEG-4将提供有效的随机存取方式:在有限的时间间隔内,可按帧或任意形状的对象,对一音、视频序列进行随机存取。例如以一序列中的某个音、视频对象为目标进行"快进"搜索。

2. 高压缩率(Compression)

    (l) 提高编码效率 在与现有的或正在形成的标准的可比拟速率上, MPEG-4标准将提供更好的主观视觉质量的图像。这一功能可望在迅速发展中的移动通信网中获得应用,但值得注意的是:提高编码效率不是MPEG-4 的唯一的主要目际。
    (2)对多个并发数据流的编码 MPEG-4 将提供对一景物的有效多视角编码, 加上多伴音声道编码及有效的视听同步。在立体视频应用方面, MPEG-4将利用对同一景物的多视点观察所造成的信息冗余, MPEG-4的这一功能在足够的观察视点条件下将有效地描述三维自然景物。

3. 灵活多样的存取 (Universal access) 

    (l) 错误易发环境中的抗错性( Robustness) "灵活多样"是指允许采用各种有线、线网和各种存储媒体,MPEG-4将提高抗错误能力(Error robustness capability),尤其是在易发生严重错误的环境下的低比特应用中(移动通信链路)。注意, MPEG- 4是第一个在其音、视频表示规范中考虑信道特性的标准。目的不是取代已由通信网提供的错误控制技术,而是提供一种对抗残留错误的坚韧性。例如:选择性前向纠错 ( Selective forward error correction),错误遏制(Error containment), 或错误掩盖(Error concealment)。
    (2)基于内容的尺度可变性(Content- based scalability) 内容尺度可变性意味着给图像中的各个对象分配优先级。其中,比较重要的对象用较高的空间和或时间分辨率表示。基于内容的尺度可变性是 MPEG-4的核心,因为一旦图像中所含对象的目录及相应的优先级确定后,其它的基于内容的功能就比较容易实现了。对甚低比特率应用来说,尺度可变性是一个关键的因素, 因为它提供了自适应可用资源的能力。例如,这个功能允许使用者规定:对具有最高优先级的对象以可接受的质量显示,第二优先级的对象则以较低的质量显示,而其余内容(对象)则不予显示,可见,这种方式可最有效地利用有限的资源。

2.7. MPEG-7标准

    MPEG 家族的新成员叫作"多媒体内容描述接口"(简称MPEG-7, 它的由来是1+2+4=7, 因为没有MPEG-3、MPEG-5、MPEG-6),它将扩展现有内容识别专用解决方案的有限的能力,特别是它还包括了更多的数据类型。换言之, MPEG- 7将规定一个用于描述各种不同类型多媒体信息的描述符的标准集合。 MPEG-7还将对定义其他描述符及其结构(描述方案),和他们之间的关系的方法进行标准化。这种描述(也就是描述符和描述方案的组合)将与内容本身关联起来,以便对用户感兴趣的素材进行快速高效的搜索。 MPEG-7将标准化一种用来定义描述方案的语言,即描述定义语言(DDL)。带有与之相关的 MPEG-7数据的 AV素材,就可以被加上索引,并可进行检索。这些素材可能包括,静止图像、图形、3D模型、音频、语言、视频、以及关于这些成份如何组成一个多媒体表述(即所谓 "环境",组合信息)的信息。在这些通用数据类型中的特殊情况可能已包括面部表情和个人特征。
    MPEG- 7象 MPEG家族中的其他成员一样,是针对满足特定需要的音、视频信息的标准化表述。由于 MPEG-7是在其它标准表述诸如模拟、 PCM、 MPEG-l、MPEG-2和MPEG- 4等基础上建立起来的,而标准化的功能之一就是对其中相应部分提供参考。举例来说,也许一个用于 MPEG-4的形状描述符,在 MPEG-7的环境里可能会有帮助,同样的,用于 MFEG-l、MPEG-2的运动矢量区也可能有这样的情况。
    但是, MPEG-7的描述符并不依赖于它所描述的内容是编码的或存储的方式,可以把MPEG-7的描述说明,附加到模拟制的电影里或是用纸张打印出来的图片上。然而,尽管MPEG-7的描述不依赖于所处理素材的(编码)表达方式,但由于在一定程度上它是在 MPEG-4的基础上发展起来的,而 MPEG-4采用了按照具有一定时间关系(同步) 和空间关系(对于视频而言是在屏幕上,对于音频而言是在房间内)的对象,来进行音、视频编码的处理方式,因此用 MPEG-4编码有可能把描述说明附加到场景中的成员(对象),比如说音、视频对象身上。所以,MPEG-7在描述中要提供不同的程度,才可能实现不同等级的识别。
    因为描述性特征必须在应用环境中才有意义,所以他们会因用户范围的不同和应用领域的不同而有所区别。这就意昧着,同样的素材,因为要和应用范围相匹配,可能会使用不同类型的特征来描述。我们来看一些例子,对于可视素材,较低的抽象级别可能会用一些象形状、尺寸、纹理、颜色、运动(抛射)、位置("对象会在场景中的哪个位置被发现呢?")等属性来描述;对音频内容而言,可能会采用调式、情绪、节奏、节奏变化、在声场中的位置等属性。而最高的抽象等级可能会给出关于语意的信息: "在这个场景中,左侧有一只正在吠叫的棕狗,右侧有一只落下来的蓝色圆球,背景中还有汽车经过的声音。"当然,所有这些描述都会以高效方式进行编码,也即能提高搜索的效率。同时,中间也可能存在过渡的抽象等级。抽象等级与提取特征的方式有关,许多低等级的特征可以用全自动的方式提取出来,而高等级的特征就需要更多的人工交互。

 

21XR.COM 版权所有 联系我们