MPEG(动态图像专家组)是ISO与IEC成立的专门针对运动图像和语音压缩制定国际标准的组织。专门负责为 CD 建立视频和音频标准,而成员都是为视频、音频及系统领域的技术专家。
MPEG(Moving Picture Experts Group,动态图像专家组)是 ISO(International Standardization Organization,国际标准化组织)与 IEC(International Electrotechnical Commission,国际电工委员会)于 1988 年成立的专门针对运动图像和语音压缩制定国际标准的组织。
标准
MPEG 标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7 及 MPEG-21 等。该专家组建于 1988 年,专门负责为 CD 建立视频和音频标准,而成员都是为视频、音频及系统领域的技术专家。及后,他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO/IEC11172 压缩编码标准,并制定出 MPEG-格式,令视听传播方面进入了数码化时代。
MPEG 标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用 DCT 技术以减小图像的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。
历史
MPEG 的缔造者们原先打算开发四个版本:MPEG1-MPEG4,以适用于不同带宽和数字影像质量的要求。后由于 MPEG3 被放弃,所以现存只有三个版本的 MPEG:MPEG-1,MPEG-2,MPEG-4。总体来说,MPEG 在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG 具有很好的兼容性。其次,MPEG 能够比其他算法提供更好的压缩比,最高可达 200:1。更重要的是,MPEG 在提供高压缩比的同时,对数据的损失很小。
MPEG-1
MPEG-1 制定于 1992 年,为工业级标准而设计,可适用于不同带宽的设备,如 CD-ROM、Video-CD、CD-i。它可针对 SIF 标准分辨率(对于 NTSC 制为 352X240;对于 PAL 制为 352X288)的图象进行压缩,传输速率为 1.5Mbits/sec,每秒播放 30 帧,具有 CD(指激光唱盘)音质,质量级别基本与 VHS 相当。MPEG 的编码速率最高可达 4-5Mbits/sec,但随着速率的提高,其解码后的图象质量有所降低。
MPEG-1 也被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL),视频点播(VOD),以及教育网络等。同时,MPEG-1 也可被用做记录媒体或是在 INTERNET 上传输音频。
MPEG-2
MPEG-2 制定于 1994 年,设计目标是高级工业标准的图象质量
mpeg-2 编码器-sc-1101
同时,由于 MPEG-2 的出色性能表现,已能适用于 HDTV,使得原打算为 HDTV 设计的 MPEG-3,还没出世就被抛弃了。(MPEG-3 要求传输速率在 20Mbits/sec-40Mbits/sec 间,但这将使画面有轻度扭曲)。除了做为 DVD 的指定标准外,MPEG-2 还可用于为广播,有线电视网,电缆网络以及卫星直播(DirectBroadcastSatellite)提供广播级的数字视频。
MPEG-2 的另一特点是,其可提供一个较广的范围改变压缩比,以适应不同画面质量,存储容量,以及带宽的要求。
对于最终用户来说,由于现存电视机分辨率限制,MPEG-2 所带来的高清晰度画面质量(如 DVD 画面)在电视上效果并不明显,到是其音频特性(如加重低音,多伴音声道等)更引人注目。
MPEG-4
MPEG 专家组的专家们正在为 MPEG-4 的制定努力工作。MPEG-4 标准主要应用于视像电话(videophone),视像电子邮件(VideoEmail)和电子新闻(Electronicnews)等,其传输速率要求较低,在 4800-64000bits/sec 之间,分辨率 176X144。
ip-3400 mpeg-4 网络摄像机
与 MPEG-1 和 MPEG-2 相比,MPEG-4 的特点是其更适于交互 AV 服务以及远程监控。MPEG-4 是第一个使你由被动变为主动(不再只是观看,允许你加入其中,即有交互性)的动态图象标准;它的另一个特点是其综合性;从根源上说,MPEG-4 试图将自然物体与人造物体相溶合(视觉效果意义上的)。MPEG-4 的设计目标还有更广的适应性和可扩展性。
应用目标
一、 解决低比特率下的多媒体通信等问题;
二、试图建立一种标准,具有广泛的兼容性,能够在多行业得以广泛应用
三、 是一种面向未来的标准,考虑将来技术发展,如人与内容的交互
MPEG4 的应用目标是针对窄带宽传输、高画质压缩、交互性操作以及将自然物体与人造物体相溶合的表达方式,同时还特别强调广泛的适应性和可扩展性。
应用领域
MPEG4 的商业应用领域包括:数字电视、实时多媒体监控、低比特率下的移动多媒体通信、基于内容存储和检索多媒系统、网络视频流与可视游戏、网络会议、交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等。
工业
MPEG 问世数年来,给计算机和家电产业带来的冲击是巨大的。各种基于 MPEG 标准的产品如雨后春笋般不断涌现,VCD 的出现已经使在家电市场上风光多年的录相机看到了生命之路的尽头(想想看,自从 VCD 出现后,电视,报刊杂志上还有录相机的广告吗?);而以生产 MPEG 解码芯片著称的 C-CUBE,却赚得碗满钵溢。市场的竞争是惨烈的,拥有先进的技术,找准市场的方向,才是企业兴旺的出路。面对 MPEG 技术的不断发展,企业是否能跟得上潮流的变化,能否利用更新的技术,开拓出更广阔的市场,这都是值得认真思考的;就象原英特尔公司总裁安德鲁.葛洛夫先生的一本书名所述:“只有偏执狂才能生存。
优点
1. 特别针对低带宽等条件设计算法,因而 MPEG4 的压缩比更高,使低码率的视频传输成为可能。在公用电话线上可以连续传输视频,并能保持图像的质量,这是其它技术做不到的。
2. 节省存储空间。同等条件如场景、图像格式和压缩分辨率条件下,经过编码处理的图像文件越小,所占用的存储空间越小。由于 MPEG-4 算法较 MPEG-1、MPEG-2 更为优化,因而在压缩效率上更高。
3.图像质量好。MPEG4 的最高图像清晰度为 768X576,远优于 MPEG1 的 352X288,可以达到接近 DVD 的画面效果。这使得它的图像高清晰度非常好。另外,其它的压缩技术由于算法上的局限,在画面中出现快速运动的人或物体和大幅度的场景变化时,图像质量下降。而 MPEG4 采用基于对象的识别编码模式,从而保证良好的清晰度。
常见谬误
MPEG-4 等如 DIVX
不少人都以为 DIVX 即是 MPEG-4,但其实 DIVX 是将影像部分以 MPEG-4 来压缩、音效部分以 MP3 压缩处理,再以 AVI 档格式存在的制成品,故档案较 MPEG-2 小,而画质表现就介乎 MPEG-1 与 MPEG-2 之间。
MP3 即是 MPEG-3
正如前述,MPEG-3 只不过是被放弃的一种压缩技术,至于大家熟悉的 MP3 其实是 MPEG-1 Layer 3 的音频数据压缩技术,简称 MP3。
压缩理念
至于 MPEG-4 的出现是由于 MPEG-1 和 MPEG-2 的压缩技术,不能将它放在网络上作为影音资料传递之用,所以 MPEG-4 不再是采用每张画面压缩的方式,而是采用了全新的压缩理念。先将画面上的静态对象统一制定规范标准,例如文字、背景、图形等,然后再以动态对象作基础的方式将画面压缩,务求以最少数据获得最佳的画质,并将之作为网络上传送之用。
此外,值得一提的是,继 MPEG-4 后,将会进入更先进的 MPEG-7 年代。这项崭新技术已非一种压缩编码方法,而是一种多媒体内容描述接口(Multimedia Content Description Interface),能快速搜寻不同类型的多媒体材料,对于将来要面对日渐庞大的图像、声音的管理有重大帮助。
国际标准
MPEG(Moving Pictures Experts Group,运动图片专家组)是在 ISO(国际标准化组织)和 IEC(国际电工委员会)内运作的一个工作组。自从 1988 年开始活动以来,MPEG 已经编制了 ISO /IEC11172(通常所说的 MPEG-1)和 ISO/IEC 13818(通常所说的 MPEG-2)国际标准,其中包括用于服务器和网络会话的标准协议 DSM-CC(Digital storage media command and control,数字存储媒体命令与控制)。
这些标准已获得产业和服务供应商的广泛支持,并且引起了一场数字革命,使得更加普遍的交互式媒体得以迅速发展。目前,MPEG 将研究重点转向了交互性更加高级的形式,在未来的几年里,技术的发展将使这种高级形式成为可能。这就是 MPEG-4 课题的目标,该课题预计在 1998 年底完成,该项目的完成可使用户达到关于音频视频内容交互性的多种形式,以及以一种整体的方式将人工的和自然的音频和视频信息溶合在一起。
MPEG-4 技术包含两个主要部分:视听对象的编码工具集和描述编码工具和编码对象的句法语言(syntatic language)。从技术的观点看,与传统编码标准最显著的不同是:接收者可以下载用于表示视听信息的语法描述,并且具有很快被 VLSI(超大规模集成)技术所支持的特征。
MPEG-4 是一个正在制定的国际标准,它支持用于通信、访问和数字视听数据处理的新方法(特别是基于内容的)。考虑到低损耗、高性能技术提供的机会和面临迅速扩展的多媒体数据库的挑战,MPEG-4 将提供灵活的框架和开放的工具集,这些工具将支持一些新型的和常规的功能。由于快速发展的技术使得工具软件的下载极为便利,因此这种方式极具吸引力。
本文泪雪网将介绍 MPEG-4 的特点以及由 MPEG-4 支持的功能、MPEG-4 的结构和一些潜在的应用,还将介绍制定该标准的工作计划。
特点
远程通信、计算机和电视/电影工业之间的传统界限极为模糊。历史上原本属于某一领域的内容现已渗透到其他两个领域中。视频、声音和通信已进入计算机;交互性进入了电视;视频和交互性则进入了远程通信领域。看起来像一种聚集,实际上并非如此。这三种行业是从不同的技术角度来研究音像应用的。
在当今世界,应对三种主要趋势予以关注:
1、向无线通信发展的趋势;
2、向交互式计算机应用发展的趋势;
3、视听数据的综合应用不断增长的趋势。
对于传统意义上区分的各行业间的交叉,应综合考虑这三种趋势;目前的标准和正在制作的标准没有充分涉及这些新的需求。而 MPEG-4 的重点就是解决这些需求,即综合三种行业的通用应用,以提供便于交互的音频-视频编码、高压缩比和通用访问能力。为了采用迅速发展的相关技术的优点,MPEG-4 标准将保证高度的灵活性和扩展性。
基于内容的交互性包括人与音像画面中有意义的对象相互作用的能力。目前,这种交互作用局限于计算机图形,即人工合成的内容。对于新的交互式音像应用,能够提供与自然的、人工的及自然/人工混合的音像对象的相互作用极为重要。
为了有效使用存储空间和传送带宽,需要有较高的压缩比。对于低比特率的应用,改善压缩效率非常重要。
通用访问能力是指对有用的音像数据的访问可以在存储和传送媒体的很大范围内进行的鉴于移动通信的迅速崛起,通过无线网络进行这种应用的访问尤为重要。
高度的灵活性和可扩展性由句法描述语言来保证,这种句法描述语言称为‘MPEG-4 句法描述语言’(MSDL)。MSDL 将在下面介绍。
目前的视听标准是为从照相机和麦克风获取的自然内容的编码重现而设计的。由于上述三个领域的相互渗透,人工内容的应用在不断增长。因此,很显然的需求是一种既适合于自然对象又适合于人工对象的模式,它能够用来产生单一的音像序列。
功能
a.新的或改进的功能
下述 8 个关键的功能是 MPEG-4 新的特点,可以认为现存的或其他正在制定的标准不能完全支持 MPEG-4,这些功能由编码工具和 MSDL 的组合来支持。当特定应用需要时,灵活的 MSDL 允许使用不同的编码工具来提供这些功能的不同组合。
这些功能如表 1 所述,在表 1 中根据它们是否涉及基于内容的交互性、压缩比或通用访问能力进行了分组。
b.其他标准的功能
除上述新的或改进的功能外,还有几种其他的重要功能,需要用它来支持已预见到的音频应用。与新的或改进的功能所不同的是,下面所列的功能已由现行的或其他正在制定的标准提供。
1、同步———对所表示的音频、视频和其他内容数据进行同步的能力;
2、辅助数据能力———为二进制数据比特流分配通道的能力;
3、虚拟通道分配的灵活性———动态地重新分配视频、音频或数据通道的能力;
4、低延迟模式(端对端或解码器)———对系统、音频和视频编码进行低延迟操作的能力;
5、用户控制———支持交互操作中用户控制的能力;
6、传送媒体交互运作———在各种媒体上进行运作的能力;
7、与其他音像系统的交互运作———与各种类型的终端相互作用的能力;
8、多点能力———具有多源或多目的地的能力;
9、安全———提供密码、鉴别和密钥管理的能力;
10、内容———对各种类型的可视画面和音频内容进行编码的能力(高的和中等质量的音频、宽带、窄带、智能和人工语言及人工音频);
11、格式———对各种格式的音频和视频进行编码的能力;
12、质量———对解码的音频或视频质量的评估。
结构
MPEG-4 结构将为特定问题提供完整的解决方案,并且具有对最新的音像编码技术进行灵活复制的能力。从过去 MPEG 的经验看,预计 MPEG-4 由 4 个不同的部分组成:MPEG-4 句法描述语言、工具、算法和轮廓。这些部分如下图所示:
1.MPEG-4 句法描述语言(MSDL)
MPEG-4 句法描述语言的目的是便于工具、算法和轮廓的选择、描述和下载,以及描述如何分析和处理基本的数据流。MSDL 将提供解决下述有关方面的途径:
协商解码器的配置,该结果将决定轮廓;
描述轮廓:各组成部分以及这些组成部分间的链接;
在非特定机器语言中下载丢失部分,特别是在音像应用中;
用与所选择的轮廓相一致的语法和语义来传送数据(音像和其他)。
2.工具
工具是一种通过 MPEG-4 句法描述语言或使用 MSDL 描述的语言来访问的技术。它可通过软件或硬件来实现。
工具示例:运行补偿和形状表示。
3.算法
算法是提供一个或多个功能工具的有机组合。
算法示例:MPEG-1 音频,MPEG-1 视频和 MPEG-2 系统。
4.轮廓
轮廓是以特定的方式限定的一个算法或一组算法,用以解决一组特定的应用问题。轮廓示例:MPEG-2 at Main Profile@ Main Level。
5.哪些内容需要标准化
以特定的方式可以将其下载到 MPEG-4 终端上的部分不需要标准化。按照 MPEG 的经验,下一步很可能就是对 MPEG-4 句法描述语言、一些工具和一些轮廓的标准化。虽然不必对所有的应用规定轮廓、算法甚至工具。但在轮廓级别范围内,下列应用是必须进行标准化的:
某些应用需要解码器开启与声音和图像重放之间的延迟尽可能的短;标准化的轮廓保证最快的开启。
某些应用使用了有限的易出错的传送资源,如无线网络。
下载花费时间较长,在临界阶段差错风险率较高。
尽管软件和硬件技术在发展,但那些费效最好的终端的生产仍然要求专门的编码硬件和特定软件平台。
通过使用下载,MPEG-4 标准将支持使用不在标准中出现的工具、算法和轮廓。