图像视频编码的国际标准及技术特点...

近10年来，图像编码技术得到了迅速发展和广泛应用，关且日臻成熟，其标志就是几个关于图像编码的国际标准的制定，即国际标准化组织ISO和国际电工委员会IEC关于静止图像的编码标准JPEG、国际电信联盟ITU-T关于电视电话/会议电视的视频编码标准 H261,H.263和ISO/IEC关于活动图像的编码标准MPEG-1，MPEG-2和MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法，代表了目前图像编码的发展水平。表1给出了各种图像与视频编码国际标准的标题，制定日期、目标比特率、应用场合以及所采用的主要编码技术等。表1图像视频编码的国际标准?

标准标题制定的起止日期比特率应用场合采用的主要编码技术JPEG连续色调静态图像的数字压缩编码 1986?3～1992?10压缩比?2～30·因特网·数字照相·图像／视频编辑·DCT·知觉量化 ·Zigzag扫描 ·霍夫曼编码·算术编码JPEG2000下一代静态图像编码标准 1996?2～2000?12压缩比?2～50·因特网·移动通信·打印·扫描·数字照像·遥感·传真·医学图像·数字图书馆·电子商务·JPEG所有技术·小波变换·EBCOT·ROI编码·空间可扩展编码·质量可扩展编码·面对对象编码·位图形状编码·容错编码·TCQ·零树扫描MPEG-1面向数字存储的运动图像及其伴音的编码 ? 1988?5～1992?11不超过1?5Mbit/s光盘存储?·ＶＣＤ·消费视频·视频监控·JPEG所有技术·自适应量化·运动补偿预测·双向运动补偿·半像素运动估计MPEG-2运动图像及其伴音信息的通用编码(后来又有补充)1990?7～1994?11比特率?1?5～35Mbit/s·数字电视·数字高清晰度电视·高品质视频·卫星电视·有线电视·地面广播·视频编辑·视频存储·MPEG-1所有技术·基于帧/场的运动补偿·空间扩展编码·时间可扩展编码·质量可扩展编码·容错编码?MPEG-4音视频对象的通用编码1993?7～1998?10V2：1999?12； V3及V4： 2001?1； V5正在进行比特率8Kbit/s～35Mbit/s·因特网? ·交互式视频 ·可视编辑?·内容操作?·消费视频?·专业视频·2D／3D计算机图形?·移动通信·MPEG-2所有技术? ·小波变换?·高级运动估计?·重叠运动补偿?·视相关可扩展编码?·位图形状编码?·对象编码?·脸部动画?·动态网络编码MPEG-7通用多媒体描述接口1996～2001?7 多媒体数据库等 MPEG-21多媒体框架1999?10 H．261p×64Kbit/s的音视频服务的编解码1984?7～1990?12p×64Kbit/s（p：1～30）·ISDN视频会议?·DCT?·自适应量化?·Zigzag扫描?·运动补偿预测?·运动估计 ·霍夫曼编码?·容错编码H．263低比特率通信的视频编码1993?11～1996V2：1998?1?V3：正在进行比特率?8Kbit/s～1 5Mbit/s·POTS视频电话?·桌面视频电话?·移动视频电话H.261 所有技术?·双向运动补偿? ·半像素运动估计·高级运动估计?·重叠运动补偿?·算术编码

1、JPEG（Joint Photographic Expert Group）? JPEG是ISO/IEC联合图像专家组制定的静止图像压缩标准，是适用于连续色调（包括灰度和彩色）静止图像压缩算法的国际标准。JPEC算法共有4种运行模式，其中一种是基于空间预测（DPCM）的无损压缩算法，另外3种是基于DCT的有损压缩算法。? 1）无损压缩算法，可以保证无失真地重建原始图像。? 2）基于DCT的顺序模式，按从上到下，从左到右的顺序对图像进行编码，称为基本系统。? 3）基于DCT的递进模式，指对一幅图像按由粗到细对图像进行编码。 4）分层模式。以各种分辨率对图像进行编码，可以根据不同的要求，获得不同分辨率的图像。? JEPG对图像的压缩有很大的伸缩性，图像质量与比特率的关系如下：? a)1?5～2?0比特/像素：与原始图像基本没有区别（transparent quality）。? b)0?75～1?5比特/像素：极好（excellent quality），满足大多数应用。? c)0?5～0?75比特/像素：好至很好（good to very good quality），满足多数应用。? d)0?25～0?5比特/像素：中至好（moderate to very good quality），满足某些应用。

2、JPEG-2000? 与以往的JPEG标准相比，JPEG-2000压缩率比JPEG高约30%，它有许多原先的标准所不可比拟的优点。JPEG-2000与传统JPEG最大的不同，在于它放弃了JPEG所采用的以DCT变换为主的分块编码方式，而改为以小波变换为主的多分辨率编码方式。? 首先，JPEG-2000能实现无损压缩（lossless compression）。在实际应用中，有一些重要的图像，如卫星遥感图像、医学图像、文物照片等，通常需要进行无损压缩。对图像进行无损编码的经典方法——预测法已经发展成熟，并作为一个标准写入了JPEG-2000中。? JPEG-2000还有一个很好的优点就是误码鲁棒性（robustness to bit error）好。因此使用JPEG-2000的系统稳定性好，运行平稳，抗干扰性好，易于操作。 JPEG-2000能实现渐进运输（progressive transmission），这是JPEG-2000的一个极其重要的特征。它可以先传输图像的轮廓，然后逐步传输数据，不断提高图像质量，以满足用户的需要，这在网络传输中具有非常重大的意义。使用JPEG-2000下载一个图片，用户可先看到这个图片的轮廓或缩影，然后再决定是否下载。而且，下载时可以根据用户需要和带宽来决定下载图像质量的好坏，从而控制数据量的大小。 JPEG-2000另一个极其重要的优点就是感兴趣区（ROI，Region Of Interest）特性。用户在处理的图像中可以指定感兴趣区，对这些区域进行压缩时可以指定特定的压缩质量，或在恢复时指定特定的解压缩要求，这给人们带来了极大的方便。在有些情况下，图像中只有一小块区域对用户是有用的，对这些区域采用高压缩比。在保证不丢失重要信息的同时，又能有效地压缩数据量，这就是感兴趣区的编码方案所采取的压缩策略。基于感兴趣区压缩方法的优点，在于它结合了接收方对压缩的主观要求，实现了交互式压缩。

3、MPEG-1? 国际标准化组织ISO/IEC的运动图像专家组MPEG（Moving Picture Expert Group）一直致力于运动图像及其伴音编码标准化工作，并制定了一系列关于一般活动图像的国际标准。1993年制定的MPEG-1标准是针对1?5Mbit/s速率的数字存储媒体运动图像及其伴音编码制定的国际标准，该标准的制定使得基于CD-ROM的数字视频以及MP3等产品成为可能。MPEG-1的带宽最多为1?5Mbit/s，其中11Mbit/s用于视频，128Kbit/s用于音频，其余带宽用于MPEG系统本身。? 为了追求高的压缩效率，去除图像序列的时间冗余度，同时满足多媒体等应用所必须的随机存取要求，MPEG-1视频把图像编码分成I帧、P帧、B帧和D帧共4种类型。I帧为帧内编码帧（intra coded frame），编码时采用类似JPEG的帧内DCT编码，I帧的压缩率是几种编码类型中最低的。P帧为预测编码帧（predictive coded rame），采用前向运动补偿预测和误差的DCT编码，由其前面的I或P帧进行预测。B帧为双向预测编码帧（bi-directionally predictive coded frame），采用双向运动补偿预测和误差的DCT编码，由前面和后面的I或P帧进行预测，所以B帧的压缩效率最高。D帧为直流编码帧（DC coded frame），只包含每个块的直流分量。MPEG-1采用运动补偿支除图像序列时间轴上的冗余度，可使对P帧和B帧图像的压缩倍数比I帧提高很多。

4、MPEG-2? MPEG组织1995年推出的MPEG-2标准是在MPEG-1标准基础上的进一步扩展和改进，主要是针对数字视频广播、高清晰度电视和数字视盘等制定的4～9Mbit/s运动图像及其伴音的编码标准，MPEG-2是数字电视机顶盒与DVD等产品的基础。MPEG-2系统要求必须与MPEG-l系统向下兼容，因此其语法的最大特点在于兼容性好并可扩展。MPEG-2的目标与MPEG-1相同，仍然是提高压缩比，改善音频、视频质量，采用的核心技术还是分块DCT和帧间运动补偿预测技术。MPEG-2视频允许数据速率高达100Mbit/s，支持隔行扫描视频格式和许多高级性能。考虑到视频信号隔行扫描的特点，MPEG-2专门设置了“按帧编码”和“按场编码”两种模式，并相应地对运动补偿和DCT方法进行了扩展，从而显著提高了压缩编码的效率。考虑到标准的通用性，增大了重要的参数值，允许有更大的画面格式、比特率和运动矢量长度。除此之外，MPEG-2视频压缩编码还进行了以下扩展： 1）输入/输出图像彩色分量之比可以是4∶2∶0，4∶2∶2，4∶4∶4。? 2）输入/输出图像格式不限定。 3）可以直接对隔行扫描视频信号进行处理。? 4）在空间分辨率、时间分辨率、信噪比方面的可分级性适合于不同用途的解码图像要求，并可给出传输上不同等级的优先级。? 5）码流结构的可分级性，比如头部信息、运动矢量等部分可以给予较高的优先级，而对于DCT系数的高频分量部分则给予较低的优先级。? 6）输出码率可以是恒定的也可以是变化的，以适应同步和异步传输。? MPEG-2视频是一系列的系统，每一个系统具有安排好的共性和兼容程度。它允许对四种源格式或者级别进行编码，从简单清晰度(CIF格式)到完全的高清晰度电视HDTV(High Definition Television)。除了源格式的这种灵活性外，MPEG-2还规定了分辨率从低到高的4级5类共11种单独的技术规范，同一种类不同级别间的图像分辨率和编码速率相差甚远。表2给出了MPEG-2允许的级别和类的组合。?

5、MPEG-4? 1992年11月，MPEG专家组决定开发新的适应于极低码率的音频/视频（AV，Audio-Visual）编码的国际标准，即MPEG-4。对于学术界来说，极低码率（即小于64Kbit/s）是视频编码标准的最后一个比特率范围。

表2 MPEG-2视频规范

等级简单规范主规范高级规范高层1(1920×1152×60)80Mbit/s100Mbit/s高层2(1440×1152×60)60Mbit/s60Mbit/s80Mbit/s主层(720×576×30)15Mbit/s15Mbit/s15Mbit/s20Mbit/s低层(325×288×30)4Mbit/s4Mbit/s 注：简单规范(无B帧，不可缩放)；主规范(B祯不可缩放) SNR缩放(B帧，空间或SNR可缩放) 空间可缩放的规范(B帧，空间或SNR可缩放)；高级规范(B帧，空间或SNR 可缩放)。

MPEG-4专家组深入分析了AV领域中电视(television)、计算机(computer)、通信(communication)以及其交叉融合的发展趋势后，认为MPEG-4应该提供用于通信的新方式，其核心是基于内容content-based)的AV信息存储、处理与操作，支持交互性、高压缩比以及通用存储性等功能。同时在其结构上应具有适应性与可扩展性，以适应硬、软件技术的不断发展，便于及时融合新的技术。? 相对于MPEG的前两个压缩标准，MPEG-4已不再是一个单纯的视频音频编解码标准，它将内容与交互性作为核心，从而为多媒体提供了一个更为广阔的平台。它更多定义的是一种格式和框架，而不是具体的算法，这样人们可以在系统中加入许多新的算法。除了一些压缩工具和算法外，各种各样的多媒体技术如图像分析与合成、计算机视觉、语音合成等也可以充分应用于编码中。? H.261是ITU-T针对可视电话和会议电视、窄带ISDN等要求实时编解码和低延时应用提出的一个编码标准。该标准包含的比特率为p*64Kbit/s，其中p是一个整数，取值范围为1～30，对应比特率为64Kbit/s～92Mbit/s。?

6、H.261 H.261标准大体上分为两种编码模式：帧内模式和帧间模式。对于缓和运动的人头肩像，帧间编码模式将占主导位置；而对画面切换频繁或运动剧烈的序列图像，则帧间编码模式要频繁地向帧内编码模式切换。为了减少信道误码，采用一种叫做BCH（511，493）的纠错编码方式。这种纠错码可以在493比特中自动纠正2比特的错误。按H?261规定，源编码器必须具备纠错编码的功能，而纠错编码是选用的。

7、H.263 1995年，ITU-T总结当时国际上视频图像编码的最新进展，针对低比特率视频应用制定了H.263标准，该标准被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结果。随后几年中，ITU-T又对其进行了多次补充，以提高编码效率，增强编码功能。补充修订的版本有1998年的H?263＋，2000年的H?263＋＋。H?263系列标准特别适合于PSTN网络、无线网络与因特网等环境下的视频传输。 H.263已被几种可视电话采纳为终端标准，如支持PSTN与无线网的H?324，支持N-ISDN的H.320，支持B-ISDN的H?310等。H?263信源编码算法的核心仍然是H?261标准中采用的DPCM/DCT混和编码算法，原理框图也和H?261十分相似。

8、MPEG-7与MPEG-21? MPEG-7是为“多媒体内容描述接口”，是用于信息表示的，PEG-7是“基于语义的表示”。MPEG-7定义了一个描述符标准集，用于描述各种类型的多媒体信息，与之相应的描述方案可以用于规范多媒体描述符的生成和不同描述符之间的有机联系。? 这些描述符与指定的多媒体对象的内容紧密联系，采用提取对象特征的方法为实现基于内容和语义的准确检索提供接口。在此基础上，MPEG-7定义了一种描述定义语言(DDL，Description Definition Language)用于指定和生成描述方案，即希望提出新的视频、音频信息表示方式，它既不同于基于波形和基于压缩的表示方式(如MPEG-1和MPEG-2)，又不同于基于对象的表示方式(MPEG-4)。这一表示方式允许对信息的含义进行一定程度的解释，它可以被一个设备或计算机解码器存取。MPEG-7的目的在于提供一个标准化的核心技，以便描述多媒环境下的视频和音频内容，最终使视频和音频搜集像文本搜集一样简单方便。? MPEG-7可以描述的多媒体对象范围极其广泛，其核心部分DDL语言将充分吸收现有的各种媒体描述语言的特点，以达到对多媒体数据的普遍适应性。MPEG-4中提出的基于对象编码的思想将成为对多媒体数据库中的视频、音频对象进行处理（包括特征提取、压缩编码等）的基本手段。而MPEG-7的多媒体内容描述功能对MPEG-1，MPEG-2，MPEG-4起到性能提高和功能扩展的作用。最后，MPEG-7将提供内容的描述而不是内容本身，它将不能替代已有的MPEG标准（MPEG-1，MPEG-2，MPEG-4），仅仅是已有3个标准的补充。? 正在研制的新标准MPEG-21是一个支持通过异构网络和设备，使用户透明方便地使用多媒体资源的标准，其目的是建立一个交互的多媒体对象，实现多种业务模型，包括对版权和交易的自动管理，对内容使用者隐私的尊重等。

监控系统(CCTV) 今日: 47706 |主题: 63094|排名: 2

图像视频编码的国际标准及技术特点...