MPEG-4技术的演进与在中国的应用

MPEG-4标准目前已发展为ISO/IEC-14496第一版和第二版。随着MPEG-4 第十部分H.264/先进的视频编码(AVC)的提出,MPEG标准进一步演进。

    摘要:MPEG-4标准目前已发展为ISO/IEC-14496第一版和第二版。随着MPEG-4 第十部分H.264/先进的视频编码(AVC)的提出,MPEG标准进一步演进。与此同时,中国自主知识产权的数字音视频编解码标准(AVS)的制定也为便携式多媒体技术开创了新的发展空间。

  活动图像专家组(MPEG)针对数字音频和视频的编码原则制定了MPEG标准,通过MPEG压缩引擎,实现了以经济的成本为消费者提供高质量的数字多媒体内容的理想,也为多媒体市场带来了无限商机。
最新开发的MPEG-4,旨在为机顶盒、互联网、移动设备等应用实现更高质量的压缩和更灵活的格式,提供更加丰富的选择。

  MPEG-4标准目前已发展为ISO/IEC-14496第一版和第二版。随着MPEG-4 第十部分H.264/先进的视频编码(AVC)的提出,MPEG标准进一步演进。与此同时,中国自主知识产权的数字音视频编解码标准(AVS)的制定也为便携式多媒体技术开创了新的发展空间。

  高质量有效传输数字多媒体内容

  MPEG-4可同时处理各种“媒体对象(视频和音频内容的统称)”,形成视听场景,为整套工具包提供互动和个性化媒体内容的视听数据,同时,还可压缩/解压其他媒体对象,如文本、图像、语音、动画、2D和3D对象等。为实现该标准的有效实施,MPEG-4系统对子集、视频和音频工具集都进行了定义,以应用于各种特殊应用,为音频/视频对象的编码提供更丰富的工具。

  H.264/AVC打造MPEG-4新特性

  MPEG-4 第十部分H.264/AVC在本质上与MPEG-2等其他标准类似,是由时间预测和空间预测的综合体与编码转换共同组成的,但这一新标准并不会取代现有的MPEG-4 第二部分“编码解码器”,也不与其兼容。

  除此之外,H.264/AVC还采用了视频编码领域的最新研究成果。由于采用了帧内预测、整数转换、可变的块尺寸运动评估/补偿和去块过滤等现有先进技术,H.264/AVC与之前的标准相比又增加了新的特性,在帮助其他现有的标准在维持相同视频质量的同时,还可平均降低50%的位率。

  帧间预测功能

  H.264/AVC可根据每个宏块片编码类型的不同,以几种编码类型中的一种进行传输,并且所有片编码类型可支持INTRA-4×4和INTRA-16×16两种类别的帧内编码类型。在以往的视频编码标准中,预测操作都是在转换域中进行的,而在H.264/AVC标准中,这一操作往往是根据已编码块中的相邻样本,在空间域中进行的。帧内预测不能跨越片边界,以保持片与片之间的相互独立性。



MPEG-4技术的演进与在中国的应用
图1 H.264/AVC宏块视频编码层框图


  P片中的活动补偿

  除帧内宏块编码类型外,H.264/AVC还包含多种针对P片宏块的预测性或活动补偿性的编码类型。宏块被分割在用于活动描述的大小固定的块中,每个P类宏块对应一个特定的宏块分区。活动补偿的精度为一个样本距离的四分之一。



MPEG-4技术的演进与在中国的应用
图2 一个H.264的P片宏块的分区结构


  一般情况下,H.264/AVC的语法可支持无限制的活动矢量,即活动矢量可以超出画面区域,但活动矢量元件预测不能跨越片边界。

  整数转换

  此外,与以往的视频编码标准相似,H.264/AVC也采用预测剩余的转换编码,但这种转换仅应用于4×4块,而且计算中采用了与4×4离散余弦转换(DCT)特性基本相同的分离整数转换,以此取代了4×4DCT。由于整个逆转换过程由精确整数运算定义,因此避免了逆转换过程中的不错配现象。而对于转换系数的量化,H.264/AVC运用了标量化的方法。块中的量化转换系数通常按照之字形顺序进行扫描,并采用平均信息量编码的方式传输。只要16位整数值相加,并在16位整数值的基础上进行位移操作,H.264/AVC 中的所有转换就都能实现。

  平衡信息量编码

  为实现量化转换系数的传输,H.264/AVC采用了更先进的前后自适应可变长度编码(CAVLC),与仅采用单个VLC列表的方法相比,这一技术能进一步改善平均信息量编码质量。此外H.264/AVC还支持前后自适应二进制算术编码(CABAC),与CAVLC相比,CABAC在进行相同质量的电视信号编码时,通常能够节约10%到15% 的位率,从而进一步提升了平均信息量编码效率。

  多基准帧

  H.264/AVC 还支持多画面活动补偿预测。如下图所示,H.264/AVC可提供不止一个的预先编码画面作为活动补偿预测基准。然而,无论是编码器还是解码器都必须存储基准画面,以实现多画面缓冲器中的画面间预测。



MPEG-4技术的演进与在中国的应用
图3 多画面活动补偿预测


  基于以上特别的先进技术,与其他现有标准相比,H.264/AVC所带来的益处显而易见。例如,与MPEG-2、MPEG-4 ASP 和H.263 HLP等现有的编码标准相比,在使用H.264/AVC播放DVD品质的电视或进行HD视频编码时,相关的位率可节省2.25 到2.5,如表1所示。



MPEG-4技术的演进与在中国的应用
表1


  AVS开创MEPG-4发展新境界

  随着中国数字音频/视频多媒体设备和系统市场的发展,为建立全国性的压缩、处理和数字版权管理标准,中国数字音视频编解码技术标准工作组(简称中国AVS工作组)开发了数字音视频编解码标准(AVS),并于2002年6月由中国信息产业部科学技术司批准通过。2003年12月,AVS工作组针对高清和高质量数字广播、数字存储媒体及其他相关应用制定的首个AVS视频标准问世。

  由于采用的模块相同,AVS与H.264/AVC编码器的架构看起来比较类似。但是,考虑到目标应用与MPEG-2的向后兼容性以及解码复杂程度等因素, AVS音视频编码解码器中模块还是采用了独到的技术,实现了编码效率的进一步大幅提升。



MPEG-4技术的演进与在中国的应用
图4 AVS 视频编码器框图


  AVS需要对输入宏块进行预测,图4所示的开关S0 用于选择帧间和帧内宏块所需的正确预测方法。帧内预测源自左上方块中的相邻像素。由于采用的是8×8整数转换,因此空间预测的单元大小也是8×8。帧间预测则源自解码帧和解码场。AVS支持16×16、16×8、8×16和8×8这4种尺寸的块,但总体而言,高分辨率视频很少使用小尺寸的块。AVS帧间块的活动矢量精度为四分之一像素。

  在AVS中,预测剩余误差需通过8×8整数转换方法进行转换。渐进块仍然按照之字形顺序进行扫描,与MPEG-2中的扫描顺序相似。但AVS却通过自适应VLC编码技术在逐行扫描块中定义了一种新的扫描顺序,四种不同类型的Exp-Golomb密码本也分别对应不同的分**式。此外,AVS还定义了一些映射表,可将编码符号映射到特殊编码及其成分中。

  预测与当前重建错误图像的总数构成了重建基准。AVS在活动补偿环路中使用了一个去块滤波器,能够根据块的工作情况与QP参数进行自动调节。

  由于MPEG-2编码解码器与系统在现有的广播系统中得到了广泛的运用,因此AVS的语法结构也特别采用了与MPEG-2类似的设计,因此能够直接应用于现有的MPEG-2系统。

  目前,AVS可支持YUV 4:2:0和YUV 4:2:2采样结构,以及8位样本精度,用于色度格式的2位无正负整数则为诸如YUV 4:4:4 或RGB 4:4:4之类的其他顺序格式保留了应用空间。

  实现AVS视频标准的主要技术

  平均信息量编码

  首先,AVS 采用了 ?序列Exp-Golomb编码表 (k=0, 1, 2, 3)、CBP、宏块编码模式和活动矢量, 并通过 ?序列 Exp-Golomp 编码表进行解码。由于对Exp-Golomp 编码表进行了调整,AVS解码器并不需要存储这些编码表。而语法元素可以利用带有可选择查找表的简单分析进行解码。 AVS定义的19 个映射表尽管只占用了不到2k 字节的空间,却能很好地适应不同的分配,并具有很高的编码能力。

  转换和量化

  与 H.264/AVC 和 MPEG-2不同的是, AVS 采用8×8 整数转换。为了减少解量化和逆转换中的取整误差,AVS还专门设置了一种特殊程序,并且各种操作均可在16 位内完成。

  帧内预测

  AVS 视频标准采用了帧内预测技术,改进了帧内编码的宏块性能。与AVC/H.264相比, AVS 定义了5种用于8×8亮度块的模式和 4种用于8×8 色度块的模式。

  基准画面

  以往的视频编码标准(如MPEG-2)中, 双向预测编码画面 (B 画面) 通常以前一个画面和/或后一个画面为基准。 虽然预测编码画面 (P画面) 只用前一个画面来预测当前画面,但在解码器内实际的基准缓冲空间相当于该画面的两倍大。而AVS 完全采用基准缓冲器进行P 缓冲器编码, P画面可用前面的两个相邻的 I/P 画面作基准,因此在提升编码效率的同时,占用的基准缓冲器空间仍与 MPEG-2相同。

  B画面对称模式

  AVS还以对称模式取代了现有编码标准的插值模式,只有前向活动矢量进行编码,逆向活动矢量则通过前向和逆向间的相互关系得出。因此,至多有一种方向的活动矢量需要在 AVS的B宏块中进行编码。

  加权预测

  AVS的加权预测功能可以在很大程度上改善编码效率,尤其是在场景转换和照明变化时。加权预测采用了一种简单的线性模式,因此参数能在预测的图像头内进行编码。但每个宏块均可以自由选择是否采用加权预测。

  去块滤波器

  基于块的视频编码经常会产生块赝象,在低位率情况下这种现象会变得更明显。为解决这一问题,AVS 定义了一种适应性环路去块滤波器,用以改进解码视频质量。除了画面边界或片边界外,过滤功能还能用于亮度和色度块的边界。 过滤的强度则取决于宏块的类型、量化阶、活动矢量和块间的区别。

  隔行编码

  在输入隔行序列时,一个画面既可以用一帧也可以用两场 ( 顶场和底场) 进行编码。只有帧和场间的画面层适配可以用于当前的版本。在采用两场编码时,前一场由之前的解码场预测,而后一场则通过前一场和之前的解码场共同预测。 两个场分享一个图像头。但是它们应属于不同的片。

  AVS 视频标准已针对SD/HD广播和存储的基准规范做了定义,该基准规范包含了AVS视频标准中定义的除高级预测模式(Advanced Prediction Mode)以外的所有技术。此外,AVS标准共定义了4个等级,画面最大尺寸在 720×576 到 1920×1080之间,最大位率在10 Mbit/s 到 30 Mbit/s之间。

  综上所述,就压缩效果而言,AVS与H.264/AVC实力相当,同样是MPEG-2的两倍。但AVS在数据存储和传输时对带宽的要求却较小,而且进行数据存储及传输所需的带宽更低,因而相对降低了运算和存储的复杂度。

  PR818S单芯片解决方案

  为满足便携式数字摄像机、网络照相机、手持个人录像机 (PVR)及个人媒体播放器等超小体积的产品对低位率和低功耗的要求,矽玛特推出的PR818S全面支持MPEG4 CODEC和JPEG模式,提供超高视频质量、低功耗的高集成半导体解决方案.

  PR818S是用于便携设备高质量视频的全双工、固定线路MPEG-4 ASP/SP和MPEG-2 CODEC的单芯片解?方案,内置的ARM922T™ RISC核心,支持MPEG4 ? MPEG2代码转换和全双工(编、解码可同时进行)。包括三星产品在内的众多消费电子厂商都选择了这一解决方案。



MPEG-4技术的演进与在中国的应用
图5 PR8185单芯片解决方案


  除此之外,矽玛特目前还在开发H.264/MPEG-4 AVC及SMPTE-VC1(WMV9)压缩技术等新的固定线路产品,以进一步满足便携式消费市场对更先进音视频编码技术和功能的需求。

 

MPEG-4技术的演进与在中国的应用

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 高清监控镜头应用推动金融安防走向深入

    由于银行环境的特殊性,对柜台操作、交易对象、往来人群的监控图像要求越来越高,从最初的CIF图像效果已基本都提高到D1图像效果。随着数字监控系统的渐渐普及,近来百万像素图像乃至高清图像的需求也越来越多。银行监控不光要“看的到”,而且越来越要求“看得清”。

    2024年4月17日
  • 厂区安装监控需要多少钱

    厂区安装监控需要多少钱 厂区安装监控是现代企业保障安全的重要手段之一。随着科技的发展,监控设备的种类和功能也越来越多样化。那么,厂区安装监控需要多少钱呢?下面将从设备种类、规模和功…

    2023年9月25日
  • 振邦智能保安平台(振邦智能保安平台:智能化保安解决方案的领导者)

    振邦智能保安平台是一款基于先进科技的保安管理系统,提供了一系列功能和应用,为用户提供高效、智能的保安服务。 首先,振邦智能保安平台具备全面的视频监控功能。通过安装在各个关键位置的高…

    2023年7月23日
  • 刷脸场景迅速普及 人脸识别应用“边界”何在?

    近年来,人工智能发展迅速,特别是人脸识别技术,被越来越广泛运用到人们的日常生活中。在人脸识别技术给社会带来种种便利的同时,人们对于这项技术在安全性方面的担忧也逐渐增长。

    2024年4月7日
  • 什么是真分集类无线话筒?

    由于分集接收技术在信号传播中具有独特的优势,因此itc将此技术应用于无线话筒中,推出系列产品。itc的无线话筒系列采用了UHF超高频段双真分集接收,并采用PLL锁相环多信道频率合成技术,提供各200个共500个信道选择,真正分集式接收,有效避免断频现象和延长接收距离。

    2023年4月6日
  • 大型监控系统的特点和技术要点

    随着宽带网络的普及和行业管理部门对管理水平提高的需求增加,城市公安、金融、环保、电力等许多管理部门对城市范围内的大型联网安全与视频监控平台的需求也在这两年开始大量增加,其中尤其以城市公安和金融领域的需求最为突出。

    2024年4月21日