H.264标准在IPTV中的应用

发布时间：2010-12-27 阅读量：1446 来源: 发布人:

【中心议题】

*介绍并分析了H.264视频蝙码标准及其关键技术和优势
*介绍了IPTV技术,报告了H.264在IPTV方面的发展现状,并分析了其未来前景

【解决方案】

*分层设计
*高精度、多模式运动估计

1 H.264简介

H.264是一种高性能的视频编解码技术。目前国际上制定视频编解码技术的组织有两个，一个是“国际电联（ITU-T）”，它制定的标准有H.261、H.263、H.263+等，另一个是“国际标准化组织（ISO）”，它制定的标准有MPEG-1、MPEG-2、MPEG-4等。而H.264则是由两个组织联合组建的联合视频组（JVT）共同制定的新数字视频编码标准，于2003年作为MPEG-4标准的一个新的部分（MPEG-4part.10）正式成为国际标准，它是1995年自MPEG-2视频压缩标准发布以后的最新、最有前途的视频压缩标准，在同等图象质量下的压缩效率比以前的标准提高了2倍以上，因此，H.264被普遍认为是最有影响力的行业标准，同时也是一个面向未来IP和无线环境下的新数字视频压缩编码标准。

H.264是在MPEG-4技术的基础之上建立起来的，其编解码流程主要包括5个部分：帧间和帧内预测（Estimation）、变换（Trans-form）和反变换、量化（Quantization）和反量化、环路滤波（Loop Filter）、熵编码（Entropy Coding）。H.264采用基于宏块的DCT变换编码加DPCM的差分编码，在这一点上和以前标准区别不大。但它应用很广泛，覆盖整个视频应用领域，包括：低码率的无线应用、标准清晰度和高清晰度的电视广播应用、Internet上的视频流应用等，可满足各种不同速率，不同场合的视频应用；力求采用简洁的“回归基本”，以便获得更优秀的压缩性能，加强了适应多种信道的能力；提高了对误码和丢包的处理能力；基本档次无须使用版权，具有开放性，IP和无线网络具有很强的适应性。

H.264的关键技术有：

1）分层设计：H.264的算法在概念上可以分为两层：视频编码层（VCL：Video Coding Layer）负责高效的视频内容表示，网络提取层（NAL：Network Abstraction Layer）负责以网络所要求的恰当的方式对数据进行打包和传送。在VCL和NAL之间定义了一个基于分组方式的接口，打包和相应的信令属于NAL的一部分。VCL层包括基于块的运动补偿混合编码和一些新特性。与前面的视频编码标准一样，H.264没有把前处理和后处理等功能包括在草案中，以增加标准的灵活性。NAL负责使用下层网络的分段格式来封装数据，包括组帧、逻辑信道的信令、定时信息的利用或序列结束信号等。

2）高精度、多模式运动估计：H.264支持1/4或1/8像素精度的运动矢量。在1/4像素精度时可使用6抽头滤波器来减少高频噪声，对于1/8像素精度的运动矢量，可使用更为复杂的8抽头的滤波器。在进行运动估计时，编码器还可选择"增强"内插滤波器来提高预测的效果。采用多帧参考技术，以做出更好更精确的预测。

3）4×4块的整数变换：对残差采用基于块的变换编码，但变换是整数操作而不是实数运算，其过程和DCT基本相似。变换的单位是4×4块，缩小了变换块的尺寸，使得运动物体的划分更精确，减小了变换计算量，而且在运动物体边缘处的衔接误差也大为减小。

4）熵编码方法：H.264中熵编码有两种方法，一种是对所有的待编码的符号采用统一的VLC，另一种是采用内容自适应的二进制算术编码。CABAC是可选项，其编码性能比UVLC稍好，但计算复杂度也高。UVLC使用一个长度无限的码字集，设计结构非常有规则，用相同的码表可以对不同对象进行编码，在发生比特错误时能快速获得重同步。

5）帧内预测：对于每个4×4块（除了边缘块特别处置以外），每个像素都可用17个最接近的先前已编码的像素的不同加权和（有的权值可为0）来预测，即此像素所在块的左上角的17个像素，这种在空间域上进行的预测编码算法，可以除去相邻块之间的空间冗余度，取得更为有效的压缩。

H.264的基本档次利用I片P片支持帧内和帧间编码，支持利用基于上下文的自适应的可变长编码，主要包括低复杂度，低延时的技术，用于实时视频通信；主要档次利用B片的帧间编码和加权预测的帧内编码，支持利用基于上下文的自适应的算术编码，主要用于视频广播；扩展档次利用SP和sI片进行流问切换，拼接与随机接入，错误恢复，主要用于流媒体。

H.264正是基于以上关键技术和结构，通过对传统的帧内预测、帧间预测、变换编码和熵编码等算法进行了改进，使得编码效率和图像质量在以往标准的基础上进一步提高；而参数集、片的使用、FMO、冗余片等关键技术的使用可以大大提高系统的抗丢包和抗误码性能；通过采用视频编码层(VCL)和网络适配层(NAL)两层结构，分别进行视频编解码和以适当的格式对VCL视频数据进行封装打包，大大增强了网络适应性。

2 H.264在IPTV中的应用

IPTV是指基于IP协议的电视广播服务。该业务将电视机或个人计算机作为显示终端，通过宽带网络传送电视、视频、文本、图形和数据等,向用户提供数字广播电视、视频服务、信息服务、互动社区、互动休闲娱乐、电子商务等宽带业务。

IPTV的主要特点是交互性和实时性。具体来说表现为：用户可以得到高质量(接近DVD水平的)数字媒体服务，并且可以自由选择宽带IP网上各网站提供的视频节目；实现媒体提供者和媒体消费者的实质性互动。IPTV采用的播放平台将是新一代家庭数字媒体终端的典型代表，它能根据用户的选择配置多种多媒体服务功能，包括数字电视节目，可视IP电话，DVD/VCD播放，互联网游览，电子邮件，以及多种在线信息咨询、娱乐、教育及商务功能。

IPTV的系统结构主要包括流媒体服务、节目采编、存储及认证计费等子系统，主要存储及传送的内容是流媒体文件。视频编解码技术是IPTV的关键技术之一，因为IPTV是基于IP网络来传送图像等数据，因此要求编解码效率要尽可能的高。目前现有的编码技术针对IP网络适应性强，并且图像质量好的标准有MPEG-4ASP、H.264、VC—l和AVS几种。目前成熟并有相应产品支持的是MPEG-4ASP和H.264。

H.264在IPTV中的应用，使IPTV技术的视频编码效率大大提高．从而迅速提升了现有带宽条件下的视频质量，有效地节省了网络带宽。测试结果表明，H.264比H.263++平均编码比特率要少48.8%，比MPEG-4ASP要少38.2%，相对H.263约提高一倍压缩效率。同时，H.264具有较强抗丢包和抗误码性能，容易获得平稳的图像质量。其视频编码层(VCL)和网络适配层(NAL)两层结构的分层处理，对于各种复杂多变的网络环境和应用场合更是具有优势。在图像压缩技术，它能够在较低带宽上提供高质量的图像传输，节约了带宽。码流结构网络适应性强，增加了纠错恢复能力，能够很好地适应IP和无线网络的应用。因此H.264在国际上获得了电信运营商的广泛支持。

但是H.264的高效性是建立在其实现的高复杂度基础上的，就其Baseline而言，解码器复杂度将是H.263解码器的3倍左右。

此外由于其采用了多帧参考技术进行运动估计和RD算法进行模式选择，这就要求处理器体系架构对处理器的数据调度机制以及片内外存储器的组织等必须有新的考虑。因此H.264芯片的软件工作难度（如编译器，操作系统任务调度等）大大增加，延长了其的实现周期和产品成熟周期。

综合来看，H.264得到了电信运营商、设备提供商的支持，无论是在Internet还是其他应用领域，H.264都具备了占据未来市场主流的地位。对于IPTV产业来说，H.264代替MPEG4已成定局，但是短期内H.264的商用成本仍然会阻碍其大规模的应用。