第52章数字电视传播(4)

（2）MPEG-2

MPEG-2制定于1994年，设计目标是高级工业标准的图像质量以及更高的传输率。MPEG-2与MPEG-1基本算法相同，但在系统和传送方面作了更加详细的规定和进一步的完善，并提供了丰富的编码方法、灵活的操作模式以适应不同的画面质量、存储容量以及带宽要求。MPEG-2具有档次和等级的概念，档次主要包括：简单档次（Simple）、主档次（Main）、信噪比可分级档次（SNR）、空间域可分级档次（Spatially）、高档次（High），等级主要包括：低级（Low）、基本级（Main）、高1440级（High-1440）和高级（High）。档次和等级组合可组成20种不同的图像格式和压缩比，有定义可采用的有11种，如下表。

技术特点：MPEG-2适用于广播级数字电视信号的编码和传送，被认定为SDTV和HDTV的编码标准。MPEG-2所能提供的传输率在3Mb-10Mb/s之间，最高分辨率可达1920×1152，能够提供广播级的视像和CD级的音质，其音频编码可提供左右中及两个环绕声道，以及一个加重低音声道和多达七个伴音声道。使用MPEG-2的压缩算法，可以把一部120分钟长的电影压缩为4GB到8GB大小。这种视频格式的文件扩展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盘上的.vob文件等。

应用范围：MPEG-2技术就是实现DVD的标准技术。除了作为DVD的指定标准外，MPEG-2还可用于为HDTV、有线电视网、电缆网络以及卫星直播提供广播级的数字视频。

由于MPEG-2的出色性能，已能适用于HDTV，使得原打算为HDTV设计的MPEG-3的视频标准，还没出世就被抛弃了。

（3）MPEG-4

MPEG-4于1998年11月公布，是为了播放流式媒体的高质量视频而专门设计的。与MPEG-1、MPEG-2的不同之处在于，MPEG-1/2基于帧，而MPEG-4算法的核心是支持内容基（content-based）的编码和解码功能，也就是对场景中使用分割算法抽取的单独的物理对象进行编码和解码。MPEG-4引入了“视频对象平面（Video Object Plane，VOP）”的概念，把每帧图像分割成许多任意形状的图像区，每个区包括场景中的某个物理对象或者内容，这种区被定义为VOP。

图像区的形状和位置也可随着帧的变化而改变，属于相同物理对象的连续的VOP组成视频对象（Video Objects，VO）。例如，一个没有背景图像的正在演讲的人。

MPEG-4可对属于相同VO的VOP的形状、移动和纹理信息单独进行编码和传送，或者把它们编码成一个单独的视频对象层（Video Object Layer，VOL）。此外，标识每个VOL的信息也包含在编码后的数据流中，这些信息包括各种VOL的视频图像在接收端应该如何进行组合，以便重构完整的原始图像序列。这样就可以对每个VOP进行单独解码，提供了管理视频图像序列的灵活性。

同前两个标准不一样，MPEG-4只定义了框架，其具体的算法由各个厂家自定义。其中影响力最大的是美国DIVX公司推出的以.avi为扩展名的MPEG-4格式，其算法的优秀之处在于压缩比大、图像清晰度高，两者兼顾。而且像MPEG-1、MPEG-2一样，公开算法，因此，在某种意义上说，这几乎成了名副其实的MPEG-4标准。

微软在已有的AVI格式（音频视频交错格式，1992年随Windows3.1一起被Microsoft公司推出）基础上，继续发展。由于AVI以块状方式交错存储视音频，按照MPEG-4标准，需要推出新的视频压缩算法，相应有了ASF以及WMV（WMT是Microsoft公司推出的独立于编码方式的在Internet上实时传输流媒体的技术标准，包括视频标准WMV和音频标准WMA）格式的产生。其他知名的还有苹果公司推出的QuickTime和部分手机视频格式等。

技术特点：MPEG-4可利用很窄的带宽，通过帧重建技术压缩和传输数据，以求使用最少的数据获得最佳的图像质量。MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质的小体积视频文件。另外，这种文件格式还包含了以前的MPEG标准所不具备的比特率的可伸缩性、交互性甚至版权保护等一些特殊功能。MPEG-4不仅是针对一定比特率下的视频、音频编码，更加注重多媒体系统的交互性和灵活性，主要应用于视像电话、视像电子邮件等，对传输速率要求较低，在4800-64000b/s之间，分辨率为176×144。这种视频格式的文件扩展名包括.asf、.mov和.avi等。

应用范围：目前MPEG-4技术应用主要以三种形式出现：DIVX-MPEG4光盘、网上MPEG-4电影、MP4。比较热门的应用是利用MPEG-4的高压缩率和高的图像还原质量把DVD里面的MPEG-2视频转换为体积更小的视频文件。经过这样处理，图像的视频质量下降不大但体积却可缩小几倍，可以很方便地用CD-ROM保存DVD上的节目。另外，MPEG-4在家庭摄影录像、网络实时影像播放方面使用也比较多。

（4）MPEG-7

准确地说，MPEG-7并不是一种压缩编码方法，它的正式名称为“多媒体内容描述接口（Multi media Content Deion Interface）”。继MPEG-4之后，要解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索。MPEG-7就是针对这个矛盾的解决方案。

MPEG-7制定了一种针对各类多媒体信息的描述标准，它基于内容和语义，支持对多媒体资源的高效组织、管理、搜索、过滤及检索。MPEG-7描述的多媒体已脱离了传统意义的图像、声音、文本的局限，而与现实生活的结合更为密切，它所定义的“多媒体”含义十分广泛，主要包括客观世界：图像、图表、文本、三维模型、音频、语言、视频等；主观世界：对事物/事件的概括、人的感性色彩、价值取向等；合成法则：各种元素之间的有机结合，以构成一个真正意义上的多媒体演示，如人的面目表情、性格特征，甚至一段电影的主题思想。

MPEG-7的适用范围广泛，既可应用于存储（在线或离线），也可以用于流式应用（如广播、将模型加入互联网等），具体应用有数字图书馆（图像目录，音乐字典……）、多媒体目录服务（例如黄页号簿……）、广播媒体选择（无线电频道，TV频道……）、多媒体编辑（个人电子新闻服务，媒体写作……）等，在教育、娱乐（例如查找游戏）、医疗应用、地理信息系统等领域也有潜在的应用价值。它还可在实时或非实时的环境下应用。

（5）MPEG-21

“电子商务”改变了物质商品交换的商业模式。新的市场必然带来新的问题：如何获取数字视频、音频以及合成图形等“数字商品”，如何保护多媒体内容的知识产权，如何为用户提供透明的媒体信息服务，如何检索内容，如何保证服务质量等。此外，有许多数字媒体（图片、音乐等）是由用户个人生成、使用的，这些“内容供应者”同商业内容供应商一样关心相同的事情：内容的管理和重定位、各种权利的保护、非授权存取和修改的保护、商业机密与个人隐私的保护等。目前虽然已经建立了数字媒体消费和传输的基础结构并确定了与此相关的诸多要素，但这些要素、规范之间还没有一个明确的关系描述方法，迫切需要一种结构或框架保证数字媒体消费的简单性，很好地处理“数字类消费”中诸要素之间的关系。MPEG-21就是在这种情况下出现的。

MPEG-21提出了一个多媒体应用框架，用以支持网络化的数字市场与商业模型，保证系统传递电子内容时尽可能是自动地、简单地协同操作，满足对内容传递、内容安全、权限管理、安全付款以及技术授予权等下层结构的要求。一般来说，MPEG-21主要支持以下功能：通过网络存取、使用并交互操作多媒体对象；实现多种业务模型，包括在价值链中对版权和交易支付的自动管理；对内容使用者的隐私尊重。

MPEG-21主要规定数字节目的网上实时交换协议，其覆盖范围可描述为两项技术的集成：即用户如何通过个人或智能代理找到并获得内容；如何根据用户对内容的权限将内容呈现给用户。MPEG-21的最终目标是为全球多媒体信息用户提供透明有效的电子交易和使用环境。

4.Motion-JPEG

JPEG虽然是静态图像的压缩编码标准，但其算法已经由硬件实现了，压缩速度很快，可以用于单帧视频图像的压缩，即Motion-JPEG（动态JPEG）压缩方式。MJPEG可顺序地对视频的每一帧进行压缩，就像每一帧都是独立的图像一样。

目前很多非线性编辑系统使用的视频卡采用这一压缩标准。这种方式对活动视频通过实时帧内编码单独地压缩每一帧，主要是对频域里人眼不敏感的部分进行滤除，在时域里是均匀分布的，因此在编辑时可随意编辑任意帧，而与其他的帧不相关。

这对以帧为单位的后期编辑处理来讲非常重要。采用M-JPEG压缩格式，当压缩比为7∶1时，可提供相当于Betecam SP图像质量的节目。

但是，用Motion-JPEG压缩后的数字视频，容量仍然相当大，它的重放必须由专门的硬件来处理，此外，M-JPEG这种压缩方式并不是一个完全统一的压缩标准，不同厂家的编解码器和存储方式没有统一的规定。而且目前数字摄录系统都没有采用M-JPEG的压缩算法，无法与采用了M-JPEG压缩算法的非线性编辑系统进行直接的信号传输和处理。因此，市场上采用MPEG-2压缩算法的非线编系统越来越多，如索尼、松下公司分别推出了与其数字录像格式的压缩算法相同的非线性编辑系统，如采用MPEG-2MP@ML压缩算法的广播级非线性编辑系统，并分别与世界上其他非线性编辑系统的生产商和广播电视设备生产商合作，推广这两种非线性编辑系统。这是一个非常重要的信号，用MPEG-2取代M-JPEG是非线性编辑系统的发展趋势。

除了上述国际压缩标准，很多公司也推出了自己的压缩算法，如Real Video是Real Networks公司开发的在窄带（主要是互联网）上进行多媒体实时传输的压缩技术，主要适用于网络上的流媒体播放，应用也非常广泛。

四、数字影像视频编辑处理

连续渐变的静态图像或图形序列沿时间轴顺次更换显示，构成运动视感的媒体。

当序列中每帧图像是由人工或计算机产生的图像时，我们称之为动画视频；当序列中每帧图像是通过实时摄取自然景象或活动对象时，则称之为影像视频。数字视频常常与声音媒体配合进行，二者的共同基础是时间的连续性。本部分仅介绍数字影像视频的处理，动画在下一部分单独阐述。

1.数字影像视频素材来源

（1）捕捉屏幕动态图像

捕捉屏幕动态图像需要专门的软件，如Hyper Cam、Screen Flash等都可以捕捉屏幕上的动作（操作过程），同时记录来自系统麦克风的声音，并可自定义屏幕捕捉区域和保存成AVI、SWF、EXE等不同格式的文件。

（2）采集录像带或广播视频节目

最常见的是用视频捕捉卡配合相应的软件（如Ulead公司的Media Studio以及Adobe公司的Premiere）来采集录像带上的素材。缺点是硬件投资较大，一块国产的视频捕捉卡要1000-2000元左右，国外的产品如Broadway（百老汇）、Apol1o（阿波罗）、Pinnacle（品尼高）等价格较贵，大致在5000元左右，广播级的视频捕捉卡则价格更高。随着计算机CPU速度的提高，用软件代替视频卡功能的情况越来越多，视频卡甚至简化为一个数据传输接口。

（3）使用已有光盘中的视频素材

专门的活动图像素材光盘很少，但可以从内容丰富的VCD和DVD光盘上寻找。

VCD的文件以DAT为文件后缀名，DVD则以VOB为文件后缀名，两者皆可使用MPEGTOOL、超级解霸等格式转换软件或视音频播放软件转换为MPG、AVI等文件或图像序列文件。

这种方法的特点是无需额外的硬件投资，而且得到的视频清晰度不低于用视频捕捉卡从录像带上采集到的视频画面。

（4）网络资源

互联网上的视频资源越来越丰富。当然，网络视频主要是流媒体格式文件，如果编辑制作的节目在对清晰度要求不高的场合使用尚可。这些流媒体文件很难下载，但在观看后一般可以在计算机的Internet临时文件夹中找到。

第52章 数字电视传播(4)

第52章数字电视传播(4)