这里只对常见的视频音频编码做一个系统的简单介绍,并不进行详细探讨。由于我的知识有限,难免有错误的地方,欢迎来信指正。
MPEG系列
MPEG即(Moving Pictures Experts Group)运动图象专家组,属于ISO(International Organization for Standardization)国际标准组织,他们开发了一系列视频音频编码,最为大家熟悉的就是MP3,MPEG-1/2/4。
较早的视频编码,质量比较差,主要用于CD-ROM存储视频,国内最为大家熟悉的就是VCD(Video CD),他的视频编码就是采用MPEG-1。
在MPEG-1的基础上开发的一种视频编码,它的质量远远好于MPEG-1,所以被运用在了DVD-Video上面,MPEG-2是DVD-Video唯一指定的视频编码。MPEG-2不光运用于DVD-Video,现在大部分HDTV(高清电视)也采用MPEG-2编码,分辨率达到了1920x1080。由于MPEG-2的普及,本来为HDTV准备的MPEG-3最终宣告放弃。
为了应对网络传输等环境,传统的MPEG-1/2已经不能适应,所以促使了MPEG-4的诞生。MPEG-4采用了一系列新技术,来满足在低带宽下传输较高视频质量的需求。DivX,XviD,MS MPEG4都是采用的MPEG-4视频编码,除了在DVDRip上面的应用,3GPP现在也接纳了MPEG-4作为视频编码方案。
它和MPEG-4是两种不同的编码,主要是在极低码率下MPEG-4表现并不好,而AVC更加适合低带宽传输。在高码率上,AVC的表现也要好过MPEG-4,所以现在大有取代MPEG-4的趋势。下一代HD DVD和Blue Ray Disc已经正式接纳AVC为视频编码方案之一,相信AVC的发展前途会非常好。
也就是MP1、MP2,较早的音频编码,是MP3的前身,主要用于VCD,DVD,SVCD的音频编码。
大名鼎鼎的MP3,已经成为网络音频的主流格式,能在128kbps的码率接近CD音质。
在MPEG-2上开发的一种新的音频编码,和传统的MPEG Audio不兼容,它的质量理论上高于MP3,并且支持多声道。在96kbps的码率范围内就能接近CD音质,比MP3更加适合地码率传输。
AAC已经作为MPEG-4标准的音频编码,当然MPEG-4 Audio还有其他多种音频编码。
采用了SBR频带复制技术的AAC,SBR技术能够让音频编码降低一半的码率而音质不会有太大改变,已经成为MPEG-4标准的一部分。
NTT开发的一种音频格式,曾经销声匿迹了一段时间,只在Nero里面见到过它的身影。现在搭上SBR技术又进入了MPEG-4标准,似乎不甘心就这么被遗忘,据说在低比特率下表现比aacPlus更好。
MP3加上SBR技术诞生的一种产品,但是并没有得到多大推广,更没有进入标准。
让MP3插上多声道的翅膀,Fraunhofer开发的又一种MP3升级产品,听说DivX 6准备将它作为音频编码。Fraunhofer一直都在围绕着MP3升级,mp3PRO、MP3 Surround,这些产品都能和传统MP3兼容,但是随着层出不穷的新编码,不知道MP3还能走多远。
DVD系列
说了MPEG,就不能不提这个MPEG-2最大受益者——DVD。当然,这里是指DVD-Video和DVD-Audio,也会涉及一些HD DVD。DVD的编码都属于应用级的,它们自己并不开发编码,这一点要和MPEG区别开来。
DVD事实上的音频编码标准,现在所有的DVD都采用它压缩音频,提供了最大5.1声道的输出支持,能在有限的空间存储高质的音频。
下一代HD DVD的音频编码,是AC3的升级版本,支持7.1甚至更多的声道,码率范围也有大幅提升。
HD DVD上的无损音频编码,同样为Dolby公司开发,最高采样能达到192KHz,也为DVD-Audio的音频编码标准。
DTS最初是为电影院开发的音频系统,后来才应用于DVD中。它是AC3的有力竞争者,不过在DVD中只有D9才能够看到他的身影,虽然广大发烧友都在鼓吹它的效果超过AC3,但是测试出来并不如想象中的那么好,特别是高频方面不及AC3。
下一代HD DVD的音频编码,它和Dolby Digital Plus都被指定为强制编码,看来在未来会和Dolby平分秋色。
没有压缩的PCM编码,只能存储两声道,但是采样率能够高达96KHz,是DVD-Video中音质最好的一种,当然体积也是最大的。
主要是MP2,应用于PAL制式的DVD,压缩率高,支持多声道(MPEG-2规范都支持多声道)。
这个似乎扯远了,不过作为DVD-Audio的最大竞争对手SACD,顺带介绍一下。DSD(Direct Stream Digital)直接比特流数字,由Sony推出,能够避免传统PCM编码的弊端,达到非常高的品质。最高采样和DVD-Audio一样,192KHz。
H.26X系列
“ITU(International Telecommunication Union)国际电传视讯联盟”主导的编码系列,主要应用于实时视频通信领域,如会议电视等。由于现在MPEG系列也开始向这个领域进军,所以这两个组织也开始了密切的合作,如最近热门的AVC/H.264,就是由ITU旗下的“VCEG(Video Coding Experts Group)视频编码专家组”和“ISO(International Organization for Standardization)国际标准组织”旗下的“MPEG(Moving Pictures Experts Group)运动图象专家组”联合制作发布的。
H.261是ITU-T为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的,它是最早的运动图像压缩标准,它详细制定了视频编码的各个部分,包括运动补偿的帧间预测、DCT变换、量化、熵编码,以及与固定速率的信道相适配的速率控制等部分。
H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准,它是在H.261基础上发展起来的。
H.263的第二个版本,加入了许多新技术来扩展H.263的应用范围。
在H.263+上增加了几个选项,来增强码流在恶劣信道上的抗误码性能,同时提高增强编码效率。
也就是前面提到的MPEG-4 AVC。H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。在ISO/IEC中该标准命名为AVC (Advanced Video Coding),作为MPEG-4标准的第10个选项;在ITU-T中正式命名为H.264标准。
3GPP
现在通讯领域最热门的话题之一,既然说了MPEG和ITU,和这两个千丝万缕的3GPP应用就不得不提了。3GPP的视频采用了MPEG-4和H.263两种编码,可能还将加入H.264,音频方面音乐压缩采用AAC,语音则采用先进的AMR,另一个aacPlus随着V2版本的推出,底码率下的效果更加突出,也有望加入标准。
Windows Media系列
Microsoft公司主导的音频视频编码系列,它的出现主要是为了进行网络视频传输,现在已经向HDTV方面进军,开发了WMV HD应用。
- Microsoft MPEG-4 v1/v2/v3
最早的ASF采用的视频编码,基于MPEG-4技术开发,DivX3.11就是基于Microsoft MPEG-4 v3破解出来的,后来才进行了重写。
Microsoft正式开发的第一个Windows Media Video,开始脱离了MPEG-4,和MPEG-4不兼容,从这一点上可见微软的野心。可惜这个版本压缩效果非常烂,打破了微软一飞冲天的美梦,不过它在压缩速度上非常快,现在网络上有很多采用这种格式压缩的WMV。
在WMV7基础上改进的版本,质量上面进不了不少。
微软的重头戏,不光是这一个编码,V9系列更是一个平台,让微软有足够的能力挑战MPEG,ITU等标准化组织。虽然这个版本并没有微软吹得那么厉害,特别是低码率下比较差,不过跟以前版本相比进步还是非常多的。特别是WMV HD的应用,让微软也跻身视频标准领域。
- Windows Media Video 9 Professional
WMV HD应用的编码,和WMV9兼容,在高比特率上进行了优化,画面非常优秀。(不过几十M的码率能不优秀吗?全是体积换来的。)
- Windows Media Video 9 Advanced Profile
随着Windows Media Player 10推出的编码器,能够更进一步控制WMV9的质量。但是不能在老版本的WMP9上播放,也就是不兼容老版本的WMP9,真不知微软在搞什么?
- Windows Media Video 9 Screen
静态屏幕无损压缩编码,质量非常好,压缩率高,只针对如屏幕等变化非常小的环境。
- Windows Media Video 9 Image
静态图像压缩编码。
- Windows Media Audio v1/v2
微软最早的音频编码技术,用于ASF中,后来被破解也用在DivX Audio中,质量比较差。
随着各种不同的WMV而推出的相应的音频编码,质量节节提升,不过还没有达到64kbps CD音质的神化。
- Windows Media Audio 9 Professional
WMA9中出现的新编码,主要用于多声道编码和高采样率音频的编码,质量不错。
- Windows Media Audio 9 Voice
针对语音的编码,最高20kbps,不过和AMR相比,效果就太差了。
- Windows Media Audio 9 Lossless
无损音频编码,可以完美保留CD原质量,是CD备份的不错选择,不过代价是体积过大。
RealMedia系列
RealNetworks所开发的系列编码技术,也是主要用于网络传输,在底码率下表现不错。
早期的RealVideo编码,质量比较糟糕,不过那时在网络上算是很先进了,毕竟当时能用网络看视频的人不多。
随着RealPlayer 8推出的视频格式,是现在主流的网络视频编码之一。编码速度较慢,质量也只能算一般。
RealNetworks开发的新一代编码,质量进步了很多,特别是在底码率下,而且编码速度很快,做到了速与质的很好统一。
在RealVideo 9基础上加入了一些参数,如EHQ等,更加精确控制码率,和RealVideo 9兼容。
早期的音频编码,但是在现在看来,仍然质量不错,可惜最高码率96kbps。应用到了两代音频编码中:RealAudio G2、RealAudio 8。
- RealAudio Cook Multichannel
Cook的改进版本,增加了5.1声道的支持,应用到了RealAudio 10 Multichannel中。
采用了Sipro语音编码技术,主要针对语音编码,应用在更早期的RealAudio 4.0、RealAudio 5.0中。
Sony公司开发的ATRAC3编码,被RealNetworks公司购买过来应用到了RealAudio 8中,以弥补Cook高码率上的不足。
AAC音频编码,用于RealAudio 10中。
aacPlus音频编码,用于RealAudio 10中,不过并没有随RealProducer发行,需要单独购买。
无损音频编码。
QuickTime系列
QuickTime并不是一个编码,而是一个多媒体平台,它的上面有众多编码,这里只介绍几个主流的编码器。
Sorenson Media公司开发的编码器,主要用于QuickTime 4的视频编码,质量较差。
Sorenson Media公司随QuickTime 5发布的编码器,质量很不错,已经成为QuickTime的标准视频编码,网络上大部分电影预告片都采用这种编码。
Apple公司自己开发的MPEG-4编码器,随QuickTime 6发布,质量很差。
Apple公司自己开发的H.264编码器,随QuickTime 7发布,支持HDTV。
QDesign公司开发的音频编码器,这个版本现在已经开不到它的身影了。
QDesign Music的第二个版本,也是最后一个版本,在时下这些先进的音频编码面前,它已经没有生命力了,主要应用于网上的电影预告片。
Qualcomm