3.互联网中的多媒体(1)常见的音频文件格式
常见的音频格式通常分为MIDI文件和声音文件两大类。其中,MIDI文件是一种音乐演奏指令的序列,就像乐谱一样,可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含具体声音数据,所以文件较小。而声音文件则是通过录音设备录制的原始声音,直接记录了真实声音的二进制采样数据,文件较大。
① MIDI格式(.mid)
MIDI是乐器数字接口的英文缩写,是数字音乐/电子合成乐器国际标准。MIDI规范是1983年制定的,目的是解决各种电子乐器间存在的兼容性问题。MIDI规范不仅定义了计算机音乐程序、音乐合成器及其电子音乐设备交换音乐信号的方式,而且还规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可用于各种乐器创建数字声音,能很容易地模拟钢琴、小提琴等传统乐器的声音。MIDI本身并不能发出声音,它是一个协议,只包含用于产生特定声音的指令,而这些指令则包括调用何种MIDI设备的声音、声音的强弱及持续的时间等。计算机把这些指令交由声卡去合成相应的声音。最初,因为不同MIDI设备的乐器音色排列方法不一,所以造成同一MIDI文件在不同的设备会出现完全不同的放声效果。为避免出现这种混乱情况,GM(General MIDI)标准被提出并得到了Windows操作系统的支持,得到了相当广泛的应用。它规定了前128中常用乐器的音色编排方式,例如1号是钢琴,66号是萨克斯管等,它实际上是对MIDI规范的补充。ROLAND公司又提出了GS标准,它在兼容GM的基础上对其进行了发展,增强了音乐的表现力。它提供比GM标准数量更多的打击乐器组合、更多的特殊音响。GS标准具有广泛的软硬件适应性,包括声卡、音乐爱好者的娱乐乐器到专业音乐器材等。后来,YAMAHA公司又提出了基于GM标准的XG标准,它相对于保存真实采样数据的声音文件、MIDI文件显得更加紧凑,其文件的大小要比WAV文件小得多,一分钟的WAV文件约要占用10MB的硬盘空间,而一分钟的MIDI文件却只有3.4KB。现在,MIDI已经成为计算机音乐的代名词。
计算机播放MIDI文件时,有两种方法合成声音:FM合成和波表合成。FM合成是通过多个频率的声音混合来模拟乐器的声音,波表合成是将乐器的声音样本存储在声卡波形表中,播放时从波形表中取出来,产生声音。采用波表合成技术,可以产生更逼真的声音。MIDI文件有几个变通的格式,其中CMF文件是随声卡一起使用的音乐文件,与MIDI文件非常相似,只是文件头略有差别;另一种MIDI文件是Windows使用的RIFF文件的一种子格式,称为RMID,扩展名为RMI。
② WAVE格式(.wav)
它是由Microsoft公司开发的一种WAV声音文件格式,是如今计算机上最为常见的声音文件,符合RIFF文件规范,用于保存Windows平台的音频信息资源,被Windows平台应用程序所广泛支持,WAVE格式支持MSADPCM、CCIPTALAW、CCIPT-LAW和其他压缩算法,支持多种音频位数、采样频率和声道,但其缺点是文件体积较大,所以不适合长时间记录。
③ MP1/MP2/MP3
MPEG是动态图像专家组的英文缩写。这个专家组始建于1988年,专门负责为CD建立视频和音频压缩标准。MPEG音频文件指的是MPEG标准中的声音部分,即MPEG音频层。MPEG音频文件根据压缩质量和编码复杂程度的不同可分为3层(MPEG Audio Layer 1/2/3),分别与MP1、MP2和MP3这三种声音文件相对应。MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4:1和6:1~8:1,而MP3的压缩率则高达10:1~12:1,也就是说一分钟CD音质的音乐未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。因此,目前Internet上的音乐格式以MP3最为常见。MP3为降低声音失真采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比。
④ MP4
MP3问世不久,就凭着较高的压缩比12:1和较好的音质创造了一个全新的音乐领域,然而MP3的开放性却最终不可避免地导致了版权之争,在这样的背景之下,文件更小、音质更佳,同时还能有效保护版权的MP4就应运而生了。MP3和MP4之间其实并没有必然的联系,首先MP3是一种音频压缩的国际技术标准,而MP4却是一个商标的名称,其次,它采用的音频压缩技术也迥然不同,MP4采用的是美国电话电报公司所研发的,采用“知觉编码”的A2B音乐压缩技术,压缩比成功地提高到15:1,最高可达到20:1,且不影响音乐的实际听感,同时MP4在加密和授权方面也做了特别设计,它有如下特点。
• 每首MP4乐曲就是一个扩展名为“.exe”的可执行文件。在Windows中直接双击就可以播放,十分方便。但MP4的这个特点也带来了它的先天缺陷——容易感染病毒。
• 更小的体积,更好的音质。由于采用先进的A2B音频压缩技术,使MP4文件的大小仅为MP3的3/4左右,从这个角度来看,MP4更适合在Internet上传播,而且音质也更胜一筹。
• 独特的数字水印。MP4采用了名为SOLANA的数字水印技术。可方便地追踪和发现盗版行为。而且,任何针对MP4的非法解压行为都可能导致MP4源文件的损毁。
• 支持版权保护。MP4乐曲还内置了包括与作品版权持有者相关的文字、图像等版权说明,既可说明版权,又表示了对作者和演唱者的尊重。
• 比较完善的功能。MP4可独立调节左右声道音量,内置的波形/分频动态音频显示和音乐管理器可支持多种彩色图像、网站连接及无限制地滚动显示文本。
⑤ VQF
VQF即TWINVQ,是由NTT与YAMAHA共同开发的一种音频压缩技术。VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到18:1左右,甚至更高。也就是说,把一首4分钟的歌曲压成MP3大约需要4MB左右的硬盘空间,而同一首歌曲如果使用VQF音频压缩技术,只需要2MB左右的硬盘空间。因此在音频压缩率方面,MP3和RA都不是VQF的对手。如此之高的压缩率是否会影响音质呢?实际聆听的结果告诉我们:不会。当VQF以44kHz、96KBps的频率压缩时,其音质几乎等于44kHz、256KBps的MP3。经VQF压缩后的音频文件在回放效果试听时,几乎没有人能听出它与原音频文件的差异。
⑥ AIF/AIFF
AIFF是音频交换文件格式的英文缩写。是APPLE公司开发的一种音频文件格式,被Macintosh平台及其应用程序所支持,Netscape浏览器的LIVEAUDIO也支持AIFF格式,SGI及其他专业音频软件包也同样支持AIFF格式。AIFF支持ACE2、ACE8、MAC3和MAC6压缩,支持16位44.1kHz立体声。
⑦ AU
AU文件是SUN公司推出的一种数字音频格式。AU文件原先是UNIX操作系统下的数字声音文件。由于早期Internet上的Web服务器主要是基于UNIX的,所以,AU格式的文件在如今的Internet中也是常用的声音文件格式,Netscape浏览器中的LIVEAUDIO也支持AU格式的声音文件。
⑧ VOC
VOC文件是新加坡著名的多媒体公司Creative Labs开发的声音文件格式,多用于保存CREATIVE SOUND BLASTER系列声卡所采集的声音数据,被Windows平台和DOS平台所支持,它支持CCITTA LAW和CCITT u LAW等压缩算法。在DOS程序和游戏中常会遇到这种文件,是随声卡一起产生的数字声音文件,与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。
⑨ RA/RM/RAM
REALAUDIO文件是Real Networks公司开发的一种新型音频流文件格式,它包含在Real Networks公司所定制的音频、视频压缩规范——REALMEDIA中,主要用于在低速率的广域网上实时传输音频信息。网络连接速率不同,客户端所获得的声音质量也不尽相同:对于14.4KBps的网络连接,可获得调幅(AM)质量的音质;对于28.8KBps的连接,可以达到广播级的声音质量,如果使用ISDN或ADSL等更快的线路连接,则可获得CD音质的声音。
⑩ MOD/S3M/XM/MTM/FAR/KAR/IT
模板格式文件。它同时具有MIDI与数字音频的共同特性——既包括如何演奏乐曲的指令,又保存了数字声音信号的采样数据。因此,其声音回放质量对音频硬件的依赖性较小,也就是说在不同的机器上可以获得基本相似的声音回放质量。模块文件根据不同的编码有MOD、S3M、XM、MTM、FAR、KAR、IT等多种格式。
这么多格式的音乐文件其实都是通过声卡合成输出的。最为常见的声卡合成手段有两种:FM合成和波表合成。其中,FM合成方式多见于早期的ISA声卡,是运用使声音振 荡的原理对MIDI进行合成处理,效果较差。想要听到真正悦耳动听的音乐,就使用波表合成。
(2)常见的图像文件格式
计算机中的图像文件格式大致可以分为两大类。基于像素的格式是描述图像的,这些图像由像素(Pixel)组成,例如用Photoshop存储的文件格式就是Pixel-Based的。另外一种是基于文本的格式,主要描述版面设计文件,例如用Illustrator、Freehand、PageMaker等软件所做的文件,是以PostScript语言描述文件的。
下面分别介绍几种常见的图像文件格式的特性。
① BMP格式
BMP是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,能够被多种Windows应用程序支持。随着Windows操作系统的流行与丰富的Windows应用程序的开发,BMP位图格式理所当然地被广泛应用。这种格式的特点是包含的图像信息较丰富,几乎不进行压缩,但由此导致了它与生俱来的缺点——占用磁盘空间过大。所以,目前BMP在单机上比较流行。
② GIF格式
GIF是英文Graphics Interchange Format(图形交换格式)的缩写。顾名思义,这种格式是用来交换图片的。事实上也是如此,20世纪80年代,美国一家著名的在线信息服务机构CompuServe针对当时网络传输带宽的限制,开发出了这种GIF图像格式。
GIF格式的特点是压缩比高,磁盘空间占用较少,所以这种图像格式迅速得到了广泛的应用。最初的GIF只是简单地用来存储单幅静止图像(称为GIF87a),后来随着技术发展,可以同时存储若干幅静止图像进而形成连续的动画,使之成为当时支持二维动画为数不多的格式之一(称为GIF89a),而在GIF89a图像中可指定透明区域,使图像具有非同一般的显示效果,这更使GIF风光十足。目前Internet上大量采用的彩色动画文件多为这种格式的文件,也称为GIF89a格式文件。
此外,考虑到网络传输中的实际情况,GIF图像格式还增加了渐显方式,也就是说,在图像传输过程中,用户可以先看到图像的大致轮廓,然后随着传输过程的继续而逐步看清图像中的细节部分,从而适应了用户的“从朦胧到清楚”的观赏心理。目前Internet上大量采用的彩色动画文件多为这种格式的文件。
但GIF有个小小的缺点,即不能存储超过256色的图像。尽管如此,这种格式仍在网络上广泛应用,这和GIF图像文件短小、下载速度快、可用许多具有同样大小的图像文件组成动画等优势是分不开的。
③ JPEG格式
JPEG也是常见的一种图像格式,它由联合照片专家组(Joint Photographic Experts Group)开发并命名为“ISO10918-1”,JPEG仅仅是一种俗称而已。
JPEG文件的扩展名为“.jpg”或“.jpeg”,其压缩技术十分先进,它用有损压缩方式去除冗余的图像和彩色数据,获取极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像质量。
同时JPEG还是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对这种文件压缩,比如最高可以把1.37MB的BMP位图文件压缩至20.3KB。当然我们完全可以在图像质量和文件尺寸之间找到平衡点。
由于JPEG优异的品质和杰出的表现,使它的应用也非常广泛,特别是在网络和光盘读物上。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件较小、下载速度快,使得Web页有可能以较短的下载时间提供大量美观的图像,JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。
④ TIFF格式
TIFF(Tag Image File Format)是Mac中广泛使用的图像格式,它由Aldus和微软联合开发,最初是出于跨平台存储扫描图像的需要而设计的。它的特点是图像格式复杂、存储信息多。正因为它存储图像的细微层次的信息非常多,图像的质量得以提高,故而非常有利于原稿的复制。
该格式有压缩和非压缩两种形式,其中压缩可采用LZW无损压缩方案存储。不过,由于TIFF格式结构较为复杂,兼容性较差,因此有时软件可能不能正确识别TIFF文件(现在绝大部分软件都已解决了这个问题)。目前在Mac和PC上移植TIFF文件也十分便捷,因而TIFF现在也是微机上使用最广泛的图像文件格式之一。
⑤ PSD格式
这是著名的Adobe公司的图像处理软件Photoshop的专用格式Photoshop Document(PSD)。PSD其实是Photoshop进行平面设计的一张“草稿图”,它包含有各种图层、通道、遮罩等多种设计的样稿,以便于下次打开文件时可以修改上一次的设计。在Photoshop所支持的各种图像格式中,PSD的存取速度比其他格式快很多,功能也很强大。由于Photoshop越来越被广泛地应用,所以我们有理由相信,这种格式也会逐步流行起来。
⑥ PNG格式
PNG(Portable Network Graphics)是一种新兴的网络图像格式。在1994年年底,由于Unysis公司宣布GIF拥有专利的压缩方法,要求开发GIF软件的作者须交一定费用,由此促使免费的PNG图像格式的诞生。PNG一开始便结合GIF及JPG两家之长,打算一举取代这两种格式。1996年10月1日由PNG向国际网络联盟提出并得到推荐认可,并且大部分绘图软件和浏览器开始支持PNG图像浏览,从此PNG图像格式发展起来。
PNG是目前保证最不失真的格式,它汲取了GIF和JPG二者的优点,存储形式丰富,兼有GIF和JPG的色彩模式;它的另一个特点能把图像文件压缩到极限以利于网络传输,但又能保留所有与图像品质有关的信息,因为PNG采用无损压缩方式来减少文件的大小,这一点与牺牲图像品质以换取高压缩率的JPG有所不同;它的第三个特点是显示速度很快,只需下载1/64的图像信息就可以显示出低分辨率的预览图像;第四,PNG同样支持透明图像的制作,透明图像在制作网页图像的时候很有用,可以把图像背景设为透明,用网页本身的颜色信息来代替设为透明的色彩,这样可让图像和网页背景很和谐地融合在一起。
PNG的缺点是不支持动画应用效果,如果在这方面能有所加强,简直就可以完全替代GIF和JPEG了。Macromedia公司的Fireworks软件的默认格式就是PNG。现在,越来越多的软件开始支持这一格式,而且在网络上也越来越流行。
⑦ SWF格式
利用Flash可以制作出一种后缀名为SWF(Shock Wave Format)的动画,这种格式的动画图像能够用比较小的体积来表现丰富的多媒体形式。在图像的传输方面,不必等到文件全部下载才能观看,而是可以边下载边看,因此特别适合网络传输,特别是在传输速率不佳的情况下,也能取得较好的效果。事实也证明了这一点,SWF如今已被大量应用于Web网页进行多媒体演示与交互性设计。此外,SWF动画是基于矢量技术制作的,因此不管将画面放大多少倍,画面不会因此而有任何损害。综上所述,SWF格式作品以其高清晰度的画质和小巧的体积,受到了越来越多网页设计者的青睐,也越来越成为网页动画和网页图片设计制作的主流,目前已成为网上动画的事实标准。
⑧ SVG格式
SVG可以算是目前最火热的图像文件格式了,它的英文全称为Scalable Vector Graphics,意思为可缩放的矢量图形。它是基于XML(eXtensible Markup Language)由World Wide Web Consortium(W3C)联盟进行开发的。严格来说应该是一种开放标准的矢量图形语言,可设计激动人心的、高分辨率的Web图形页面。用户可以直接用代码来描绘图像,可以用任何文字处理工具打开SVG图像,通过改变部分代码来使图像具有交互功能,并可以随时插入到HTML中通过浏览器来观看。
它提供了目前网络流行格式GIF和JPEG无法具备的优势:可以任意放大图形显示,但绝不会以牺牲图像质量为代价;字在SVG图像中保留可编辑和可搜寻的状态;平均来讲,SVG文件比JPEG和GIF格式的文件要小很多,因而下载也很快。可以相信,SVG的开发将会为Web提供新的图像标准。
(3)常见的视频文件格式
视频文件主要指那些包含了实时的音频、视频信息的多媒体文件,其多媒体信息通常来源于视频输入设备,由于同时包含了大量的音频、视频信息,影像文件往往相当庞大。常见的视频文件格式包括以下几种。
① AVI格式
它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft公司推出,随Windows 3.1一起被人们所认识和熟知。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放,或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。
② nAVI格式
nAVI是newAVI的缩写,是一个名为Shadow Realm的组织发展起来的一种新视频格式(与我们上面所说的AVI格式没有太大联系)。它是由Microsoft ASF压缩算法修改而来的,但是又与下面介绍的网络影像视频中的ASF视频格式有所区别,它以牺牲原有ASF视频文件的视频“流”特性为代价而通过增加帧率来大幅提高ASF视频文件的清晰度。
③ MPEG格式
它的英文全称为Moving Picture Expert Group,即运动图像专家组格式,VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩方法减少运动图像中的冗余信息,说得更加明白一点就是MPEG压缩方法的依据是相邻两幅画面绝大多数是相同的,把后续图像中与前面图像有冗余的部分去除,从而达到压缩的目的(其最大压缩比可达到200:1)。目前MPEG格式有3个压缩标准,分别是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7与MPEG-21仍处在研发阶段。
MPEG-1:制定于1992年,它是针对1.5Mb/s以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准,也就是我们通常所见到的VCD制作格式。使用MPEG-1的压缩算法,可以把一部120分钟长的电影压缩到1.2GB左右大小。这种视频格式的文件扩展名包括“.mpg”、“.mlv”、“.mpe”、“.mpeg”及VCD光盘中的“.dat”文件等。
MPEG-2:制定于1994年,设计目标为高级工业标准的图像质量以及更高的传输率。这种格式主要应用在DVD/SVCD的制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当的应用。使用MPEG-2的压缩算法,可以把一部120分钟长的电影压缩到4GB~8GB的大小。这种视频格式的文件扩展名包括“.mpg”、“.mpe”、“.mpeg”、“.m2v”及DVD光盘上的“.vob”文件等。
MPEG-4:制定于1998年,MPEG-4是为播放流式媒体的高质量视频而专门设计的,它可利用很窄的带宽,通过帧重建技术压缩和传输数据,以求使用最少的数据获得最佳的图像质量。目前MPEG-4最有吸引力的地方在于它能够保存接近DVD画质的小体积视频文件。另外,这种文件格式还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。这种视频格式的文件扩展名包括“.asf”、“.mov”和DivX AVI等。
④ DivX格式
这是由MPEG-4衍生出的另一种视频编码(压缩)标准,也即我们通常所说的DVDrip格式,它采用了MPEG-4的压缩算法,同时综合了MPEG-4与MP3两方面的技术,简单地说,DivX格式就是使用DivX压缩技术对DVD盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩,然后再将视频与音频合成并加上相应的外挂字幕文件而形成的视频格式。其画质直逼DVD并且体积只有DVD的几分之一。这种编码对机器的要求也不高,所以DivX视频编码技术可以说是一种对DVD造成威胁最大的新生视频压缩格式,号称DVD杀手或DVD终结者。
⑤ MOV格式
QuickTime(MOV)是Apple公司开发的一种音频、视频文件格式,用于保存音频和视频信息,具有先进的视频和音频功能,被包括Apple Mac OS、Microsoft Windows 95/98/NT在内的所有主流平台支持。QuickTime文件格式支持25位彩色,支持RLE、JPEG等领先的集成压缩技术,提供150多种视频效果,并配有提供了200多种MIDI兼容音响和设备的声音装置。新版的QuickTime进一步扩展了原有功能,包含了基于Internet应用的关键特性,能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,此外,QuickTime还采用了一种称为QuickTime VR(简作QTVR)技术的虚拟现实(Virtual Reality,VR)技术,用户通过鼠标或键盘的交互式控制,可以观察某一地点周围360°的景象,或者从空间任何角度观察某一物体。QuickTime以其领先的多媒体技术和跨平台特性、较小的存储空间要求、技术细节的独立性以及系统的高度开放性得到业界的广泛认可,目前已成为数字媒体软件技术领域的事实上的工业标准。国际标准化组织(ISO)最近选择QuickTime文件格式作为开发MPEG-4规范的统一数字媒体存储格式。
⑥ ASF格式
它的英文全称为Advanced Streaming Format,它是微软为了和现在的Real Player竞争而推出的一种视频格式,用户可以直接使用Windows自带的Windows Media Player对其进行播放。由于它使用了MPEG-4的压缩算法,所以压缩率和图像的质量都很不错(高压缩率有利于视频流的传输,但图像质量肯定会有损失,所以有时候ASF格式的画面质量不如VCD是正常的)。
⑦ WMV格式
它的英文全称为Windows Media Video,也是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。WMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等。
⑧ RM格式
Real Networks公司所制定的音频视频压缩规范称为Real Media,用户可以使用Real Player或RealOne Player对符合Real Media技术规范的网络音频/视频资源进行实况转播并且Real Media可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。这种格式的另一个特点是用户使用Real Player或RealOne Player播放器可以在不下载音频/视频内容的条件下实现在线播放。另外,RM作为目前主流网络视频格式,它还可以通过其Real Server服务器将其他格式的视频转换成RM视频并由Real Server服务器负责对外发布和播放。RM和ASF格式可以说各有千秋,通常RM视频更柔和一些,而ASF视频则相对清晰一些。