媒体技术概述
1.媒体
媒体:信息表示和传播的载体。例如,文字、声音、图像等都是媒体,它们向人们传递各种信息。
目前,计算机处理的信息主要是字符和图形。为了改善人与计算机之间的交互界面,集声音、文字、图形、图像于一体,就要开发多媒体技术。
在计算机领域,几种主要媒体的定义如下:
⑴  感觉媒体
感觉媒体直接作用于人的感官,使人能直接产生感觉。如,各种语言、音乐、图形、图像、文字等。
⑵  表示媒体
表示媒体是指各种编码。这是为了加工、处理和传输感觉媒体而人为地进行研究、构造出来的一类媒体。如,语音编码、文本编码、图像编码等。
⑶  表现媒体
表现媒体是感觉媒体与计算机之间的界面。如,键盘、光笔、显示器、打印机等。
⑷  存储媒体
存储媒体用于存放表示媒体,即存放感觉媒体数字化后的代码。如,软盘、硬盘、CD-ROM 等。
⑸  传输媒体
传输媒体是用来将媒体从一处传送到另一处的物理载体。如,双绞线、同轴电缆、光纤等。
2.多媒体技术
      多媒体技术是指利用计算机技术把文字、声音、图形、图像等多媒体综合一体化,使它们建立起逻辑联系,并能进行加工处理的技术。
    多媒体技术具有以下一些特征:
⑴  集成性与多样性
    多媒体技术的集成性是指将多种媒体有机地组织在一起,共同表达一个完整的多媒体信息,使声、文、图、像一体化。
⑵  交互性
    交互性是指人和计算机能进行交互式对话,便于进行人工干预控制。交互性是多媒体技术的关键特征。
⑶  数字化
数字化是指多媒体中的各个单媒体都是以数字形式存放在计算机中。
⑷  实时性
      多媒体技术是多种媒体集成的技术,在这些媒体中,有些媒体(如声音和图像)是与时间密切相关的,这就决定了多媒体技术要支持实时处理。多媒体技术是基于计算机技术的综合技术,包括数字信号处理技术、音频和视频技术、计算机硬件和软件技术、人工智能和模式识别技术、通信和图像技术等。是一门跨学科的综合性高新技术
3.多媒体计算机的平台标准
多媒体计算机(MPC)是指能综合处理多媒体信息,使多种媒体信息建立联系,并具有交互性的计算机系统。
多媒体计算机系统一般由多媒体计算机硬件系统和多媒体计算机软件系统组成。
多媒体计算机硬件系统
⑴  多媒体主机,如微机,选用高档的奔腾机以上,工作站等。
⑵  多媒体输入设备,如摄像机、录像机、录音机、麦克风、扫描仪、CD-ROM等。
⑶  多媒体输出设备,如打印机、绘图仪、音响、电视机、录音机、录像机、高分辨率显示
器等。
⑷  多媒体存储设备,如硬盘、光盘、磁带等。内存要求 16M以上。
⑸  多媒体功能卡,如视频卡、声音卡、通信卡、压缩卡等。
⑹  操纵控制设备,如鼠标器、操纵杆、键盘、触模屏等。
多媒体文件格式
多媒体技术在对各种媒体信息的处理方面主要采取转换、集成、管理和控制以及传输等方式。
1、音频技术
1)声音媒体的数字化
声音是一种连续的波,音频波(可听声)的频率在20Hz- 20kHz之间。
亚音波(次声),频率小于20Hz。
超音波(超声),频率大于20kHz。
声音信息的数字化过程是每隔一个时间间隔,在模拟声音波形上取一个幅度值(采样),并把采样点的值用数字表示(量化)。
数字音频的质量取决于采样频率、量化位数、声道数。数字音频中,采样频率越高、量化位数越多、声道数越多,声音的质量越好。但数据量出越大。
常用的标准采样频率为 44.1kHz。
常用的量化位数为16位。或24位。
声道数指所使用的声音通道的个数。对于环绕立体声,采用5.1或7.1声道。
2)音频文件分类
存储声音信息的文件格式主要有
  WAV文件:波形文件,由Microsoft公司和IBM公司制定的音频文件格式。该文件数据来源
于对模拟声音波形的采样。用不同的采样频率对模拟的声音的波形进行采样,以不同的量化位数(8位或16位)把采样点的值转换为二进制编码,形成了声音的WAV文件。WAV文件由采样数据组成,文件的大小与采样频率、量化位和声道数有关。
  MIDI文件:即数字化乐器接口(Musical Instrument Digital Interface)的缩写,是一种将电子乐器与计算机相连接的通信标准,以规定计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方法。MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令。因此所占用的存储空间比WAV文件小很多。RMI文件是Microsoft公司的MIDI文件格式。
  MP3文件:根据MPEG-1压缩标准进行压缩后的声音文件,其压缩比可达12:1。属于有损压缩。
  AIF文件:是Apple公司的音频文件格式。
  VOC文件:是Creative公司的音频文件格式,也是声霸卡(Sound Blaster)使用的音频文件格式。
3)数字音频文件的使用
Windows中的Windows Media Player 可以播放多种多媒体音频文件。
2.视频技术
图形和图像
多媒体计算机最常用的图像有图形、静态图像和动态图像(视频)。
    图形是由线条(主要是直线和弧线)组成的。图形容易用数学模型表示。在计算
机中,图形常用“矢量”表示。
      图形分为2D(二维)图形和3D(三维)图形。
      AutoCAD是著名的图形设计软件。其所使用的 .DXF 是典型的矢量化图形文件。
    在多媒体计算机中,图像(静态图像)是用点阵(像素)表示的。典型的图像如
照片和名画
      图像中的每个像素用多位表示该像素的彩。图像中的颜通常由红、绿、蓝
(RGB)三种基搭配形成的。真彩的图像的数据量极庞大。需要对数字图像进行
压缩,便于存储和传送。
常见的图像文件有:.BMP(位图文件)、.JPG.GIF.TIF 等。
    视频是一种活动影像。其播放速度为25/秒(frames/s每一帧为一幅静态图
像,“帧”是构成视频信息的基本单元。
视像的数据量比图像更大,需要对视像进行图像进行压缩。
3、视频文件分类
多媒体(1) 静态图像文件格式
图形文件一般分类两大类:位图和矢量图。
位图由像素点组成;矢量图由向量表示。
  BMP文件:位图文件,与设备无关的图像文件格式,在Windows环境下采用的基本图像格式,已成为一种通用的图像存储格式。
  JPG文件:JPEG标准格式。
  TIFF 文件:是为扫描仪和桌面出版系统开发的较为通用的图像文件格式。
(2) 动态图像文件格式
  AVI文件:在Windows中使用的格式,以帧为存储的基本单位在每一帧中,音频数据和视频数据相互交叉存储。
  MPG:MPEG标准格式。
4.数据压缩技术
多媒体信息经数字化后,其数据量非常庞大。对多媒体数据的存储和传输都要对数据进行压缩。当用到这引些信息时,才把数据解压还原。
所有的压缩系统都需要两个算法:一个是用于压缩原文件中的数据(编码),另一个用于在目的端将数据解压缩出来(解码)。
压缩/解压缩的过程可用专用的硬件或软件来实现。
1)数据压缩
根据解码后数据与原始数据是否完全一致进行分类,数据压缩方法一般划分为两类:无损压缩和有损压缩。
压缩技术的基本方式有两种:对称压缩和不对称压缩。
对称压缩中,压缩算法和解压缩算法是一样的,是一种可逆操作。对称压缩中的双方都以同一速度进行操作,如视频会议。
不对称压缩是指压缩与解压缩的运算速度不同。压缩的速度要高于解压缩速度,如VCD的制作与播放就是典型不对称压缩
2)常用的多媒体压缩算法标准
静态图像压缩标准-JPEG
JPEG 是 Joint Photograph Experts Group的缩写,这是一个在1986年CCITT(ITU)和ISO联合成立的一个图像专家组。
PEG标准是多灰度静止图像的数字压缩编码,适用于连续调彩和多灰度图像的静止图像的压缩。数码相机的照片大多采用些标准。JPEG标准属于有损压缩,其压缩比可用参数调节
运动图像压缩标准-MPEG
MPEG的全称是运动图像专家组(Moving Picture Experts Group)是专门制定多媒体领域内的国际标准的一个组织,该组织成立于1988年,由全世界大约300名多媒体技术专家组成。JPEG和MPEG都是在ISO领导下的专家小组。
MPEG标准是面向运动图像压缩的一个系列标准,主要有MPEG-1、MPEG-2、MPEG-4和正在制定的MPEG-7。
MPEG压缩属于有损压缩,采用了帧间压缩和帧内压缩结合的压缩方法