多媒体技术 多媒体数据压缩编码技术

上传人:mby****80 文档编号:240607901 上传时间:2024-04-24 格式:PPT 页数:47 大小:955.01KB
收藏 版权申诉 举报 下载
多媒体技术 多媒体数据压缩编码技术_第1页
第1页 / 共47页
多媒体技术 多媒体数据压缩编码技术_第2页
第2页 / 共47页
多媒体技术 多媒体数据压缩编码技术_第3页
第3页 / 共47页
资源描述:

《多媒体技术 多媒体数据压缩编码技术》由会员分享,可在线阅读,更多相关《多媒体技术 多媒体数据压缩编码技术(47页珍藏版)》请在装配图网上搜索。

1、第四章、多媒体数据压缩编码技术第四章、多媒体数据压缩编码技术本章要点本章要点(1)多媒体数据压缩编码的重要性和分类。(2)量化的基本原理和量化器的设计思想。(3)常用压缩编码算法的基本原理及实现技术、预测编码、变换编码、统计编码(Huffman编码、算术编码)。(4)静态图像压缩编码的国际标准(JPEG)原理、实现技术,以及动态图像压缩编码国际标准(MPRG)的基本原理。4.1 多媒体数据压缩编码的多媒体数据压缩编码的重要性和分类重要性和分类4.1.1 多媒体数据压缩编码的重要性4.1.2 多媒体数据压缩的可能性4.1.3 多媒体数据压缩方法的分类4.1.1 数据压缩编码的重要性数据压缩编码的

2、重要性 21世纪的人类社会将是信息化社会,数字化后的信息具有数据海量性。从目前的应用状况来看,数据压缩技术是多媒体技术中最重要的关键技术之一。多媒体技术应用和发展,得益于多媒体数据压缩技术的突破性进展。从如下两方面说明数据压缩的重要性:(1)声音(2)图像(静态图像和动态视频)数据压缩的重要性数据压缩的重要性声音具有CD音乐激光唱盘音质波形声音的典型参数:采样频率44.1KHz 量化位数:16位 立体声声道数:2 数据量:约0.17MB/秒 注:数据量(采样频率量化位数声道数)/8 根据上面公式可以计算出以上数据量所需的存取时间:在650MB的光盘中存放时间约1小时。数据压缩的重要性数据压缩的

3、重要性(2)图像静态图像:一幅中等分辨率的位图图像(640480,256色),典型参数为:a.图像分辨率:640480b.图像颜色数:256(=28)c.颜色深度(位):8d.数据量为:约0.3MB 注:数据量(垂直分辨率水平分辨率颜色深度)/8对于以上数据量,在1.44MB的软盘中能存放约5幅静态图像。若用速率(2400bps)的电话线传输,一幅静态图像约需要传送17分钟。动态视频:一幅中等分辨率24位真彩色的位图图像(640480,24位/像素),典型参数为:a.图像分辨率:640480b.图像颜色数:16,777,216(=224)c.颜色深度(位):24d.数据量为:约0.9MB 对于

4、以上数据量,若用NTSC制式(30帧/秒)播放动态视频,需要约27MB/秒的视频传输速度,在650MB的光盘中存放时间约24秒。综上所述:在不经过数据压缩情况下,CD唱机和CD视频播放机根本无法达到实用目的。目前一张650MB的CD激光唱盘可以连续播放约2小时的立体声音乐,而一张650MB的CD激光视盘可以连续播放约75分钟的视频电影。说明压缩的余地相当大。同样,传输中也存在同样的困难。网络带宽受限。信息量与数据量的关系信息量与数据量的关系 I=D-dunI 信息量nD数据量ndu冗余量压缩冗余压缩冗余 例如1988年Barnsley采用分形(Fractor)的迭代函数系统IFS和递归迭代函数

5、系统RIFS方法,对几幅图像进行压缩编码,获得了高达10000:1的压缩比。以压缩形式存储和传输信息,既节省了空间,又提高了通信干线的传输率,同时也便于计算机实时处理视频和音频,高质量播放视频和音频节目成为可能。冗余举例冗余举例1.冗余在平时说话时是大量存在的。2.中文广播员一分钟读180个汉字,一个汉字两个字节,360个Byte。采样1分钟,8K 60=480 K Byte/分 480 K byte/360 byte=1000倍的冗余3.中文百科全书扫描进入计算机冗余更大。200万字X2=40000004MByte B5扫描(185X255 300dpi)一页为6.61M Byte 200万

6、字1000页为6.61G4.图像信息、视频信息的冗余就更大了。4.1.2 多媒体数据压缩的可能性多媒体数据压缩的可能性 信息之所以能进行压缩,是因为信息本身通常存在很大的冗余量。1.空间冗余 例:图像中的“A”是一个规则物体。光的亮度、饱和度及颜色都一样,因此,数据A有很大的冗余。A2.时间冗余时间冗余例:序列图像。AF2AF13.结构冗余结构冗余 图像有非常强的纹理结构,图像的象素值存在着明显的分布模式。4.知识冗余知识冗余图像的理解与某些基础知识有关。例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上 知识冗余是模型编码主要利用的特性。5.视觉冗余视觉冗余 人的视觉系

7、统对图像场的敏感性是非均匀、非线性的。(1)对图像亮度和色差的敏感性相差很大 Y:U:V8:4:4 或者Y:U:V8:2:2(2)随着亮度增加,视觉系统对量化误差的敏感 度降低。(3)人的视觉系统把图像边缘和非边缘区域分开 处理。6.图像区域的相同性冗余图像区域的相同性冗余 图像区域的相同性冗余是指在图像中的两个或多个区域对应的所有象素值相同或相近。那么只记录一个区域中各象素的颜色值,其他相同或相近区域就不需再记录了。7.信息熵冗余信息熵冗余信息量:指从N个相等的可能事件中选出一个事 件所需要的信息度量和含量。信息熵:指一团数据所带的信息量,平均信息量就是信息熵(entropy)。例如:从64

8、个数中选出某一个数。可先问“是否大于32?”消除半数的可能,这样只要6次就可选出某数。如果要选择的数是35,则过程如下:1.大于/小于 32?大2.大于/小于 32+16=48?小3.大于/小于 48-8=40?小4.大于/小于 40-4=36?小5.大于/小于 36-2=34?大6.大于/小于 34+1=35 等如果要选择的数是如果要选择的数是63,63,则其过程如下则其过程如下:1.1.大于大于/小于小于 3232?大大2.2.大于大于/小于小于 32+16=4832+16=48?大大3.3.大于大于/小于小于 48+8=5648+8=56?大大4.4.大于大于/小于小于 56+4=605

9、6+4=60?大大5.5.大于大于/小于小于 60+2=6260+2=62?大大6.6.大于大于/小于小于 62+1=6362+1=63 等等 这是因为每提问一次都会得到1比特的信息量。因此,在64个数中选定某一数所需的信息量是 log264=6(bits)信息量:信息量:指从指从N N个相等的可能事件中选出一个个相等的可能事件中选出一个事件所需要的信息度量和含量。事件所需要的信息度量和含量。设从设从N N个数中选任意一个数个数中选任意一个数X X的概率为的概率为 P(x)P(x),假定选定任意一个数的概率都相等,假定选定任意一个数的概率都相等,P(x)=1/NP(x)=1/N,因此定义信息量

10、因此定义信息量 I(x)=log2N =-log2(1/N)=-log2P(x)=IP(x)信息量:信息量:指从指从N N个相等个相等的可能事件中选出一个的可能事件中选出一个事件所需要的信息度量事件所需要的信息度量和含量。和含量。信息熵:指一团数据所带的信息量,平均信息熵:指一团数据所带的信息量,平均信息量就是信息熵(信息量就是信息熵(entropyentropy)。)。如果将信源所有可能事件的信息量如果将信源所有可能事件的信息量进行平均,就得到了信息熵进行平均,就得到了信息熵(entropy)entropy)。熵就是平均信息量。熵就是平均信息量。4.1.3 多媒体数据压缩方法的分类按压缩方法

11、分:(1)有失真压缩 (2)无失真压缩1、数据压缩方法分类、数据压缩方法分类 一般说来,数据可分为两大类,一类是将模拟信号数字化后得来的多媒体数据,另一类是与文字和字符有关的文本数据,两类数据所采用的数据压缩方法相应不同。文本数据压缩和多媒体数据压缩在算法上的区别主要表现在两个方面:其一,是否允许有误差;其二,算法有没有高级模型可以利用。从信息论的角度,根据数据压缩的基本原理,数据压缩方法可分成如下两类:(1).无损压缩法 (2).有损压缩法(1)无损压缩法)无损压缩法 无损压缩法无损压缩法也称冗余压缩法冗余压缩法。当信源编码的熵大于实际熵时,通过编码,消除冗余熵,达到数据压缩目的。因为这类方

12、法在编码时仅消除冗余熵,而没有损失有用信息,解压时这些冗余可以重新插入到数据中,保证解压后能无失真地恢复数据,可实现无损压缩,压缩过程可逆。压缩比2:1至5:1。典型的冗余压缩法(即无损压缩法)有如下种:a.哈夫曼(Huffman)编码b.香农-弗诺(Shannon-Fano)编码c.算术编码d.游程(Run-Length)编码,又称行程编码 以上编码均可归类为统计编码,其编码原理是基于信源符号之间存在分布不等概性。(2)有损压缩法)有损压缩法 有损压缩法有损压缩法也称熵压缩法熵压缩法。这类方法在允许一定程度失真的前提下进行压缩编码,通过压缩少量有用的熵,达到增大压缩比的目的。从而造成部分有用

13、信息的损失,解压时无法完全恢复原有数据,是有损压缩,压缩过程不可逆。压缩比10:1(静态)至200:1(动态)。2、数据压缩编码方法、数据压缩编码方法(1)预测编码)预测编码 根据离散信号之间存在一定关联性的特点,利用前面一个或多个信号对下一个信号进行预测。其中典型的压缩算法有DPCM、ADPCM等,它们较适合于音频数据的压缩。下面分别介绍如下。a.DPCM(差分脉码调制)DPCM系统由压缩、解压缩两部分组成。压缩时,原始的模拟信号先经过时间采样,然后对每一样值都进行量化,作为数据信号传输。解压缩时,将预测值与存储的已量化的差值相加,产生近似的原始信号,基本恢复原始数据。DPCM系统框图如下图

14、所示。DPCM系统框图(1)预测编码(续)预测编码(续)b.ADPCM(自适应差分脉码调制)采用自适应差分脉码调制技术可以减少倾斜过载产生的误差。实现自适应差分脉码调制最常用的方法是根据信号分布不均匀的特点,自适应地改变量化器输出动态范围及量化器判决电平(量化器步长)。若想利用差分脉码调制或自适应脉码调制达到2:1以上的压缩比时,倾斜过载或边缘量化现象会显得非常突出,这是一个致命的弱点。(2)变换编码)变换编码 变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种信号(空间),然后再对变换后的信号进行编码。变换编码系统中压缩数据有三个步骤:变换、变换域采样和量化。变换本身并不进

15、行数据压缩,它只把信号映射到另一个域,使得信号在变换域时容易进行压缩。变换编码系统组成如下图所示。变换编码系统框图(3)统计编码)统计编码 统计编码是根据消息出现概率的分布特性而进行的压缩编码。这种编码的宗旨在于,在消息和码字之间找到明确的一一对应关系,以便于在恢复时能准确无误地再现出来,或者至少是极相似地找到相当的对应关系,并把这种失真或不对应概率限制到可容忍的范围内。最常用的统计编码是Huffman编码,是对出现频率大的符号用较少的位数来表示,而对出现频率小的符号用较多的位数来表示。(4)混合编码)混合编码 混合编码指的是对信源数据同时使用两种或两种以上编码方法进行组合的编码方法,可根据多

16、媒体数据源中各类数据的不同特点,综合运用多种编码方法进行数据压缩,取长补短,使综合效果达到最佳,大大提高数据压缩的效率。4.2 量化4.2.1 量化原理量化原理4.2.2 标量量化器的设计标量量化器的设计4.2.3 矢量量化矢量量化4.2.1 量化原理量化原理 量化处理是使数据比特率下降的一个强有力的措施。量化处理总是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处理中有信息丢失。数据压缩编码中的量化处理,不是指A/D变换后的量化,而是指经正交变换、差分、或预测处理后,熵编码之前,对正交变换系数、差值或预测误差的量化处理。4.2.2 标量量化器的设计标

17、量量化器的设计 量化器的设计要求通常设计量化器有下述两种情况:1.给定量化分层级数,满足量化误差最小。2.限定量化误差,确定分层级数,满足以尽 量小的平均比特数,表示量化输出。量化方法有标量量化和矢量量化之分,标量量化又可分为,均匀量化、非均匀量化和自适应量化。(1)均匀量化 如果量化值是均匀分布的,我们称之为均匀量化。设为量化阶距,量化器的最大范围是Xmax,则:D=22XBmax 对于小于D+)21(i,而大于D-)21(i的样值,均规定为相同的量化值 Di。抽样值)(nTx与未量化样值)(nTx的关系是:)()()(nenTxnT+=)(ne是量化误差(量化噪声)x步长为八阶的均匀量化器

18、步长为八阶的均匀量化器(2)非均匀量化)非均匀量化 均匀量化的优点是简单,而今天非均匀量化器也很容易实现了,许多信号和参数都更适合用非均匀量化器处理。一种常见的非均匀量化器的特性如下图所示,当输入在b1 b2范围内量化步长大;当输入在0 b1,b2 255范围内量化步长小。通过选择不同的步长使某种输入的量化误差函数达到最小值。非均匀量化特性曲线(3)自适应量化)自适应量化 要减少过载,又要保证低幅值的量化性能好,有一种方法就是适应量化器步长,或适应动态范围,迄今所讨论过的所有量化器特性都是规范化的,所以,其步长点和输出阶都可以用参数来进行放大或缩小。自适应量化是提高预测编码器效果的一种有效方法

19、。4.2.3 矢量量化矢量量化 矢量量化编码是近年来图像、语音信号编码技术中颇为流行的一种新型量化编码方法。矢量量化编码方法一般是有失真编码方法。矢量量化的名字是相对于标量量化而提出的。对于PCM数据,一个数一个数地进行量化叫标量量化。若对这些数据分组,每组K个数构成一个K维矢量,然后以矢量为单元,逐个矢量进行量化,称矢量量化。矢量量化编码过程就是从码本c中搜索个与输入矢量最接近的码字的过程。在码本中寻找到与输入矢量完全一致的码字的概率很小,但只要二者之间误差最小时,便可用该码字代表输入矢量。传输时并不传送码字本身,只传送其下标号。当码本长度为N,为传送下标所需要的比特效为log2N。矢量量化的关键问题是设计一个良好的码本。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!