视频压缩编码的基本原理和方法上课用有删减学习教案

上传人:莉**** 文档编号:91148286 上传时间:2022-05-16 格式:PPTX 页数:58 大小:817.24KB
收藏 版权申诉 举报 下载
视频压缩编码的基本原理和方法上课用有删减学习教案_第1页
第1页 / 共58页
视频压缩编码的基本原理和方法上课用有删减学习教案_第2页
第2页 / 共58页
视频压缩编码的基本原理和方法上课用有删减学习教案_第3页
第3页 / 共58页
资源描述:

《视频压缩编码的基本原理和方法上课用有删减学习教案》由会员分享,可在线阅读,更多相关《视频压缩编码的基本原理和方法上课用有删减学习教案(58页珍藏版)》请在装配图网上搜索。

1、会计学1视频压缩编码的基本原理和方法上课视频压缩编码的基本原理和方法上课(shng k)用有删减用有删减第一页,共58页。第2页/共58页第二页,共58页。第3页/共58页第三页,共58页。第4页/共58页第四页,共58页。第5页/共58页第五页,共58页。第6页/共58页第六页,共58页。第7页/共58页第七页,共58页。第8页/共58页第八页,共58页。第9页/共58页第九页,共58页。第10页/共58页第十页,共58页。第11页/共58页第十一页,共58页。第12页/共58页第十二页,共58页。的应用。第13页/共58页第十三页,共58页。第14页/共58页第十四页,共58页。(bin

2、m)算法是一种有损压缩算法,它适用于多种视频输入格式并且应用范围很广。经过MPEG-1标准压缩后,视频数据压缩率为1/100-1/200,MPEG-1提供每秒30帧352240分辨率的图像,当使用合适的压缩技术时,具有接近家用视频制式(VHS)录像带的质量。第15页/共58页第十五页,共58页。第16页/共58页第十六页,共58页。第17页/共58页第十七页,共58页。第18页/共58页第十八页,共58页。第19页/共58页第十九页,共58页。第20页/共58页第二十页,共58页。第21页/共58页第二十一页,共58页。第22页/共58页第二十二页,共58页。第23页/共58页第二十三页,共5

3、8页。第24页/共58页第二十四页,共58页。第25页/共58页第二十五页,共58页。第26页/共58页第二十六页,共58页。第27页/共58页第二十七页,共58页。(三阶熵、N阶熵)或称为高阶熵。有高阶熵小于低阶熵第28页/共58页第二十八页,共58页。第29页/共58页第二十九页,共58页。30第30页/共58页第三十页,共58页。31第31页/共58页第三十一页,共58页。32信源符号信源符号概率概率编码过程编码过程码字码字码长码长(i)x1 x2x3x4x5x6x7x80.40 0.180.10 0.10 0.070.060.050.041 001011 0000 0100 01010

4、0010 000111 3 3444550101010.090.130.190.23 10 0.37 0.60010011上述编码的平均上述编码的平均(pngjn)(pngjn)码字长度码字长度: :R=Pii=0.40R=Pii=0.401+0.181+0.183+0.103+0.103+0.103+0.104+0.074+0.074+0.064+0.064+0.054+0.055+0.045+0.045 =2.615 =2.61第32页/共58页第三十二页,共58页。33第33页/共58页第三十三页,共58页。34第34页/共58页第三十四页,共58页。第35页/共58页第三十五页,共58

5、页。第36页/共58页第三十六页,共58页。第37页/共58页第三十七页,共58页。38 预测预测(yc)(yc)编码编码 预测编码是统计冗余数据压缩理论的三个重要分支之一,它的理论基础(jch)是现代统计学和控制论。预测编码主要是减少了数据在时间和空间上的相关性,因而对于时间序列数据有着广泛的应用价值。在数字通信系统中例如语音的分析与合成,图像的编码与解码,预测编码已得到了广泛的实际应用。 预测编码是根据某一模型利用以往的样本值对于新样本值进行预测,然后将样本的实际值与其预测值相减得到一个误差值,对于这一误差值进行编码。如果模型足够好且样本序列在时间上相关性较强,那么误差信号的幅度将远远小于

6、原始信号,从而可以用较少的位对差第38页/共58页第三十八页,共58页。39值进行编码。 帧内预测编码反映了同一(tngy)帧图像内,相邻像素点之间的空间相关性较强,因而任何一个像素点的亮度值,均可由它相邻的已被编码的像素点的编码值来进行预测。如果能够准确地预测作为时间函数的数据源的下一个输出将是什么,或者数据源可以准确地被一个数据模型表示,则可以准确地预测数据,然而,实际信号源是不可能满足这两个条件的,因此,只能用一个预测器,预测下一个样值,允许它有些误差。通常使用的误差函数是均方误差(mse): 第39页/共58页第三十九页,共58页。40 如果预测是根据某一预测模型进行的,且模型表如果预

7、测是根据某一预测模型进行的,且模型表达的足够好,则只需存储或传输某些起始像素点和模达的足够好,则只需存储或传输某些起始像素点和模型参数就可以代表整个一幅图像了。这时只要编码型参数就可以代表整个一幅图像了。这时只要编码(bin m)(bin m)很少的数据量,这当然是一种极端理想的情很少的数据量,这当然是一种极端理想的情况。但实际上预测不会百分之百准确,此时可将预测况。但实际上预测不会百分之百准确,此时可将预测的误差值的误差值( (实际值与预测值之差值实际值与预测值之差值) )存储或传输,一般存储或传输,一般来讲,实际值误差值要比实际值小得多,这样在同等来讲,实际值误差值要比实际值小得多,这样在

8、同等条件下,就可以减少数据编码条件下,就可以减少数据编码(bin m)(bin m)的比特数,从的比特数,从而也减少了存储和传输的数据量,实现了数据的压缩而也减少了存储和传输的数据量,实现了数据的压缩处理。处理。 预测编码预测编码(bin m)(bin m)方法分线性预测和非线性预测方法分线性预测和非线性预测。线性预测编码。线性预测编码(bin m)(bin m)方法也叫差值脉冲编码方法也叫差值脉冲编码(bin m)(bin m)调制,简称调制,简称DPCM. DPCM. 第40页/共58页第四十页,共58页。41 DPCM的基本原理 一幅二维静止图像,设空间坐标(i,j)像素点的实际灰度为f

9、(i,j),f (i,j)是根据以前的像素点的灰度对该点的预测灰度,实际值和预测值之间的差值,e(i,j)=f(i,j)- f(i,j) DPCM系统包括发送、接收和信道传输三个部分,发送端由编码器、量化器、预测器和加/减法器组成;接收端包括解码器和预测器等;DPCM系统结构简单,容易用硬件实现(接收端的预测器和发送端的预测器完全相同)。f(i,j)由先前(同行一点,上一行(yxng)两点)三点预测,定义为: f(i,j)=a1f(i,j-1)+a2f(i-1,j-1)+a3(i-1,j) 第41页/共58页第四十一页,共58页。42 预测器 量化器编码器解码器 预测器信道接收端输出(shch

10、)XN -XNeNXNeNeNXN+输入(shr)XN发送端+-第42页/共58页第四十二页,共58页。43第43页/共58页第四十三页,共58页。44第44页/共58页第四十四页,共58页。45 以图中所示三阶线性预测器,应用均方误差最小以图中所示三阶线性预测器,应用均方误差最小准则,求出预测系数准则,求出预测系数a1,a2,a3a1,a2,a3,以获得,以获得(hud)f(i,j)(hud)f(i,j)的最佳线性预测值的最佳线性预测值f(i,j).f(i,j). e2=Ee(i,j)2 e2=Ee(i,j)2 =Ef(i,j)-f(i,j)2 =Ef(i,j)-f(i,j)2 =Ef(i,

11、j)-a1f(i-1,j)-a2f(i-1,j-1)- =Ef(i,j)-a1f(i-1,j)-a2f(i-1,j-1)-a3f(i,j-1)2a3f(i,j-1)2 将预测值与实际值之间的均方误差将预测值与实际值之间的均方误差e2e2对对a1,a2,a3a1,a2,a3求偏导,并解方程,得到求偏导,并解方程,得到a1,a2,a3a1,a2,a3。_第45页/共58页第四十五页,共58页。第46页/共58页第四十六页,共58页。第47页/共58页第四十七页,共58页。第48页/共58页第四十八页,共58页。49n变换(binhun)编码n 其主要思想是利用图像块内像素值之间的相关性,把图像变换

12、(binhun)到一组新的基上,使得能量集中到少数几个变换(binhun)系数上,通过存储这些系数而达到压缩的目的。在变换(binhun)编码中,由于对整幅图像进行变换(binhun)的计算量太大,所以一般把原始图像分成许多个矩形区域子图像独立进行变换(binhun)。常用的变换(binhun)有KLT(Karhunen-Loeve Transformn),DCT(Discrete Cosine Transform),WHT(Walsh-Hadamard Transform)和DFT(Discrete Fourier Transform)。其中KLT是消除相关性最有效的变换(binhun),但

13、是由于其计算量较大而没被采用,DCT变换(binhun)消除相关性的效果接近KLT变换(binhun),而且存在快速的算法,所以普遍采用。第49页/共58页第四十九页,共58页。50离散余弦变换离散余弦变换DCT(Discrete Cosine Transformation)具有快速算法,且易于实现等优点,它的快速算法已可由专用芯片来实现,因而被广泛采用。离散余弦变换方法研究较早,技术成熟,图像压缩实践证明DCT是许多图像的最佳变换,它允许将88图像的空间表达式转换为频率(pnl)域,只需要少量的数据点来表示图像。另外,DCT算法的性能很好,可以进行高效的运算,因此使它在硬件和软件中都容易实现

14、。目前国际上已经制订了基于离散余弦变换的静止图像压缩标准JPEG和运动图像压缩标准MPEG。第50页/共58页第五十页,共58页。51 DCT DCT压缩压缩(y su)(y su)过程中最关键的步骤是一个称为过程中最关键的步骤是一个称为DCTDCT的数的数学变换。学变换。DCTDCT和著名的快速傅立叶变换(和著名的快速傅立叶变换(FFTFFT)属于同一类数学)属于同一类数学运算,这类变换的基本运算是将信号从一种表达形式变成另一运算,这类变换的基本运算是将信号从一种表达形式变成另一种表达形式,并且这种变换过程是可逆的。种表达形式,并且这种变换过程是可逆的。 DCT DCT变换的过程相当复杂变换

15、的过程相当复杂, ,源图像在进行源图像在进行DCTDCT变换之前,首变换之前,首先把源图像划分为若干个先把源图像划分为若干个8 88 8像素的子块,然后对像素的子块,然后对8 88 8像素块像素块逐一进行逐一进行DCTDCT变换。例如,如果源图像为变换。例如,如果源图像为640640480480的分辨率的分辨率, ,则则划分后的图像将包含划分后的图像将包含80806060这样多的子块。这样多的子块。第51页/共58页第五十一页,共58页。52图:JPEG将源图像划分(hu fn)为若干个子块,每个子块包含88个像素 第52页/共58页第五十二页,共58页。53 现在来看DCT处理前后数据发生了

16、哪些变化?图像一般可以用灰度(或彩色)来表示,为讨论问题方便,我们取图像中一个(y )被放大了的88个像素的子块作为示例。假设每个像素的灰度值(或颜色值)用8比特来表示,那么共有256个灰度等级(或256种颜色)。这样,我们可以定义一个(y )8行8列的二维数组来表示图像子块中各像素的灰度值和颜色值。于是我们就得到了二维数组矩阵。不失一般性,如果图像是真彩色图像,即每个像素的颜色值需用24比特表示,需要用3个8行8列的数组来表示这个子块。每一个(y )数组表示其中一个(y )8比特组合的像素值。离散余弦变换作用于每一个(y )数组。 第53页/共58页第五十三页,共58页。54一个被放大(fn

17、gd)的88个像素的子块 表示图像灰度(或颜色(yns))的矩阵 经过离散余弦(yxin)变换,量化取整后频率系数矩阵T 第54页/共58页第五十四页,共58页。55 其中,其中, 否则,否则, 公式表明:对一个公式表明:对一个8 88 8的矩阵进行处理,得到一个的矩阵进行处理,得到一个8 88 8的频率的频率系数矩阵。不解释这个公式是怎么来的,它的物理意义是:这个变换的系数矩阵。不解释这个公式是怎么来的,它的物理意义是:这个变换的基本运算是将信号从一种表达形式(空间域,即图像的像素值)变成另基本运算是将信号从一种表达形式(空间域,即图像的像素值)变成另一种等同的表达形式(频率域,即频率系数)

18、,并且这种变换过程是可一种等同的表达形式(频率域,即频率系数),并且这种变换过程是可逆的。数组逆的。数组T T中每个元素称为变换系数,这些系数都有明确的物理意义中每个元素称为变换系数,这些系数都有明确的物理意义:如当:如当i,j=0i,j=0时的值称为时的值称为DCDC系数,它与数组的平均值有关。矩阵的其余系数,它与数组的平均值有关。矩阵的其余的值称为的值称为ACAC系数。随着系数。随着i i和和j j值的增加,相应系数分别代表逐步增加的水值的增加,相应系数分别代表逐步增加的水平平(shupng)(shupng)空间频率分量和垂直空间频率分量的大小。空间频率分量和垂直空间频率分量的大小。 进行

19、离散余弦变换,要用到如下的一个(y )公式:第55页/共58页第五十五页,共58页。56 从矩阵中可以看出有一个倾向:随着元素离从矩阵中可以看出有一个倾向:随着元素离DCDC系数越系数越来越远,它的值就倾向于越来越小。这意味着通过来越远,它的值就倾向于越来越小。这意味着通过DCTDCT来来处理数据,已将图像的表示集结到输出矩阵的左上角的系处理数据,已将图像的表示集结到输出矩阵的左上角的系数,这个系数就比其他系数携带了更多关于图像的有用信数,这个系数就比其他系数携带了更多关于图像的有用信息,同时息,同时DCTDCT矩阵的右下部分系数几乎不包含有用信息。矩阵的右下部分系数几乎不包含有用信息。由于计

20、算机屏幕上的大多数图像都由低频信息构成,因此由于计算机屏幕上的大多数图像都由低频信息构成,因此这一点是很有意义的。这样,系数越来越小,而且对描述这一点是很有意义的。这样,系数越来越小,而且对描述图像越来越不重要图像越来越不重要(zhngyo)(zhngyo)。所以说。所以说DCTDCT确定了图像的确定了图像的一部分信息,这些信息可被一部分信息,这些信息可被“扔掉扔掉”并且不会对图像的质并且不会对图像的质量带来严重影响。量带来严重影响。第56页/共58页第五十六页,共58页。57 由以上的介绍可知,由以上的介绍可知,DCTDCT的优点很多,主要表现为:的优点很多,主要表现为: 已证明已证明DCT

21、DCT是许多图像的最佳变换是许多图像的最佳变换; ; DCTDCT可以将图像的空间域转换为频率域,只需要少量可以将图像的空间域转换为频率域,只需要少量的数据点表示图像;的数据点表示图像;DCTDCT产生的系数很容易被量化,以获得好的块压缩;产生的系数很容易被量化,以获得好的块压缩; DCTDCT算法的性能很好,可以进行高效的运算,因此使它在硬算法的性能很好,可以进行高效的运算,因此使它在硬件和软件中都容易实现件和软件中都容易实现(shxin)(shxin); DCTDCT算法是对称的,逆算法是对称的,逆DCTDCT算法可用来解压缩图像。算法可用来解压缩图像。 第57页/共58页第五十七页,共58页。感谢您的观看感谢您的观看(gunkn)!第58页/共58页第五十八页,共58页。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!