听觉系统的感知特性).ppt

上传人:sh****n 文档编号:14114706 上传时间:2020-07-03 格式:PPT 页数:37 大小:629.86KB
收藏 版权申诉 举报 下载
听觉系统的感知特性).ppt_第1页
第1页 / 共37页
听觉系统的感知特性).ppt_第2页
第2页 / 共37页
听觉系统的感知特性).ppt_第3页
第3页 / 共37页
资源描述:

《听觉系统的感知特性).ppt》由会员分享,可在线阅读,更多相关《听觉系统的感知特性).ppt(37页珍藏版)》请在装配图网上搜索。

1、第九章MPEG声音,听觉系统的感知特性(P132)9.1.1.对响度的感知9.1.2.对音高的感知9.1.3.掩蔽效应,第九章MPEG声音,MPEGAudio与感知特性(P136)心理声学模型(其余内容不作为考试范围),第十章MPEG电视,Mpeg-1;Mpeg-2均采用图像块单元,进行变换、量化、移动补偿等处理电视图像的数据率(P154)ITU-RBT.601标准数据率VCD电视图象数据率的估算DVD电视图象数据率的估算,第十章MPEG电视,数据压缩算法(10.2)电视图象压缩利用的各种冗余信息(P156表)MPEG专家组定义的三种图象:帧内图象I(intra),预测图象P(predicte

2、d)和双向预测图象B(bidirectionallyinterpolated),典型的排列如图10-01所示(P156),第十章MPEG电视,帧内图象I(intra)帧内图象I不参照任何过去的或者将来的其他图象帧,压缩编码采用类似JPEG压缩算法,它的框图如图10-02所示。如果电视图象是用RGB空间表示的,则首先把它转换成YCrCb空间表示的图象。每个图象平面分成88的图块,对每个图块进行离散余弦变换DCT(DiscreteCosineTransform)。DCT变换后经过量化的交流分量系数按照Zig-zag的形状排序,然后再使用无损压缩技术进行编码。DCT变换后经过量化的直流分量系数用差分

3、脉冲编码DPCM(DifferentialPulseCodeModulation),交流分量系数用行程长度编码RLE(run-lengthencoding),然后再用霍夫曼(Huffman)编码或者用算术编码。,第十章MPEG电视,图10-02,第十章MPEG电视,预测图象P的压缩编码算法预测图象的编码也是以图象宏块(macroblock)为基本编码单元,一个宏块定义为IJ象素的图象块,一般取1616。预测图象P使用两种类型的参数来表示:一种参数是当前要编码的图象宏块与参考图象的宏块之间的差值,另一种参数是宏块的移动矢量,要使预测图象更精度,就要求找到与参考宏块MRJ最佳匹配的预测图象编码宏块

4、MPI。所谓最佳匹配是指这两个宏块之间的差值最小。,第十章MPEG电视,假设编码图象宏块MPI是参考图象宏块MRJ的最佳匹配块,它们的差值就是这两个宏块中相应象素值之差。对所求得的差值进行彩色空间转换,并作4:1:1的子采样得到Y,Cr和Cb分量值,然后仿照JPEG压缩算法对差值进行编码,计算出的移动矢量也要进行霍夫曼编码。,第十章MPEG电视,10-04,第十章MPEG电视,双向预测图象B的压缩编码算法,10.2.5电视图象的结构,MPEG编码器算法允许选择I图象的频率和位置。I图象的频率是指每秒钟出现I图象的次数,位置是指时间方向上帧所在的位置。一般情况下,I图象的频率为2。MPEG编码器

5、也允许在一对I图象或者P图象之间选择B图象的数目。I图象、P图象和B图象数目的选择依据主要是根节目的内容。例如,对于快速运动的图象,I图象的频率可以选择高一些,B图象的数目可以选择少一点;对于满速运动的图象I图象的频率可以低一点,而B图象的数目可以选择多一点。此外,在实际应用中还要考虑媒体的速率。,一个典型的I、P、B图象安排如图所示。编码参数为:帧内图象I的距离为N=15,预测图象(P)的距离为M=3。,10.3MPEG-2的配置和等级,在MPEG-2标准化阶段,考虑到要适应不同数据速率设备的应用,MPEG专家组定义了三种质量不同的编码方式:信噪比可变性(SNR/Signal-to-Nois

6、eScalability),空间分辨率可变性(SpatialScalability)和时间分辨率可变性(TemporalScalability)。,信噪比可变性SNR(Signal-to-Noisescalability)是指图象质量的折中,对于数据率比较低的解码器使用比较低的信噪比,而对数据率比较高的解码器则使用比较高的信噪比;空间分辨率可变性(Spatialscalability)是指图象的空间分辨率的折中,对于低速率的接受器使用比较低的图象分辨率,而对于数据率比较高的接受器使用比较高的图象分辨率;时间分辨率可变性(TemporalScalability)是指图象在时间方向上分辨率的折中,

7、与空间分辨率类似。,MPEG-2为此引入了“配置(Profiles)”和参数“等级(Levels)的概念。每种配置定义一套新的算法,而每一个等级指定一套参数范围(如图象大小、帧速率和位速率)。,10.4MPEG-4电视图象编码,MPEGVideo专家组建立了一个用来开发图象和电视图象编码技术的模型,叫做“试验模型(TestModel)”或者叫做“验证模型(VMVerificationModel)”。这个模型描述了一个核心的编码算法平台,包括编码器、解码器以及位流(bitstream)的语法和语义.,10.4.1电视图象对象区的概念,MPEG-4Video编码算法支持由MPEG-1和MPEG-2

8、提供的所有功能,包括对各种输入格式下的标准矩形图象、帧速率、位速率和隔行扫描图象源的支持。MPEG-4Video算法的核心是支持内容基(content-based)的编码和解码功能,也就是对场景中使用分割算法抽取的单独的物理对象进行编码和解码。MPEG-4Video还提供管理这些电视内容的最基本方法。,为了实现预想的内容基交互等功能,MPEG-4Video验证模型引进了一个叫做“电视图象对象区(VOPVideoObjectPlane)”的概念。MPEG-4Video验证模型不像MPEG-1/-2Video那样把电视图象都认为是一个矩形区,而是假设每帧图象被分割成许多任意形状的图象区,每个区都有

9、可能覆盖描述场景中感兴趣的物理对象或者内容,这种区被定义为图象对象区VOP。,编码器输入的是任意形状的图象区,图象区的形状和位置也可随帧的变化而改变。属于相同物理对象的连续的电视图象对象区(VOP)组成电视图象对象(VOVideoObjects)。MPEG-4可单独对属于相同电视图象对象(VO)的电视图象区(VOP)的形状、移动(motion)和纹理(texture)信息进编码和传送,或者把它们编码成一个单独的电视图象对象层(VOLVideoObjectLayer)。此外,需要标识每个电视图象对象层(VOL)的信息也包含在编码后的位流(bitstream)中,这些信息包括各种电视图象对象层(V

10、OL)的电视图象在接收端应该如何进行组合,以便重构完整的原始图象序列。这样就可以对每个电视图象对象区(VOP)进行单独解码,提供了管理电视图象序列的灵活性。,10.4.2电视图象编码方案,MPEG-4Video验证模型对每个电视图象对象(VO)的形状、移动和纹理信息进行编码形成单独的VOL层,以便能够单独对电视图象对象(VO)进行解码。如果输入图象序列只包含标准的矩形图象,就不需要形状编码,在这种情况下,MPEG-4Video使用的编码算法结构也就与MPEG-1和MPEG-2使用的算法结构相同。,MPEG-4Video验证模型对每个电视图象对象区(VOP)进行编码使用的压缩算法是在MPEG-1

11、和MPEG-2Video标准的基础上开发的,它也是以图象块为基础的混合DPCM和变换编码技术(hybridDPCM/Transformcoding)。MPEG-4编码算法也定义了帧内电视图象对象区I-VOP(Intra-FrameVOP)编码方式和帧间电视图象对象区预测P-VOP(Inter-frameVOPprediction)编码方式,它也支持双向预测电视图象对象区B-VOP(B-directionallypredictedVOP)方式。在对电视图象对象区(VOP)的形状编码之后,颜色图象序列分割成宏块进行编码.,图描绘了MPEG-4Video的编码算法,用来对矩形和任意形状的输入图象序列

12、进行编码。这个基本编码算法结构图包含了移动矢量(motionvector)的编码,以及以离散余弦变换为基础的纹理编码。,10.4.3电视图象分辨率可变编码,“电视图象分辨率”是指电视图象空间分辨率(spatialresolution)和时间分辨率(temporalresolution)。空间分辨率是指一帧图象包含的行数与每行显示的象素数之乘积,而时间分辨率是指每秒种显示或者传输的图象帧数。设置电视图象分辨率可变编码功能的一个重要目的是为了能够灵活支持性能不同(例如不同带宽)的各种电视接收或显示设备,或者支持要求浏览电视数据库等方面的应用。另一个目的是提供分层次的电视图象数据位流,这样可按应用所

13、要求的先后次序进行传输。,MPEG-2也有电视图象分辨率可变编码功能,但它是以图象的帧为基础进行编码。而MPEG-4电视图象分辨率可变编码是以任意形状的电视图象对象区(VOP)为基础进行编码。对那些没有能力或者不愿意接收高分辨率图象的接收器,它可以接收分辨率比较低的电视图象,降低空间分辨率或者时间分辨率意味降低图象的质量。,空间分辨率可变性(SpatialScalability)和时间分辨率可变性(TemporalScalability)的实现方法类似。图描述了多种分辨率电视图象编码(multiscalevideocoding)方案。该方案提供三个层次的编码/解码,每一层都支持在不同空间分辨率

14、下进行编码/解码。从图中可以看到,多种空间分辨率的实现是通过降低输入电视信号的采样率来获得的。,10.5HDTV格式,现在我们使用的电视格式再加上新制定的电视格式归纳在图10-16中。美国把1280720格式称为高级电视ATV(advancedtelevision),把19201035称为高清晰度电视HDTV(highdefinitiontelevision)。,1995年11月28日美国高级电视委员会ATSC(AdvancedTelevisionSystemsCommittee)向FCC咨询委员会(FCCAdvisoryCommittee)提交了数字电视标准(DigitalTelevisio

15、nStandard),并推荐作为高级电视广播标准。,电视图象压缩以MPEG-2Video标准为基础,采样基本型配置(MainProfile),等级从基本级(MainLevel)到高级(HighLevel)。声音压缩以AC-3系统为基础,采样频率为48kHz,支持5个环绕声和1个超低频声道。该规格是1996年介绍的,由于近年来MPEG电视和声音标准的研究已有新的进展,因此该规格有可能在实行过程中会作修改。,电视图象数据压缩的依据是什么?MPEG-1编码器输出的电视图象的数据率大约是多少?MPEG专家组在制定MPEG-1/-2Video标准时定义了哪几种图象?哪种图象的压缩率最高?哪种图象的压缩率最低?有人认为“图象压缩比越高越好”。你对这种说法有何看法?有人说“MPEG-1编码器的压缩比大约是200:1”。这种说法对不对?为什么?说明电视规格MPML和HPHL各自的含义。电视图象的空间分辨率和时间分辨率是什么意思?,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!