音频转换原理

上传人:daj****de2 文档编号:163575938 上传时间:2022-10-22 格式:DOCX 页数:4 大小:62.99KB
收藏 版权申诉 举报 下载
音频转换原理_第1页
第1页 / 共4页
音频转换原理_第2页
第2页 / 共4页
音频转换原理_第3页
第3页 / 共4页
资源描述:

《音频转换原理》由会员分享,可在线阅读,更多相关《音频转换原理(4页珍藏版)》请在装配图网上搜索。

1、基于感知的数字音频压缩编码感知编码原理在过去10 年中,数字音频已经基本代替了模拟音频,并在互联网、无线通信、多媒体计算 机上得到广泛应用。但这些应用都面临如下3 个问题:传输带宽资源紧缺、传输代价昂贵及 存储容量有限。低码率高质量的数字音频压缩成为迫切需要解决的问题,而这一问题的解决 要归功于基于感知的CD音质数字音频的透明编码。数字音频编码是一种为了高效传输和存 储数字化宽带音频而对它们进行紧缩数字表示的处理方法。它的主要目标是用尽可能低的编 码速率压缩音频信号的同时,又能保证重建的音频信号质量几乎和原始信号相同。实践也证 明,基于感知的音频编码解决了人们对数字音频的传输需求和有限的网络传

2、输带宽的矛盾。 图 1 所示的是感知编码器框图。可以看出,感知编码具有如下几个特点:数字音频信号参数参数掩蔽阀边信息图 1 感知编码器框图(1) 无损编码和有损编码的有机结合。有损编码去除音频信号中的感知相关度和统计冗余 度。(2) 多个信号处理模型的有机结合。大多数数字音频编码系统采用感知编码原理。所谓感知, 就是指利用人耳的听觉特性,保留音频信号中人耳能够听到的,去掉听不到的成分。一般的 感知编码要用到5 个基本原理:绝对听觉门限、临界带宽、同时掩蔽、非同时掩蔽和感知熵。数字音频编码技术 感知编码根据压缩技术的不同又可分为子带压缩技术和变换压缩技术。子带压缩技术是以子 带编码理论为基础的编

3、码方法。其基本思想是将信号分解为若干子频带内的分量之和,然后 对各子带分量根据其分布特性采取不同的压缩策略以降低码率。一般来讲,子带编码的复杂 度要略低于变换编码,编码延时也相对较短。典型代表有著名的MPEG-1层I和层II等。 变换压缩技术则是对一段音频数据进行线性变换,对所获得的变换域参数进行量化、传输, 通常使用的变换有DFT、DCT和MDCT等。根据信号的短时功率谱对变换域参数进行合理 的动态比特分配,可以使音频质量获得显著改善,而相应付出的代价则是计算复杂度的提高。具有代表性的变换压缩编码技术有DolbyAC-2、AT&T的ASPEC (Audio Spect ral Percep

4、tual Entropy Coding)、PAC(Perceptual Audio Coder)等。MPEG音频编码技术经过 10 多年的发展,国际标准化组织、国际电工委员会所属 WG11 工作组制定推进了MPEG 标准。 MPEG 定义了低比特率视频流和音频流的描述语法,并规范了解码器的操作。 MPEG系列中的每个标准都是建立在前面标准的基础之上的。MPEG-1和MPEG-2是目前 成熟的广泛应用的标准,而MPEG-4是作为一个开放的多媒体标准出现在市场上的。后继 标准MPEG-7及以后的MPEG-21标准重点已经不在压缩方面,MPEG-7注重于多媒体数 据基于内容的描述,用来帮助运营者管理

5、日益丰富的多媒体信息,而 MPEG-21 则更侧重 于与多媒体信息内容的使用相关的诸多方面。MPEG系列标准对多媒体以及相关产业产生 重大的影响,并将极大的推动多媒体通信领域的发展。总体来说, MPEG 在 3 方面优于其 他压缩/解压缩方案。首先, MPEG 具有很好的兼容性; 其次, MPEG 比其他算法提供更 高的压缩比,最高可达200 : 1。更重要的是MPEG在提供高压缩比的同时,对数据的损 失很小。数字音频播放器的设计与实现基本功能基于前文中所了解到的语音编码技术的原理,通过VisualC+ 6.0的可视化编程,制作了 一个音频播放器,可以播放WAVE、AVI、MIDI、CD和MP

6、3 5种格式的音频文件,如图 2 所示。图 2 播放器简图底排的 5 个按钮可以对所播放的音频格式进行限制,当选中时可以播放不同格式的音频文 件。此外,对本播放器进行一些特色处理:(1) 制作radio按钮,以对各种音频格式进行选择性播放,达到区分和比较效果的目的。(2) 增添AVI按钮,AVI和WAVE在文件结构上是非常相似的,不过AVI多了 1个视频 流。(3) 添加1个基于Button类的按钮类CFXButton,制作出特殊的按钮。(4) 用Photoshop做1个播放器的界面。程序设计本程序调用了一个控件MicrosoftMultimediaControl, version 6. 0由

7、此引入了 2个已 封装好的类,MCI( The Media Control Interface )和 PICTURE;通过 MCI 来播放各 种音频文件。MCI类是通过GetDeviceType函数来控制所播放的文件的类型,其函数原 型如下。CString Cmci: GetDeviceType ( )CString result;InvokeHelper ( 0x15, D ISPATCH _ PROPERTY2GET, VT_BSTR,( void3 ) &result, NULL) ;return result;在对话框类中通过OnOpen()函数来设定所打开文件的类型,代码如下。播放W

8、AVE文件:this - m _Multimedia. SetDeviceType ( WaveAudio ) ;播放 AV I 文件:this - m_Multimedia. SetDeviceType ( AviVideo ) ;播放 MIDI 文件:this - m _Multimedia. SetDeviceType ( Sequencer );播放 CD 文件:this - m _Multimedia1. SetDeviceType ( CDAudio );MCI类通过mciSendCommand( )或 mciSendString()来实现控制MIDI文件播放的功 能,其中 mci

9、SendCommand( )函数原型如下:DWORD mciSendCommand (UN IT wDevice ID, UN IT wMessage, DWORD dwParam1, DWORD dwParam2) ;各个参数说明如下:wDevice ID:接受消息的设备ID; wMessage: MCI 命令消息; dwParami:命令的标志位; dwPa ram2 :所使用参数块的指针;测试与分析 按照上述功能,进行实际的播放,对于不同格式的文件分别试听,比较不同格式的音频文件 听觉上的效果。CDCDA格式就是唱片采用的格式,又叫红皮书格式,记录的是波形流,绝对的纯正、HIFI。 音乐

10、CD的回放采样字节都是16位,它采用了 PCM编码,而PCM编码的最大优点就是音 质好。但其缺点是,无法编辑,文件太大。一张光盘的容量只能容纳72 min 的音乐信息。MIDIMIDI技术本来不是为电脑发明的,该技术最初应用在电子乐器上用来记录乐手的弹奏,以 便以后重播。随着在电脑里面引入了支持MIDI合成的声音卡之后,MIDI才正式地成为了 一种音频格式。MIDI的内容除了乐谱之外还记录了每个音符的弹奏方法,所以MIDI文件 播放起来效果参差不齐。作为音乐工业的数据通信标准,MIDI可谓是一种非常专业的语言, 它能指挥各音乐设备的运转,而且具有统一的标准格式。由于标准化,MIDI文件的长度非

11、 常小,一首歌一般就几十k字节,但MIDI必须依赖于回放设备,此外,MIDI另一个缺点 就是不能记录人声等声音。它只能将人声作为一种乐器储存在音色库中,总之不能令乐器唱 歌、说话。WAVE 该格式记录了声音的波形,故只要采样率高、采样字节长、机器速度快、利用该格式记录的 声音文件能够和原声基本一致。从理论上说,采样率达44 kHz,采样字节长度达16位的 音质已经能与CD唱片相当。它可以不对数据进行压缩,制作出来的声音质量却可以达到专 业级水平。WAVE 是一种文件格式,符合 PIFF(Resoureelnterchange File Format)规 范。所有的WAVE都有一个文件头,这个文

12、件头包含音频流的编码参数。WAVE对音频流 的编码没有硬性规定,几乎所有支持ACM (Audio Comp ressionManager)规范的编码 都可以为WAVE的音频流进行编码。在Windows平台下,基于PCM编码的WAVE是被 支持得最好的音频格式,所有音频软件都能完美支持。由于它本身可以达到较高的音质的要 求,因而 WAVE 也是音乐编辑创作的首选格式,适合保存音乐素材。同时它也被作为一种 中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMAE。WAVE的 唯一缺点就是文件太大。因此,虽然WAVE文件可以存放压缩音频甚至MP3,但由于它本 身的结构注定了它的用途是存

13、放音频数据并用作进一步的处理,而不是像MP3那样用于聆 听。目前所有的音频播放软件和编辑软件都支持这一格式,并将该格式作为默认文件保存格 式之一。MP3MP3就是应用于MPEG-1的一项音频压缩技术标准,英文全称是MPEG-1 Audio Layer III。它采用MPEG中的第3层音频压缩模式,MPEG音频文件是MPEG-1标准中的声音 部分,它根据压缩质量和编码复杂程度划分为3层,即Layer I、Layerll和Layerill,且 分别对应MP1、MP2、MP3这3种声音文件,并根据不同的用途,使用不同层次的编码。 MPEG音频编码的层次越高,编码器越复杂,压缩率也越高,MP1和MP2的压缩率分别为 4 : 1和(6 : 1)(8 : 1),而MP3的压缩率则高达(10 : 1)(12 : 1) o因此, MP3 是第一个实用的有损音频压缩编码, MP3 之所以能够达到如此高的压缩比例,同时又 能保持相当不错的音质是因为利用了知觉音频编码技术,即编码时先对音频文件进行频谱分 析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成 具有较高压缩比的 MP3 文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音 效果,也就是利用了人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能地维持原 来的声音质量。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!