多媒体技术音处理技术

上传人:痛*** 文档编号:161829933 上传时间:2022-10-15 格式:PPT 页数:61 大小:5.90MB
收藏 版权申诉 举报 下载
多媒体技术音处理技术_第1页
第1页 / 共61页
多媒体技术音处理技术_第2页
第2页 / 共61页
多媒体技术音处理技术_第3页
第3页 / 共61页
资源描述:

《多媒体技术音处理技术》由会员分享,可在线阅读,更多相关《多媒体技术音处理技术(61页珍藏版)》请在装配图网上搜索。

1、 多媒体技术多媒体技术第二章第二章 音频信息处理音频信息处理 第第2 2章章 音频信息处理音频信息处理 学习目标学习目标:了解声音信号的特点、存储格式及质量的度量方法了解声音信号的特点、存储格式及质量的度量方法理解音频信号压缩方法及音频编码标准理解音频信号压缩方法及音频编码标准掌握常用的音频处理软件对声音信号进行处理掌握常用的音频处理软件对声音信号进行处理了解语音识别技术及其应用了解语音识别技术及其应用2.1.2 2.1.2 模拟音频的数字化过程模拟音频的数字化过程 对模拟音频数字化过程涉及到音频的对模拟音频数字化过程涉及到音频的采样采样、量化量化和和编码编码。采样和量化的过程可由采样和量化的

2、过程可由A/DA/D转换器实现。转换器实现。A/DA/D转换器以固定转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采样的频率去采样,即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号,可以将和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中。其以文件形式保存在计算机的存储介质中。模拟信号的数字化过程 100101100011101 信息论的奠基者香农(信息论的奠基者香农(ShannonShannon)指出:在一定条件下,)指出:在一定条件下,用离散的序列可以完全代表一个连续函数,这是采样定理用离散的序列可以完全代表一个

3、连续函数,这是采样定理的基本内容。的基本内容。为实现为实现A/DA/D转换,需要转换,需要把模拟音频信号波形进行分割,把模拟音频信号波形进行分割,这种方法称为采样这种方法称为采样(Sampling)(Sampling)。采样的过程是每隔一个时采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。其倒数为采样频率。采样频率是指计算机每秒钟采集多少采样频率是指计算机每秒钟采集多少个声音样本。个声音样本。对声波波

4、形幅度的数字化表示称之为对声波波形幅度的数字化表示称之为“量化量化”。量化的。量化的过程是先将采样后的信号按整个声波的幅度划分成有限个过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。相同的量化值。以位以位(bit)(bit)或或1616位位(bit)(bit)的方式来划分纵轴。也就是说的方式来划分纵轴。也就是说在一个以在一个以8 8位为记录模式的音效中,其纵轴将会被划分为位为记录模式的音效中,其纵轴将会被划分为?个量化等级,用以记录其幅度大小。个量化等级,用以记录其幅度大小。D/

5、A D/A转换器从上图得到的数值中重构原来信号时,得转换器从上图得到的数值中重构原来信号时,得到下图蓝色线段所示的波形。可以看出,蓝色线与原波到下图蓝色线段所示的波形。可以看出,蓝色线与原波形形(红色线红色线)相比,其波形的细节部分丢失了很多。这意相比,其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。味着重构后的信号波形有较大的失真。失真是不可避免的,如何减少失真呢?在下图中,采样失真是不可避免的,如何减少失真呢?在下图中,采样率和量化等级再提高了一倍。从图中可以看出,当用率和量化等级再提高了一倍。从图中可以看出,当用D/AD/A转转换器重构原来信号时(图中的轮廓线),信号的

6、失真明显减换器重构原来信号时(图中的轮廓线),信号的失真明显减少,信号质量得到了提高。少,信号质量得到了提高。模拟信号量经过采样和量化以后,形成一系列的离散模拟信号量经过采样和量化以后,形成一系列的离散信号信号脉冲数字信号。这种脉冲数字信号可以一定的方脉冲数字信号。这种脉冲数字信号可以一定的方式进行编码,形成计算机内部运行的数据。式进行编码,形成计算机内部运行的数据。所谓编码,就是按照一定的格式把经过采样和量化得所谓编码,就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据。纠错、同步和控

7、制的数据。在多媒体技术中,存储音频信息的文件格式主要有:在多媒体技术中,存储音频信息的文件格式主要有:WAVWAV文件、文件、VOCVOC文件和文件和MP3MP3文件等。文件等。WAVWAV文件又称波形文件,来源于对声音模拟波形的采样,文件又称波形文件,来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值轮换成二进制数,并以不同的量化位数把这些采样点的值轮换成二进制数,然后存入磁盘,这就产生了波形文件。然后存入磁盘,这就产生了波形文件。WAVWAV文件用于保存文件用于保存WindowsWindows平台的音频信息资源,被平台的音频信息资源,被WindowsWindows平台及其应用平

8、台及其应用程序所广泛支持。程序所广泛支持。未压缩的声音文件的存储量可用下式计算:未压缩的声音文件的存储量可用下式计算:存储量(存储量(KBKB)=(采样频率(采样频率KHZKHZ采样位数采样位数bitbit声道数声道数时间秒)时间秒)/8/8 VOCVOC文件是文件是CreativeCreative公司所使用的标准音频文件公司所使用的标准音频文件格式,多用于保存格式,多用于保存 Creative Sound Blaster(Creative Sound Blaster(创新创新声霸声霸)系列声卡所采集的声音数据,被系列声卡所采集的声音数据,被WindowsWindows平台平台和和DOSDOS

9、平台所支持。平台所支持。MPEGMPEG音频文件的压缩是一种有损压缩,根据压缩质量音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层和编码复杂程度的不同可分为三层(MPEG Audio Layer(MPEG Audio Layer 1/2/3)1/2/3),分别对应,分别对应MP1MP1、MP2MP2和和MP3MP3这三种声音文件;这三种声音文件;MPEGMPEG音频编码具有很高的压缩率,音频编码具有很高的压缩率,MP1MP1和和MP2MP2的压缩率的压缩率分别为分别为4 41 1和和6 61 18 81 1,而,而MP3MP3的压缩率则高达的压缩率则高达10101 11

10、2121 1,也就是说一分钟,也就是说一分钟CDCD音质的音乐,未经压缩需要音质的音乐,未经压缩需要10MB10MB存储空间,而经过存储空间,而经过MP3MP3压缩编码后只有压缩编码后只有1MB1MB左右,同时左右,同时其音质基本保持不失真。其音质基本保持不失真。RealAudio RealAudio文件是文件是RealNetworksRealNetworks公司开发的一种公司开发的一种新型流式音频新型流式音频(Streaming Audio)(Streaming Audio)文件格式;它包含文件格式;它包含在在RealNetworksRealNetworks所制定的音频、视频压缩规范所制定的

11、音频、视频压缩规范RealMediaRealMedia中,主要用于在低速率的广域网上实时传中,主要用于在低速率的广域网上实时传输音频信息;网络连接速率不同,客户端所获得的输音频信息;网络连接速率不同,客户端所获得的声音质量也不尽相同:对于声音质量也不尽相同:对于28.8kb/s28.8kb/s的连接,可以的连接,可以达到广播级的声音质量;如果拥有达到广播级的声音质量;如果拥有ISDNISDN或更快的线或更快的线路连接,则可获得路连接,则可获得CDCD音质的声音。音质的声音。AIFFAIFF是音频交换文件格式是音频交换文件格式(Audio Interchange(Audio Interchang

12、e File Format)File Format)的英文缩写,是苹果计算机公司开发的英文缩写,是苹果计算机公司开发的一种声音文件格式;被的一种声音文件格式;被MacintoshMacintosh平台及其应用程平台及其应用程序所支持,其他专业音频软件包也同样支持这种格序所支持,其他专业音频软件包也同样支持这种格式。式。MP3 MP3的全名是的全名是MPEG Audio Layer-3MPEG Audio Layer-3,简单地说就是一,简单地说就是一种声音文件的压缩格式。种声音文件的压缩格式。ISO/MPEGISO/MPEG音频压缩标准里包括了三个编码方案音频压缩标准里包括了三个编码方案 ,按

13、,按照压缩质量照压缩质量(每每BitBit的声音效果的声音效果)和编码方案的复杂程度分和编码方案的复杂程度分别是别是Layer1Layer1、Layer2Layer2、Layer3Layer3。所有这三层的编码采用的。所有这三层的编码采用的基本结构是相同的。通过研究人耳和大脑听觉神经对音频基本结构是相同的。通过研究人耳和大脑听觉神经对音频失真的敏感度,在编码时先分析声音文件的波形,然后滤失真的敏感度,在编码时先分析声音文件的波形,然后滤去人耳不敏感的信号,最后编码形成去人耳不敏感的信号,最后编码形成MPEGMPEG的文件。而音质的文件。而音质听起来与听起来与CDCD相差不大。相差不大。MP4M

14、P4并不是并不是MPEG-4MPEG-4或者或者MPEG-1Layer4MPEG-1Layer4,它的出现是,它的出现是针对针对MP3MP3的大众化、无版权的一种保护格式,由美国的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。一种新的网络下载和音乐播放格式。2.2 波形音频文件的采集与制作波形音频文件的采集与制作 Windows Windows录音机的主要功能是录音和放音,使用录音机的主要功能是录音和放音,使用“录音录音机机”可以录制、混合、播放和编辑声音。其主要功能操作可以录制、

15、混合、播放和编辑声音。其主要功能操作如下所述:如下所述:(1 1)波形文件的录制:录音机常用的输入设备是麦克风)波形文件的录制:录音机常用的输入设备是麦克风和和CD-ROMCD-ROM播放机。播放机。(2 2)波形文件的存储:存储的文件格式为波形()波形文件的存储:存储的文件格式为波形(.wav.wav)文件。文件。(3 3)声音的编辑:复制、粘贴、插入、删除等操作。)声音的编辑:复制、粘贴、插入、删除等操作。(4 4)音频变换与特殊效果:更改声音的大小、速度、回)音频变换与特殊效果:更改声音的大小、速度、回音等。音等。2.3 常用音频处理软件简介常用音频处理软件简介 左声道左声道右声道右声道

16、 GoldWaveGoldWave是一款相当不错的数码录音及编辑软件,是一款相当不错的数码录音及编辑软件,除了附有许多的效果处理功能外,它还能将编辑好除了附有许多的效果处理功能外,它还能将编辑好的文件存为的文件存为WAVWAV、AUAU、SNDSND、RAWRAW和和AFCAFC等格式。等格式。作为作为WaveWave文件编辑处理工具,支持从文件编辑处理工具,支持从MP3MP3、MPGMPG、AVIAVI、ASFASF、MOVMOV等文件中提取音频进行编辑,所以等文件中提取音频进行编辑,所以除了它强大的编辑功能外,用作把以上格式的音频除了它强大的编辑功能外,用作把以上格式的音频转换成转换成WA

17、VWAV文件也是很方便的。文件也是很方便的。第第2章讨论题章讨论题分为规则和不规则两类。不规则指不含任何信息的噪分为规则和不规则两类。不规则指不含任何信息的噪音;规则声音分为语音、音乐和音效。语音是指具有音;规则声音分为语音、音乐和音效。语音是指具有语言内涵和人类约定俗成的特殊媒体,音乐是规范的、语言内涵和人类约定俗成的特殊媒体,音乐是规范的、符号化的声音,音效是指人类熟悉的其他声音,如雨符号化的声音,音效是指人类熟悉的其他声音,如雨声、雷声、机器轰鸣声。声、雷声、机器轰鸣声。音强、音调、音色。音强、音调、音色。采样:就是每隔一段时间就读一次声音信号的幅度,采样:就是每隔一段时间就读一次声音信

18、号的幅度,记录下来的原始模拟声波在某一时刻的状态,称之为记录下来的原始模拟声波在某一时刻的状态,称之为样本;样本;量化:把采样得到的声波幅度转化为数字值,也就是量化:把采样得到的声波幅度转化为数字值,也就是把某一幅度范围内的电压用用一个数字表示。把某一幅度范围内的电压用用一个数字表示。1 1、清制作一段自己的录音文件,并配背景音乐,写出、清制作一段自己的录音文件,并配背景音乐,写出制作步骤。制作步骤。2 2、请叙述用、请叙述用Cool Edit ProCool Edit Pro取出某段录音文件中的环取出某段录音文件中的环境噪音的步骤。境噪音的步骤。3 3、请把某段正常速度录制的语音文件,在保持语调不、请把某段正常速度录制的语音文件,在保持语调不变的情况下把语速降低到正常语速的变的情况下把语速降低到正常语速的70%70%。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!