音频信息的获取与处理

上传人:xu****iu 文档编号:120782020 上传时间:2022-07-18 格式:PPT 页数:36 大小:64.50KB
收藏 版权申诉 举报 下载
音频信息的获取与处理_第1页
第1页 / 共36页
音频信息的获取与处理_第2页
第2页 / 共36页
音频信息的获取与处理_第3页
第3页 / 共36页
资源描述:

《音频信息的获取与处理》由会员分享,可在线阅读,更多相关《音频信息的获取与处理(36页珍藏版)》请在装配图网上搜索。

1、1音频(Audio)指人说话的声音频率。(音频是个专业术语(音频是个专业术语,人类能够听到的所有声音都称之为音频人类能够听到的所有声音都称之为音频 )定义:20HZ20KHZ的音频范围分类:波形声音、语音、音乐声音三要素:音调、音强、音色2 考核目的:考核目的:考核学生对数字音频获取与处理的基本考核学生对数字音频获取与处理的基本原理、采样量化的基本原理、音频卡的原理、采样量化的基本原理、音频卡的组成及工作原理、音频编码标准以及音组成及工作原理、音频编码标准以及音乐合成原理的理解和掌握。乐合成原理的理解和掌握。3考核的知识点:考核的知识点:什么是数字音频、数字音频采样和量化什么是数字音频、数字音

2、频采样和量化的基本原理、音频卡的工作原理、音频的基本原理、音频卡的工作原理、音频编码标准和音乐合成的原理。编码标准和音乐合成的原理。4考核要求:考核要求:掌握:数字音频信息的获取与处理的原掌握:数字音频信息的获取与处理的原理过程、音频卡的工作原理。理过程、音频卡的工作原理。理解:数字音频采样量化的原理过程、理解:数字音频采样量化的原理过程、音乐合成的原理。音乐合成的原理。了解:数字音频编码的标准。了解:数字音频编码的标准。52-1 2-1 数字音频:数字音频:在计算机内,所有的信息均以数字表在计算机内,所有的信息均以数字表示。各种命令是不同的数字,各种幅度的示。各种命令是不同的数字,各种幅度的

3、物理量也是不同的数字。音频信号也用一物理量也是不同的数字。音频信号也用一系列数字表示,称之为数字音频。数字音系列数字表示,称之为数字音频。数字音频的特点是保真度好,动态范围大。频的特点是保真度好,动态范围大。62-2 2-2 采样:采样:模拟声音在时间上是连续的,而数字模拟声音在时间上是连续的,而数字音频是一个数字序列,在时间上只能是断音频是一个数字序列,在时间上只能是断续的。因此当把模拟声音变成数字声音时,续的。因此当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上需要每隔一个时间间隔在模拟声音波形上取一个幅度值,称之为采样,采样的时间取一个幅度值,称之为采样,采样的时间间隔称

4、为采样周期。间隔称为采样周期。72-3 2-3 量化:量化:在数字音频技术中,把采样得到的表在数字音频技术中,把采样得到的表示声音强弱的模拟电压用数字表示。模拟示声音强弱的模拟电压用数字表示。模拟电压的幅值仍然是连续的,而用数字表示电压的幅值仍然是连续的,而用数字表示音频幅度时,只能把无穷多个电压幅度用音频幅度时,只能把无穷多个电压幅度用有限个数字表示,即把某一幅度范围内的有限个数字表示,即把某一幅度范围内的电压用一个数字表示,这称之为量化。电压用一个数字表示,这称之为量化。82-42-4奈奎斯特采样定理奈奎斯特采样定理 1927年,奈奎斯特确定了如果对某一带宽的年,奈奎斯特确定了如果对某一带

5、宽的有限时间连续信号(模拟信号)进行抽样,且在有限时间连续信号(模拟信号)进行抽样,且在抽样率达到一定数值时,根据这些抽样值可以在抽样率达到一定数值时,根据这些抽样值可以在接收端准确地恢复原信号。为不使原波形产生接收端准确地恢复原信号。为不使原波形产生“半波损失半波损失”,采样率至少应为信号最高频率的,采样率至少应为信号最高频率的两倍,这就是著名的奈奎斯特采样定理。奈奎斯两倍,这就是著名的奈奎斯特采样定理。奈奎斯特特1928年发表了年发表了电报传输理论的一定论题电报传输理论的一定论题。常用的音频采样率有:常用的音频采样率有:8kHz8kHz、16kHz16kHz、48kHz48kHz。9均匀量

6、化均匀量化:就是将输入数据的振幅进行等值均分,优点是计算处理简单,缺点是量化误差大;非均匀量化非均匀量化:就是将输入数据的振幅,按照其变化曲线的曲率大小进行不等值划分。优点是量化误差大,缺点是计算处理复杂,需要较多的比特数。自适应量化自适应量化:就是按照输入数据的变化曲线的局部区域的特点,自适应地修改和调整量化器的箱宽。优点是量化误差小,缺点是计算处理复杂。102-5 2-5 数字音频的文件格式数字音频的文件格式.WAV Microsoft.WAV Microsoft公司的波形音频文件格式。公司的波形音频文件格式。.MID MIDI.MID MIDI文件格式。文件格式。.VOC Creativ

7、e.VOC Creative公司的波形音频文件格式。公司的波形音频文件格式。.SND NeXT.SND NeXT计算机的波形音频文件格式。计算机的波形音频文件格式。.AIF Apple.AIF Apple计算机的波形音频文件格式。计算机的波形音频文件格式。.RMI Microsoft.RMI Microsoft公司的公司的MIDIMIDI文件格式。它可文件格式。它可以包括图片、标记和文本。以包括图片、标记和文本。112-6 WAV2-6 WAV文件储存容量计算(教材文件储存容量计算(教材2424)WAVWAV文件的字节数文件的字节数/每秒每秒=采样频率(采样频率(HzHz)量化位数(位)量化位

8、数(位)声道数声道数/8/8)()(102410248)()(MBsHzS时间声道数位量化位数采样频率122-7 MIDI2-7 MIDI文件文件 由于由于MIDIMIDI文件记录的是一系列的计算文件记录的是一系列的计算指令而不是数据化后的波形数据,因此占指令而不是数据化后的波形数据,因此占用的存储空间比用的存储空间比WAVWAV文件要小很多。所以预文件要小很多。所以预装装MIDIMIDI文件比装入文件比装入WAVWAV文件要容易很多。这文件要容易很多。这为设计多媒体应用系统和指何时播放音乐为设计多媒体应用系统和指何时播放音乐带来很大的灵活性。但是带来很大的灵活性。但是MIDIMIDI文件的录

9、制文件的录制比较复杂,这要学习一些使用比较复杂,这要学习一些使用MIDIMIDI创作并创作并改编作品的专业知识,并且还必须有专门改编作品的专业知识,并且还必须有专门工具,如键盘合成器等。工具,如键盘合成器等。132-8 2-8 音频信号处理的特点(教材音频信号处理的特点(教材P26P26)(1)(1)音频信号是时间依赖的连续媒体。音频信号是时间依赖的连续媒体。(2)(2)理想的合成声音应是立体声。理想的合成声音应是立体声。(3)(3)对语音信号的处理,要抽取语意等其对语音信号的处理,要抽取语意等其它信息,如可能会涉及到语言学、社会学、它信息,如可能会涉及到语言学、社会学、声学等。声学等。142

10、-9 2-9 从人与计算机交互的角度来看音频信从人与计算机交互的角度来看音频信 号相应的处理如下号相应的处理如下:(1)(1)人与计算机通信人与计算机通信(接收音频信号接收音频信号)音频获取;语音识别与理解。音频获取;语音识别与理解。(2)(2)计算机与人通信计算机与人通信(输出音频输出音频)音频合成;音频合成;声音定位;音频声音定位;音频/视频同步。视频同步。(3)(3)人人计算机计算机别人通信别人通信152-10 2-10 音频卡的主要功能(教材音频卡的主要功能(教材P28P28)音频的录制与播放、编辑与合成、音频的录制与播放、编辑与合成、MIDIMIDI接口、接口、文语转换、文语转换、C

11、D-ROMCD-ROM接口及游戏接口等。接口及游戏接口等。162-11 2-11 音频卡的分类音频卡的分类音频卡的分类主要根据数据采样量化的位音频卡的分类主要根据数据采样量化的位数来分,通常分为数来分,通常分为8 8位、位、1616位和位和3232位等几类。位等几类。位数越高,量化精度越高,音质就越好。位数越高,量化精度越高,音质就越好。172-12 2-12 音频卡的工作原理(教材音频卡的工作原理(教材P33-55P33-55)音频卡的组成平面图音频卡的组成平面图(图图2.2)2.2)音频卡的工作原理框图音频卡的工作原理框图(图图)(1 1)声音的合成与处理:这部分是音)声音的合成与处理:这

12、部分是音频卡的核心,一般由数字声音处理器、频卡的核心,一般由数字声音处理器、FMFM音音乐合成器及乐合成器及MIDIMIDI控制器组成。控制器组成。它的主要任务是完成声波信号的它的主要任务是完成声波信号的 模模/数、数、数数/模转换,利用调频技术控制声音的音调、模转换,利用调频技术控制声音的音调、音色、和幅度。音色、和幅度。18(2 2)混合信号处理器及功率放大器:内置)混合信号处理器及功率放大器:内置数字数字/模拟混音器,混音器的声源可以是模拟混音器,混音器的声源可以是MIDIMIDI信号、信号、CDCD音频、线输入、话筒和音频、线输入、话筒和PCPC的扬声器等,可以选择输入一个声源或的扬声

13、器等,可以选择输入一个声源或将几个不同的声源进行混合录音。将几个不同的声源进行混合录音。(3 3)计算机总线接口和控制器:总线接口)计算机总线接口和控制器:总线接口和控制器是由数据总线双向驱动器、总和控制器是由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑及线接口控制逻辑、总线中断逻辑及DMADMA(直接存储器存取)控制逻辑组成。(直接存储器存取)控制逻辑组成。192-132-13音频卡硬件的安装步骤音频卡硬件的安装步骤:(1 1)将电脑电源关闭,拔下供电电源和所有外接线)将电脑电源关闭,拔下供电电源和所有外接线插头;插头;(2 2)打开机箱外壳,选择一个空闲的)打开机箱外壳,选择一个空闲

14、的1616位扩展槽并位扩展槽并将声卡插入扩展槽,声卡一般应尽可能远离显示卡,将声卡插入扩展槽,声卡一般应尽可能远离显示卡,以防两者互相干扰;以防两者互相干扰;(3 3)连接来自)连接来自CD-ROMCD-ROM驱动器的音频线及声卡的输入驱动器的音频线及声卡的输入/输出线和游戏棒等;输出线和游戏棒等;(4 4)如果需要,将)如果需要,将CD-ROMCD-ROM驱动器的接口电缆插在卡驱动器的接口电缆插在卡上相应的接口上,并将上相应的接口上,并将CD-ROMCD-ROM的音频输出线接到声的音频输出线接到声卡的针形输入线上;卡的针形输入线上;(5 5)连接诸如麦克风、外部音源和游戏棒等其它设)连接诸如

15、麦克风、外部音源和游戏棒等其它设备;备;(6 6)盖上机箱外壳,并将电源插头插回,待全部调)盖上机箱外壳,并将电源插头插回,待全部调试通过后再将固定螺丝拧紧。试通过后再将固定螺丝拧紧。202-14 2-14 音频编码基础音频编码基础 从信息保持的角度讲从信息保持的角度讲,只有当信源本身只有当信源本身具有冗余度具有冗余度,才能对其进行压缩。根据统计才能对其进行压缩。根据统计分析结果,语音信号存在着多种冗余度,分析结果,语音信号存在着多种冗余度,其最主要部分可以分别从时域和频域来考其最主要部分可以分别从时域和频域来考虑。另外由于语音主要是给人听的,所以虑。另外由于语音主要是给人听的,所以考虑了人的

16、听觉机理,也能对语音信号实考虑了人的听觉机理,也能对语音信号实行压缩。行压缩。(教材(教材P41P41)212-15 2-15 音频编码的分类(教材音频编码的分类(教材P44P44)(1 1)基于音频数据的统计特性进行编码)基于音频数据的统计特性进行编码,其典型技术是波形编码。其典型技术是波形编码。(2 2)基于音频的声学参数,进行参数编码)基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重建可进一步降低数据率。其目标是使重建音频保持原音频的特性。音频保持原音频的特性。(3 3)基于人的听觉特性进行编码:从人的)基于人的听觉特性进行编码:从人的听觉系统出发,利用掩蔽效应,设计心

17、听觉系统出发,利用掩蔽效应,设计心理声学模型,从而实现更高效率的数字理声学模型,从而实现更高效率的数字音频的压缩。其中以音频的压缩。其中以MPEGMPEG标准中的高频标准中的高频编码和编码和Doldy AC-3Doldy AC-3最有影响。最有影响。22音频编码的分类如下:音频编码的分类如下:1)基于音频数据的统计特性进行编码)基于音频数据的统计特性进行编码典型技术是波形编码:典型技术是波形编码:PCM(脉冲编码调制)(脉冲编码调制)DPCM(线性预测或差值脉冲编码调制)(线性预测或差值脉冲编码调制)APCM(自适应量化编码)(自适应量化编码)ADPCM(自适应差分脉冲编码调制)(自适应差分脉

18、冲编码调制)2)基于音频的声学参数,进行参数编码)基于音频的声学参数,进行参数编码3)基于人的听觉特性进行编码)基于人的听觉特性进行编码232-16 2-16 音频编码算法和标准(表)音频编码算法和标准(表)CCITT,ISOCCITT,ISO(1 1)G.711 G.711、G.721 G.721、G.722 G.722、G.728 G.728(2 2)MPEGMPEG中的音频编码中的音频编码 (3 3)AC-3AC-3编码和解码编码和解码24l律律l律压扩的数学解析式:律压扩的数学解析式:ll其中:其中:x为输入信号的归一化值;为输入信号的归一化值;y为压扩后的为压扩后的信号。对话音信号编

19、码,常采用信号。对话音信号编码,常采用=255,这样,这样适量化信噪比改善约适量化信噪比改善约24dB。l2、A律律l其特性可表示为:其特性可表示为:lll很明显,小信号时为线性特性,大信号时近似很明显,小信号时为线性特性,大信号时近似为对数特性。这种压扩特性常把压缩、量化和为对数特性。这种压扩特性常把压缩、量化和编码合为一体。编码合为一体。A律可用律可用13段折线逼近(相当段折线逼近(相当于),便于用数字电路实现。于),便于用数字电路实现。252-17 AC-32-17 AC-3编码和解码(教材编码和解码(教材P49-53P49-53)(1)AC-3(1)AC-3编码编码(2)AC-3(2)

20、AC-3解码解码26AC-3可编程解码器可编程解码器(图)(图)AC-3编码器框图编码器框图(图)(图)AC-3编码流程图编码流程图(图(图2.17)同步帧结构图同步帧结构图(图)(图)AC-3解码器框图解码器框图(图(图2.19)272-18 2-18 音乐合成音乐合成l音的分类音的分类:乐音、乐音、噪音噪音l根据音振动状态的规则与不规则,音被分为乐根据音振动状态的规则与不规则,音被分为乐音与噪音两类。音与噪音两类。l音乐中使用的主要是乐音,但噪音在是音乐表音乐中使用的主要是乐音,但噪音在是音乐表现中必不可少。如架子鼓发出的声响就是一种噪现中必不可少。如架子鼓发出的声响就是一种噪音,不过,这

21、种噪音有一定的规律。音,不过,这种噪音有一定的规律。l一个乐音,包括必备的三要素:音高、音色和一个乐音,包括必备的三要素:音高、音色和响度。若把一个乐音放在运动的旋律中,它还应响度。若把一个乐音放在运动的旋律中,它还应具备时值具备时值持续时间。这些要素的理想配合是产持续时间。这些要素的理想配合是产生优美动听的旋律的必要条件。生优美动听的旋律的必要条件。28音高:音高:音高指声波的基频。基频越低,给人的音高指声波的基频。基频越低,给人的感觉越低沉。音阶与频率的对应关系感觉越低沉。音阶与频率的对应关系音色:音色:声音的音质。由声音的频谱决定的:各声音的音质。由声音的频谱决定的:各阶谐波的比例不同,

22、随时间衰减的程度不同,阶谐波的比例不同,随时间衰减的程度不同,音色就不同。音色就不同。响度:响度:响度是对声音强度的衡量,它是听判乐响度是对声音强度的衡量,它是听判乐音的基础。音的基础。29音乐合成技术的种类:音乐合成技术的种类:调频调频(FM)音乐合成技术。音乐合成技术。FM是使高频震荡波的频率按调制信号是使高频震荡波的频率按调制信号规律变化的一种调制方式。规律变化的一种调制方式。30波形表波形表(Wavetable)(Wavetable)音乐合成技术。音乐合成技术。乐器发出的声音进行采样后,将数字乐器发出的声音进行采样后,将数字音频信号存储在音频信号存储在ROMROM芯片或硬盘中,进行合芯

23、片或硬盘中,进行合成时将再将相应乐器的波形记录播放出来,成时将再将相应乐器的波形记录播放出来,即波形表音乐合成技术。即波形表音乐合成技术。音乐系统框图音乐系统框图(P55图)图)312-19 MIDI2-19 MIDI规范(教材规范(教材P55P55)MIDI(Musical Instrument Digital MIDI(Musical Instrument Digital Interface)Interface)是乐器数字接口的缩写,泛指是乐器数字接口的缩写,泛指数字音乐的国际标准。数字音乐的国际标准。MIDIMIDI标准规定了不同厂家的电子乐器与计标准规定了不同厂家的电子乐器与计算机连接

24、的电缆和硬件。它还指定从一个算机连接的电缆和硬件。它还指定从一个装置传送数据到另一个装置的通信协议。装置传送数据到另一个装置的通信协议。这样,任何电子乐器,只要有处理这样,任何电子乐器,只要有处理MIDIMIDI信信息的处理器和适当的硬件接口都能变成息的处理器和适当的硬件接口都能变成MIDIMIDI装置。装置。MIDIMIDI间靠这个接口传递消息而间靠这个接口传递消息而进行彼此通信。进行彼此通信。32MIDIMIDI是音乐与计算机结合的产物。是音乐与计算机结合的产物。什么时候使用什么时候使用MIDIMIDI?长时间高质量音乐长时间高质量音乐以音乐做背景音响效果,同时从以音乐做背景音响效果,同时

25、从CDROMCDROM中中装载其他数据装载其他数据以音乐做背景音响效果,同时播放波形音以音乐做背景音响效果,同时播放波形音频或实现文语转换,以实现音乐和语音同频或实现文语转换,以实现音乐和语音同时输出。时输出。332-20 MIDI2-20 MIDI的技术规范的技术规范1988年,年,MIDI制造商协会正式公布制造商协会正式公布MIDI技技术规范第一版(),作为数字式音乐的国际标准。术规范第一版(),作为数字式音乐的国际标准。MIDI是由软件和硬件两部分共同组成的系统规范,它定义了电子合成器、定序器、节拍器、个人计算机和其他电子乐器的相互连接性和通信协议。相互连接性定义了使这些不同的MIDI仪器能够相互连接的接线方式、连接器类型,和输入输出线路。通信协议定义了能够控制乐器声音和消息(包括:发出反应,发出状态,及发出系统独有)的标准多字节消息。34MIDI硬件规范:硬件规范:MIDI硬件规范要求硬件规范要求5针针DIN连接器,用于连接器,用于MIDIIN,MIDIOUT和和MIDITHRU信号信号的引线面板安装的引线面板安装(如图如图)。35MIDI通信协议通信协议:MIDI通信协议使用多字节消息,字节数取决于消息的类型。有通道消息和系统消息两种类型的消息。36小结:小结:P70作业作业:、2.7、

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!