[精选]多媒体技术ppt好资源-第04讲数字声音基础

上传人:仙*** 文档编号:232265212 上传时间:2023-09-15 格式:PPTX 页数:43 大小:422.87KB
收藏 版权申诉 举报 下载
[精选]多媒体技术ppt好资源-第04讲数字声音基础_第1页
第1页 / 共43页
[精选]多媒体技术ppt好资源-第04讲数字声音基础_第2页
第2页 / 共43页
[精选]多媒体技术ppt好资源-第04讲数字声音基础_第3页
第3页 / 共43页
资源描述:

《[精选]多媒体技术ppt好资源-第04讲数字声音基础》由会员分享,可在线阅读,更多相关《[精选]多媒体技术ppt好资源-第04讲数字声音基础(43页珍藏版)》请在装配图网上搜索。

1、数字声音基础数字声音基础第第 4 章章4.14.1 基本概念基本概念基本概念基本概念 声音概念声音概念声音概念声音概念 声音频率分布声音频率分布声音频率分布声音频率分布 音质与音质与音质与音质与 数据量数据量数据量数据量 数字音频文件的种类数字音频文件的种类数字音频文件的种类数字音频文件的种类4.24.2 声音编码方法声音编码方法声音编码方法声音编码方法 声音编码分类声音编码分类声音编码分类声音编码分类 LPC LPC MP3MP34.34.3 音频编辑工具音频编辑工具音频编辑工具音频编辑工具AuditionAudition 单音轨形式录音单音轨形式录音单音轨形式录音单音轨形式录音 音频编辑与

2、处理音频编辑与处理音频编辑与处理音频编辑与处理 多音轨混合多音轨混合多音轨混合多音轨混合 多音轨录音多音轨录音多音轨录音多音轨录音4.14.1 基本概念基本概念基本概念基本概念 声音定义声音定义声音定义声音定义声音是声音是声音是声音是通通通通过过空气空气空气空气传传播的一种播的一种播的一种播的一种连续连续的的的的振动波,具有振动波,具有振动波,具有振动波,具有振幅、周期振幅、周期振幅、周期振幅、周期和和和和频率频率频率频率。声音用声音用声音用声音用电电表示表示表示表示时时,声音信号在,声音信号在,声音信号在,声音信号在时间时间和幅度上都是和幅度上都是和幅度上都是和幅度上都是连续连续的模的模的模

3、的模拟拟信信信信号,如号,如号,如号,如图图所示所示所示所示。教学进程教学进程教学进程教学进程4.1.14.1.1声音的基本特点声音的基本特点声音的基本特点声音的基本特点 声音的质量声音的质量声音的质量声音的质量简称音质。音质与频率范围成正比,频率范围越宽音质越好简称音质。音质与频率范围成正比,频率范围越宽音质越好简称音质。音质与频率范围成正比,频率范围越宽音质越好简称音质。音质与频率范围成正比,频率范围越宽音质越好声音具有连续性和过程性,数据前后相关,数据量大,具有实时性声音具有连续性和过程性,数据前后相关,数据量大,具有实时性声音具有连续性和过程性,数据前后相关,数据量大,具有实时性声音具

4、有连续性和过程性,数据前后相关,数据量大,具有实时性 声音的连续时基性声音的连续时基性声音的连续时基性声音的连续时基性 声音三要素声音三要素声音三要素声音三要素(1)(1)音调音调音调音调 (高低高低高低高低)频率频率频率频率(2)(2)音强音强音强音强 (强弱强弱强弱强弱)音高音高音高音高(3)(3)音色音色音色音色 (特质特质特质特质)泛音泛音泛音泛音教学进程教学进程教学进程教学进程 声音的频谱声音的频谱声音的频谱声音的频谱分为线性频谱和连续频谱。分为线性频谱和连续频谱。分为线性频谱和连续频谱。分为线性频谱和连续频谱。声音频率分布声音频率分布声音频率分布声音频率分布次声波次声波次声波次声波

5、人耳可听域人耳可听域人耳可听域人耳可听域超声波超声波20Hz 2020,000Hz20,000Hz 20,000Hz女女性性语语音音150Hz 150Hz 3,000Hz 3,000Hz电电话话语语音音200Hz 200Hz 3,400Hz 3,400Hz调调 幅幅 广广 播播(AM)50Hz 50Hz 7,000Hz 7,000Hz调调 频频 广广 播播(FM)20Hz 20Hz 15,000Hz 15,000Hz高高级级音音响响3Hz 3Hz 40,000Hz 40,000Hz男男性性语语音音30Hz 30Hz 9,000Hz 9,000Hz声声声声源源源源种种种种类类类类频频频频带带带带

6、宽宽宽宽度度度度4.1.24.1.2教学进程教学进程教学进程教学进程(1)人耳对不同频段的声音的敏感程度不同 如:对低频敏感一些,3-5K最敏感。(2)不同频率有不同的听觉阈值。(3)人的听觉具有掩蔽效应。和环境有关。同样大小声音在嘈杂环境就会听不清。听觉特性听觉特性听觉特性听觉特性4.1.24.1.24.1.34.1.3 数字化声音数字化声音数字化声音数字化声音教学进程教学进程教学进程教学进程 数字信号处理器数字信号处理器(digital signal processor(digital signal processor,DSP)DSP)DSPDSP与通用微处理器相比,除了它们的结构不同外,

7、其基本差别是,与通用微处理器相比,除了它们的结构不同外,其基本差别是,DSPDSP有能力响应和处理采样模拟信号得到的数据流,如做乘法和累加有能力响应和处理采样模拟信号得到的数据流,如做乘法和累加求和运算。求和运算。在数字域而不在模拟域中做信号处理的主要优点是:首先,在数字域而不在模拟域中做信号处理的主要优点是:首先,数字信号计算是一种精确的运算方法,它不受时间和环境变化的影响;数字信号计算是一种精确的运算方法,它不受时间和环境变化的影响;其次,表示部件功能的数学运算不是物理上实现的功能部件,而是仅其次,表示部件功能的数学运算不是物理上实现的功能部件,而是仅用数学运算去模拟,其中的数学运算也相对

8、容易实现;此外,可以对用数学运算去模拟,其中的数学运算也相对容易实现;此外,可以对数字运算部件进行编程,如欲改变算法或改变某些功能,还可对数字数字运算部件进行编程,如欲改变算法或改变某些功能,还可对数字部件进行再编程。部件进行再编程。4.1.34.1.3 数字化声音数字化声音数字化声音数字化声音 模拟信号与数字信号模拟信号与数字信号模拟信号与数字信号模拟信号与数字信号教学进程教学进程教学进程教学进程话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时间上度上也是连续的。在时间上“连续连续”是指在一个指定的时间范围里

9、声音是指在一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上信号的幅值有无穷多个,在幅度上“连续连续”是指幅度的数值有无穷多个。是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。我们把在时间和幅度上都是连续的信号称为模拟信号。在某些特定的时刻对这种模拟信号进行测量叫做采样在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling)(sampling),由这些特定时刻采样得到的信号称为离散时间信号。,由这些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取是无穷多个实数值中的一个,因

10、此幅度还是连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号离散幅度信号。例如,假设输入电压的范围是0.0V0.7V,并假设它的取值只限定在0、0.1、0.2,0.7共8个值。如果采样得到的幅度值是0.123V,它的取值就应算作0.1V,如果采样得到的幅度值是0.26V,它的取值就算作0.3,这种数值就称为离散数值。我们把时间和幅度都用离散的数字表示的信号就称为数字信号。4.1.34.1.3 数字化声音数字化声音数字化声音数字化声音 声音声音声音声音采样采样采样采样 声音数字化声音数字化声音数字化声音数字化(

11、模模模模/数转换数转换数转换数转换)声音采样声音采样声音采样声音采样131130 130131131130 130131把声音把声音把声音把声音(模拟量模拟量模拟量模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列按照固定时间间隔,转换成有限个数字表示的离散序列按照固定时间间隔,转换成有限个数字表示的离散序列按照固定时间间隔,转换成有限个数字表示的离散序列教学进程教学进程教学进程教学进程4.1.34.1.3 数字化声音数字化声音数字化声音数字化声音 声音声音声音声音量化量化量化量化 声音数字化声音数字化声音数字化声音数字化(模模模模/数转换数转换数转换数转换)教学进程教学进程教学进程教学

12、进程连续幅度的离散化通过量化连续幅度的离散化通过量化(quantization)(quantization)来实现,就是把信号的强来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化。化。4.1.34.1.3 数字化声音数字化声音数字化声音数字化声音教学进程教学进程教学进程教学进程 声音数字化需要回答两个问题声音数字化需要回答两个问题每秒钟需要采集多少个声音样本,也就是采样频率每秒钟需要采集多少个声音样本,也就是采样频率(f(fs s)是多少,是多少,每个声音样本的位数每个声音样本的位数(bit per

13、 sample(bit per sample,bps)bps)应该是多少,也就是应该是多少,也就是量化精度。量化精度。4.1.34.1.3 数字化声音数字化声音数字化声音数字化声音教学进程教学进程教学进程教学进程 采样频率采样频率采样频率的高低是根据采样频率的高低是根据奈奎斯特理论奈奎斯特理论(Nyquist theory)(Nyquist theory)和声音信号本身和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫高频率的两倍,这样就能把以数

14、字表达的声音还原成原来的声音,这叫做无损数字化做无损数字化(lossless digitization)(lossless digitization)。采样定律用公式表示为采样定律用公式表示为 f fs 2s 2f f 或者或者 Ts T/2 Ts T/2其中其中f f为被采样信号的最高频率。为被采样信号的最高频率。你可以这样来理解奈奎斯特理论:声音信号可以看成由许许多多正弦波你可以这样来理解奈奎斯特理论:声音信号可以看成由许许多多正弦波组成的,一个振幅为组成的,一个振幅为A A、频率为、频率为f f的正弦波至少需要两个采样样本表示,的正弦波至少需要两个采样样本表示,因此,如果一个信号中的最高

15、频率为因此,如果一个信号中的最高频率为 ,采样频率最低要选择采样频率最低要选择2 2 。例。例如,电话话音的信号频率约为如,电话话音的信号频率约为3.4 kHz3.4 kHz,采样频率就选为,采样频率就选为8 kHz8 kHz。样本大小是用每个声音样本的位数样本大小是用每个声音样本的位数bit/s(bit/s(即即bps)bps)表示的,它反映度量表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用声音波形幅度的精度。例如,每个声音样本用1616位位(2(2字节字节)表示,测得的声表示,测得的声音样本值是在音样本值是在0 06553665536的范围里,它的精度就是输入信号的的范围里,它

16、的精度就是输入信号的1/655361/65536。样本。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。采样精度的另一种表示方法是信号噪声比,简称为信噪比采样精度的另一种表示方法是信号噪声比,简称为信噪比(signal-to-(signal-to-noise rationoise ratio,SNR)SNR),并用下式计算:,并用下式计算:SNRSNR 10log(10log(V Vsigna

17、lsignal)2 2/(/(V Vnoisenoise)2 2 20 log(20 log(V Vsignalsignal /V Vnoisenoise)其中,其中,V Vsignalsignal表示信号电压,表示信号电压,V Vnoisenoise表示噪声电压;表示噪声电压;SNRSNR的单位为分贝的单位为分贝(db)(db)例1:假设Vnoise1,采样精度为1位表示Vsignal21,它的信噪比SNR6分贝。假设Vnoise1,采样精度为16位表示Vsignal216,它的信噪比SNR96分贝。4.1.34.1.3 数字化声音数字化声音数字化声音数字化声音 采样精度采样精度4.1.34

18、.1.3 数字化声音数字化声音数字化声音数字化声音 声音重放声音重放声音重放声音重放 声音模拟化声音模拟化声音模拟化声音模拟化(数数数数/模转换模转换模转换模转换)声音重放声音重放声音重放声音重放131130131130把数字化声音转换成模拟量,经过音响单元重放出来把数字化声音转换成模拟量,经过音响单元重放出来把数字化声音转换成模拟量,经过音响单元重放出来把数字化声音转换成模拟量,经过音响单元重放出来教学进程教学进程教学进程教学进程 重放频率重放频率重放频率重放频率(模拟量模拟量模拟量模拟量)与采样频率与采样频率与采样频率与采样频率(数字量数字量数字量数字量)的关系的关系的关系的关系重放频率重

19、放频率重放频率重放频率 采样频率采样频率采样频率采样频率 2 2 例例例例 采样频率为采样频率为采样频率为采样频率为44,100Hz44,100Hz的数字音频信号还原成声音后,为的数字音频信号还原成声音后,为的数字音频信号还原成声音后,为的数字音频信号还原成声音后,为22,050Hz22,050Hz教学进程教学进程教学进程教学进程 设备和软件设备和软件设备和软件设备和软件(1)(1)声音适配器声音适配器声音适配器声音适配器(声卡声卡声卡声卡)8bit)8bit、16bit16bit、128bit 128bit(2)(2)声卡驱动软件以及各种声音处理软件声卡驱动软件以及各种声音处理软件声卡驱动软

20、件以及各种声音处理软件声卡驱动软件以及各种声音处理软件4.1.34.1.3 数字化声音数字化声音数字化声音数字化声音采样频率采样频率采样频率采样频率 Hz Hz数据长度数据长度数据长度数据长度 bit bit数据量分钟数据量分钟数据量分钟数据量分钟11,02511,0258 80.66 MB0.66 MB22,05022,0508 81.32 MB1.32 MB44,10044,1008 82.64 MB2.64 MB11,02511,02516161.32 MB1.32 MB22,05022,05016162.64 MB2.64 MB44,10044,10016165.29 MB5.29 M

21、B音质评价音质评价音质评价音质评价低低低低一般一般一般一般良好良好良好良好中中中中良好良好良好良好优秀优秀优秀优秀音质与数据量音质与数据量音质与数据量音质与数据量4.1.4 4.1.4 数字音频的数字音频的数字音频的数字音频的教学进程教学进程教学进程教学进程质量质量采样频率采样频率(kHz)(kHz)样本精度样本精度(bit/s)(bit/s)单道声单道声/立体声立体声数据率数据率(kB/s)(kB/s)(未压缩未压缩)频率范围频率范围电话电话*8 88 8单道声单道声8 8 2002003 400 Hz3 400 HzAMAM11.02511.0258 8单道声单道声11.011.0507

22、000HzFMFM22.05022.0501616立体声立体声88.2 88.2 CDCD44.144.11616立体声立体声176.4176.4202020 000 Hz20 000 HzDATDAT48481616立体声立体声192.0192.0202020 000 Hz20 000 Hz音质与数据量音质与数据量音质与数据量音质与数据量4.1.4 4.1.4 数字音频的数字音频的数字音频的数字音频的2015 000Hz4.1.54.1.5.wav.wav WAVE(WAVE(WWaveform Audio)aveform Audio)波形音频文件波形音频文件波形音频文件波形音频文件 多媒体

23、系统、音乐光盘制作,记录物理波形,数据量大多媒体系统、音乐光盘制作,记录物理波形,数据量大多媒体系统、音乐光盘制作,记录物理波形,数据量大多媒体系统、音乐光盘制作,记录物理波形,数据量大.cda.cda CDA(CDA(CD ACD Audio)udio)激光音频文件激光音频文件激光音频文件激光音频文件 准确记录声波,数据量大,经过采样,生成准确记录声波,数据量大,经过采样,生成准确记录声波,数据量大,经过采样,生成准确记录声波,数据量大,经过采样,生成wavwav和和和和mp3mp3音频文件音频文件音频文件音频文件.mid.mid MIDI(MIDI(MMusicalusical I Ins

24、trument nstrument D Digital igital I Interface)nterface)乐器接口文件乐器接口文件乐器接口文件乐器接口文件 用于合成、游戏,记录音符时值、频率、音色特征,数据量小用于合成、游戏,记录音符时值、频率、音色特征,数据量小用于合成、游戏,记录音符时值、频率、音色特征,数据量小用于合成、游戏,记录音符时值、频率、音色特征,数据量小.mp3.mp3 mp3(mp3(MPEGMPEG音频压缩标准音频压缩标准音频压缩标准音频压缩标准)压缩音频文件压缩音频文件压缩音频文件压缩音频文件 必须经过解压缩,数据量小必须经过解压缩,数据量小必须经过解压缩,数据量小

25、必须经过解压缩,数据量小 文件种类及特点文件种类及特点文件种类及特点文件种类及特点数字音频文件的种类数字音频文件的种类数字音频文件的种类数字音频文件的种类教学进程教学进程教学进程教学进程文件的扩展名文件的扩展名说明说明auauSunSun和和NeXTNeXT公司的声音文件存储格式公司的声音文件存储格式(8(8位位m m 律编码或者律编码或者1616位线性编码位线性编码)aif(Audio aif(Audio Interchange)Interchange)AppleApple计算机上的声音文件存储格式计算机上的声音文件存储格式cmf(Creative Music cmf(Creative Mu

26、sic Format)Format)声霸声霸(SB)(SB)卡带的卡带的MIDIMIDI文件存储格式文件存储格式mctmctMIDIMIDI文件存储格式文件存储格式mff(MIDI Files mff(MIDI Files Format)Format)MIDIMIDI文件存储格式文件存储格式mid(MIDI)mid(MIDI)WindowsWindows的的MIDIMIDI文件存储格式文件存储格式mp2mp2MPEG Layer I,IIMPEG Layer I,IImp3mp3MPEG Layer IIIMPEG Layer IIImod(Module)mod(Module)MIDIMIDI

27、文件存储格式文件存储格式rm(RealMedia)rm(RealMedia)RealNetworksRealNetworks公司的流放式声音文件格式公司的流放式声音文件格式ra(RealAudio)ra(RealAudio)RealNetworksRealNetworks公司的流放式声音文件格式公司的流放式声音文件格式rolrolAdlibAdlib声音卡文件存储格式声音卡文件存储格式snd(sound)snd(sound)AppleApple计算机上的声音文件存储格式计算机上的声音文件存储格式seqseqMIDIMIDI文件存储格式文件存储格式sngsngMIDIMIDI文件存储格式文件存储

28、格式voc(Creative voc(Creative Voice)Voice)声霸卡存储的声音文件存储格式声霸卡存储的声音文件存储格式wavwav(Waveform)*(Waveform)*WindowsWindows采用的波形声音文件存储格式采用的波形声音文件存储格式wrkwrkCakewalk ProCakewalk Pro软件采用的软件采用的MIDIMIDI文件存储格式文件存储格式用用.wav.wav为扩展名的文件格式称为波形文件格式为扩展名的文件格式称为波形文件格式(WAVE File(WAVE File Format)Format),它在多媒体编程接口和数据规范,它在多媒体编程接口

29、和数据规范1.0(Multimedia 1.0(Multimedia Programming Interface and Data Specifications 1.0)Programming Interface and Data Specifications 1.0)文档中有详文档中有详细的描述。该文档是由细的描述。该文档是由IBMIBM和微软公司于和微软公司于19911991年年8 8月联合开发的,它是月联合开发的,它是一种为交换多媒体资源而开发的资源交换文件格式一种为交换多媒体资源而开发的资源交换文件格式(Resource(Resource Interchange File Format

30、Interchange File Format,RIFF)RIFF)。波形文件格式支持存储各种采样频率和样本精度的声音数据,并波形文件格式支持存储各种采样频率和样本精度的声音数据,并支持声音数据的压缩。支持声音数据的压缩。.WAV.WAV声音文件声音文件声音文件声音文件4.1.54.1.5 数字音频文件的种类数字音频文件的种类数字音频文件的种类数字音频文件的种类波形文件有许多不同类型的文件构造块组成,其中最主要的两个波形文件有许多不同类型的文件构造块组成,其中最主要的两个文件构造块是文件构造块是Format Chunk(Format Chunk(格式块格式块)和和Sound Data Chun

31、k(Sound Data Chunk(声音数据声音数据块块)。格式块包含有描述波形的重要参数,例如采样频率和样本精度。格式块包含有描述波形的重要参数,例如采样频率和样本精度等,声音数据块则包含有实际的波形声音数据。等,声音数据块则包含有实际的波形声音数据。RIFFRIFF中的其他文件块中的其他文件块是可选择的。它的简化结构如图所示。是可选择的。它的简化结构如图所示。.WAV.WAV声音文件声音文件声音文件声音文件4.1.54.1.5 数字音频文件的种类数字音频文件的种类数字音频文件的种类数字音频文件的种类MIDI是是Musical Instrument Digital Interface的首写

32、字母组合词,的首写字母组合词,可译成可译成“电子乐器数字接口电子乐器数字接口”。用于在音乐合成器。用于在音乐合成器(music synthesizers)、乐器、乐器(musical instruments)和计算机之间交换音乐和计算机之间交换音乐信息的一种标准协议。从信息的一种标准协议。从2020世纪世纪8080年代初期开始,年代初期开始,MIDI已经逐步被音已经逐步被音乐家和作曲家广泛接受和使用。乐家和作曲家广泛接受和使用。MIDI是乐器和计算机使用的标准语言,是乐器和计算机使用的标准语言,是一套指令是一套指令(即命令的约定即命令的约定),它指示乐器即,它指示乐器即MIDI设备要做什么,怎

33、么设备要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。做,如演奏音符、加大音量、生成音响效果等。MIDI不是声音信号,不是声音信号,在在MIDI电缆上传送的不是声音,而是发给电缆上传送的不是声音,而是发给MIDI设备或其它装置让它设备或其它装置让它产生声音或执行某个动作的指令。产生声音或执行某个动作的指令。MIDI MIDI 简介简介简介简介4.1.64.1.6电子乐器数字接口电子乐器数字接口电子乐器数字接口电子乐器数字接口(MIDIMIDI)系统系统系统系统可以同时播放可以同时播放WAVE文件和文件和MIDI文件来一起播放语音和音乐;不文件来一起播放语音和音乐;不能同时播放两个波形文

34、件,因为播放采样声音时要求准确的同步。能同时播放两个波形文件,因为播放采样声音时要求准确的同步。MIDI MIDI 标准之所以受到欢迎,主要是它有下列几个优点:标准之所以受到欢迎,主要是它有下列几个优点:标准之所以受到欢迎,主要是它有下列几个优点:标准之所以受到欢迎,主要是它有下列几个优点:生成的文件比较小生成的文件比较小生成的文件比较小生成的文件比较小,因为,因为,因为,因为MIDIMIDI文件存储的是命令,而不是声音波形;文件存储的是命令,而不是声音波形;文件存储的是命令,而不是声音波形;文件存储的是命令,而不是声音波形;容易编辑容易编辑容易编辑容易编辑,因为编辑命令比编辑声音波形要容易得

35、多;,因为编辑命令比编辑声音波形要容易得多;,因为编辑命令比编辑声音波形要容易得多;,因为编辑命令比编辑声音波形要容易得多;可以作背景音乐可以作背景音乐可以作背景音乐可以作背景音乐,因为,因为,因为,因为MIDIMIDI音乐可以和其它的媒体,如数字电视、音乐可以和其它的媒体,如数字电视、音乐可以和其它的媒体,如数字电视、音乐可以和其它的媒体,如数字电视、图形、动画、话音等一起播放,这样可以加强演示效果。图形、动画、话音等一起播放,这样可以加强演示效果。图形、动画、话音等一起播放,这样可以加强演示效果。图形、动画、话音等一起播放,这样可以加强演示效果。MIDI MIDI 文件文件文件文件的优点的

36、优点的优点的优点4.1.64.1.6电子乐器数字接口电子乐器数字接口电子乐器数字接口电子乐器数字接口(MIDIMIDI)系统系统系统系统产生产生MIDI乐音的方法很多,现在用得较多的方法有两种:乐音的方法很多,现在用得较多的方法有两种:一种是一种是(frequency modulation,FM)合成法合成法,另一种是乐音样本合成法,也称为另一种是乐音样本合成法,也称为波形表波形表(Wavetable)合成法合成法。这两种方法目前主要用来生成音乐。这两种方法目前主要用来生成音乐。MIDI MIDI 的合成方法的合成方法的合成方法的合成方法4.1.64.1.6电子乐器数字接口电子乐器数字接口电子

37、乐器数字接口电子乐器数字接口(MIDIMIDI)系统系统系统系统 频率调制(频率调制(频率调制(频率调制(F FM M)合成法合成法合成法合成法4.1.64.1.6电子乐器数字接口电子乐器数字接口电子乐器数字接口电子乐器数字接口(MIDIMIDI)系统系统系统系统2020世纪世纪8080年代初,美国斯坦福大学年代初,美国斯坦福大学(Stanford University)(Stanford University)的一名的一名叫叫John ChowningJohn Chowning的研究生发明了一种产生乐音的新方法,这种方法称的研究生发明了一种产生乐音的新方法,这种方法称为数字式频率调制合成法为

38、数字式频率调制合成法(digital frequency modulation(digital frequency modulation synthesis)synthesis),简称为,简称为FMFM合成器。他把几种乐音的波形用数字来表达,合成器。他把几种乐音的波形用数字来表达,并且用数字计算机而不是用模拟电子器件把它们组合起来,通过数模并且用数字计算机而不是用模拟电子器件把它们组合起来,通过数模转换器转换器(digital to analog convertor(digital to analog convertor,DAC)DAC)来生成乐音。来生成乐音。频率调制(频率调制(频率调制(频

39、率调制(F FM M)合成法的原理合成法的原理合成法的原理合成法的原理4.1.64.1.6电子乐器数字接口电子乐器数字接口电子乐器数字接口电子乐器数字接口(MIDIMIDI)系统系统系统系统它由它由5 5个基本模块组成:个基本模块组成:数字载波器、调制器、声数字载波器、调制器、声音包络发生器、数字运算音包络发生器、数字运算器和模数转换器。器和模数转换器。声音包络发生器用来声音包络发生器用来调制声音的电平,这个过调制声音的电平,这个过程也称为幅度调制程也称为幅度调制(amplitude modulation)(amplitude modulation),并且作为数字式音量控,并且作为数字式音量控

40、制旋钮,它的制旋钮,它的4 4个参数写成个参数写成ADSRADSR,这条包络线也称为,这条包络线也称为音量升降维持静音包络线音量升降维持静音包络线(Attack(Attack,decaydecay,sustainsustain,releaserelease,ADSR)ADSR)包络线。包络线。频率调制(频率调制(频率调制(频率调制(F FM M)合成法的原理合成法的原理合成法的原理合成法的原理4.1.64.1.6电子乐器数字接口电子乐器数字接口电子乐器数字接口电子乐器数字接口(MIDIMIDI)系统系统系统系统在乐音合成器中,数字载波波形和调制波形有很多种,不同型号的在乐音合成器中,数字载波波

41、形和调制波形有很多种,不同型号的FMFM合成器所选用的波形也不同。下图是合成器所选用的波形也不同。下图是Yamaha OPL-IIIYamaha OPL-III数字式数字式FMFM合成器采用合成器采用的波形。的波形。各种不同乐音的产生是通过组合各种波形和各种波形参数并采用各种各种不同乐音的产生是通过组合各种波形和各种波形参数并采用各种不同的方法实现的。用什么样的波形作为数字载波波形、用什么样的波形不同的方法实现的。用什么样的波形作为数字载波波形、用什么样的波形作为调制波形、用什么样的波形参数去组合才能产生所希望的乐音,这就作为调制波形、用什么样的波形参数去组合才能产生所希望的乐音,这就是是FM

42、FM合成器的算法。合成器的算法。乐音样本合成声音的原理乐音样本合成声音的原理乐音样本合成声音的原理乐音样本合成声音的原理4.1.64.1.6电子乐器数字接口电子乐器数字接口电子乐器数字接口电子乐器数字接口(MIDIMIDI)系统系统系统系统这种方法就是这种方法就是把真实乐器发出的声音以数字的形式记录下来,播放时把真实乐器发出的声音以数字的形式记录下来,播放时改变播放速度,从而改变音调周期,生成各种音阶的音符。改变播放速度,从而改变音调周期,生成各种音阶的音符。乐音样本的采集相对比较直观。音乐家在真实乐器上演奏不同的音符,乐音样本的采集相对比较直观。音乐家在真实乐器上演奏不同的音符,选择选择44

43、.1 kHz44.1 kHz的采样频率、的采样频率、1616位的乐音样本,这相当于位的乐音样本,这相当于CD-DACD-DA的质量,的质量,把不同音符的真实声音记录下来,这就完成了乐音样本的采集。把不同音符的真实声音记录下来,这就完成了乐音样本的采集。乐音样本通常放在乐音样本通常放在ROMROM芯片上。芯片上。乐音样本合成器所需要的输入控制参数比较少,可控的数字音效也不乐音样本合成器所需要的输入控制参数比较少,可控的数字音效也不多,大多数采用这种合成方法的声音设备都可以控制声音包络的多,大多数采用这种合成方法的声音设备都可以控制声音包络的ADSRADSR参数,产生的声音质量比参数,产生的声音质

44、量比FMFM合成方法产生的声音质量要高。合成方法产生的声音质量要高。合成器或者声音发生器的合成器或者声音发生器的多音调多音调(polyphony)(polyphony)是一次演奏多个音符是一次演奏多个音符(note)(note)的能力。大多数早期的音乐合成器是单音调的,即一次仅演奏一个的能力。大多数早期的音乐合成器是单音调的,即一次仅演奏一个音符。如果在装配有单音调合成器音符。如果在装配有单音调合成器(monophonic synthesizer)(monophonic synthesizer)的键盘上同的键盘上同时按下时按下5 5个键,只能听到一个音符的声音;如果在装配有能支持个键,只能听到

45、一个音符的声音;如果在装配有能支持4 4个音调的个音调的合成器的键盘上同时按下合成器的键盘上同时按下5 5个键,可产生个键,可产生4 4个音符的声音。许多现代的声音个音符的声音。许多现代的声音模块有模块有1616,2424或者或者3232个音符的复调音。个音符的复调音。如果一个合成器或者声音发生器能够同时产生如果一个合成器或者声音发生器能够同时产生2 2个或者个或者2 2个以上的不同个以上的不同乐音,就说这个合成器或者声音发生器是乐音,就说这个合成器或者声音发生器是多音色多音色(multi-timbral)(multi-timbral)的。例的。例如,如果一个合成器能够同时演奏如,如果一个合成

46、器能够同时演奏5 5个音调个音调(notes)(notes),就说它是多音调的,就说它是多音调的(polyphonic)(polyphonic);如果一个合成器也能够同时产生钢琴声;如果一个合成器也能够同时产生钢琴声(piano sound)(piano sound)和和低音低音(bass sound)(bass sound),就说它是一个多音色,就说它是一个多音色(multi-timbral)(multi-timbral)合成器。合成器。合成器的多音调和多音色合成器的多音调和多音色合成器的多音调和多音色合成器的多音调和多音色4.1.64.1.6电子乐器数字接口电子乐器数字接口电子乐器数字接口

47、电子乐器数字接口(MIDIMIDI)系统系统系统系统 一个简单的一个简单的一个简单的一个简单的 MIDI MIDI 系统系统系统系统4.1.64.1.6电子乐器数字接口电子乐器数字接口电子乐器数字接口电子乐器数字接口(MIDIMIDI)系统系统系统系统上图表示的是一个简单的上图表示的是一个简单的MIDIMIDI系统,它由一个系统,它由一个MIDIMIDI键盘控制器键盘控制器和一个和一个MIDIMIDI声音模块组成。声音模块组成。许多许多MIDIMIDI键盘乐器在其内部既包含键盘控制器,又包含键盘乐器在其内部既包含键盘控制器,又包含MIDIMIDI声声音模块功能。在这些单元中,键盘控制器和声音模

48、块之间已经有内音模块功能。在这些单元中,键盘控制器和声音模块之间已经有内部链接,这个链接可以通过该设备中的控制功能部链接,这个链接可以通过该设备中的控制功能(local control)(local control)对对链接打开链接打开(ON)(ON)或者关闭或者关闭(OFF)(OFF)。4.2.14.2.14.2 4.2 声音编码方法声音编码方法声音编码方法声音编码方法声音编码分类声音编码分类声音编码分类声音编码分类(1)波形编码基于音频数据的统计特性 目标是使重建语音波形保持原波形的形状。如脉冲编码 调制等(2)参数编码基于音频的声学参数 目标是使重建音频保持原音频的特性。常用的音频参数有

49、共振峰、线性预测系数、滤波器组等。(3)混合 编码教学进程教学进程教学进程教学进程LPC是通过分析话音波形来产生是通过分析话音波形来产生声道激励和转移函数的参声道激励和转移函数的参数数,对声音波形的编码实际就转化为对这些参数的编码,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少。这就使声音的数据量大大减少。在接收端使用在接收端使用LPC分析得到的参数,通过分析得到的参数,通过话音合成器重构话音合成器重构话音。话音。合成器实际上是一个合成器实际上是一个离散的随时间变化的时变线性滤波器离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型。它代表人的话音生成系统模型

50、。时变线性滤波器既当作预测器使用,又当作合成器使用。时变线性滤波器既当作预测器使用,又当作合成器使用。4.2 4.2 声音编码方法声音编码方法声音编码方法声音编码方法4.2.24.2.2 线性预测编码线性预测编码(LPC)(LPC)4.2.24.2.2 线性预测编码线性预测编码(LPC)(LPC)=线性预测器是使用过去的线性预测器是使用过去的P P个样本值来预测现时刻的采样值个样本值来预测现时刻的采样值x(n)x(n),预测值可以用过去,预测值可以用过去P P个样本值的线性组合来表示:个样本值的线性组合来表示:残差误差残差误差(residual error)(residual error)即线

51、性预测误差为即线性预测误差为=4.2 4.2 声音编码方法声音编码方法声音编码方法声音编码方法在给定的时间范围里,如 ,使 的平方和即 为最小 通过求解偏微分方程,可找到系数通过求解偏微分方程,可找到系数ai ai 的值。如果把发的值。如果把发音器官等效成滤波器,这些系数值就可以理解成滤波音器官等效成滤波器,这些系数值就可以理解成滤波器的系数。这些参数不再是声音波形本身的值,而是器的系数。这些参数不再是声音波形本身的值,而是发音器官的激励参数。发音器官的激励参数。4.2 4.2 声音编码方法声音编码方法声音编码方法声音编码方法4.2.24.2.2 线性预测编码线性预测编码(LPC)(LPC)4

52、.2.34.2.3 GSMGSM编译码器编译码器GSM是是Global System for Mobile communications的缩写,可的缩写,可译成全球数字移动通信系统。译成全球数字移动通信系统。GSM算法是算法是1992年柏林技术大学年柏林技术大学(Technical University Of Berlin)根据根据GSM协议开发的,这个协协议开发的,这个协议是欧洲最流行的数字蜂窝电话通信协议。议是欧洲最流行的数字蜂窝电话通信协议。GSM的输入是帧的输入是帧(frame)数据,一帧数据,一帧(20毫秒毫秒)由采样频率为由采样频率为8 kHz的带符号的的带符号的160个样本组成,

53、每个样本为个样本组成,每个样本为13位或者位或者16位的线位的线性性PCM(linear PCM)码。码。GSM编码器可把一帧编码器可把一帧(16016位位)的数据压缩成的数据压缩成260位的位的GSM帧,压缩后的数据率为帧,压缩后的数据率为1625字节,相当于字节,相当于13 kb/s。由于由于260位不是位不是8位的整数倍,因此编码器输出的位的整数倍,因此编码器输出的GSM帧为帧为264位的线性位的线性PCM码。采样频率为码。采样频率为8 kHz、每个样本为、每个样本为16位的未压位的未压缩的话音数据率为缩的话音数据率为128 kb/s,使用,使用GSM压缩后的数据率为:压缩后的数据率为:

54、(264位位8000样本样本/秒秒)/160样本样本=13.2 千位千位/秒秒GSM的压缩比:的压缩比:128:13.2=9.7,近似于,近似于10:1。4.2 4.2 声音编码方法声音编码方法声音编码方法声音编码方法4.3 4.3 声音处理软件声音处理软件声音处理软件声音处理软件AuditionAudition4.3.1单音轨形式录音编辑界面;多轨界面。主要不同?主要步骤:1.文件-新建-选择属性(采样率、声道、量化位数)2.选项-录音控制台-选择录音源3.点击播放面板的录音按钮录制,完成后点击停止。4.文件-保存,选择类型(Windows PCM、Mp3 Pro)4.3 4.3 声音处理软

55、件声音处理软件声音处理软件声音处理软件AuditionAudition4.3.2 音频编辑与处理(1)消除环境噪声主要步骤:1.打开文件2.效果-修复-降噪3.单击降噪器-获取特性,适当选取数值(2)消除呼吸噪声等1.可以使用效果-静音2.复制与粘贴的使用3.选择波形后拖动振幅调节或者效果-振幅与压限-规格化4.3 4.3 声音处理软件声音处理软件声音处理软件声音处理软件AuditionAudition4.3.2 音频编辑与处理(3)声音效果处理主要步骤:1.打开文件2.效果-滤波与均衡-图示平衡一般男声主要是250-330HZ,1KHz提升会明亮些;64-100Hz提升会浑厚些女声250-5

56、23Hz,10KHz提升会细腻些,1-3KHz提升会明亮些。3.回声。效果-延迟与回声,选择适当数值。4.音调与音速。效果-时间与间距-变速,选择适当数值4.3 4.3 声音处理软件声音处理软件声音处理软件声音处理软件AuditionAudition4.3.3 多音轨混合主要步骤:1.多轨状态新建文件,导入2段声音。2.静音、独奏、音量调整等 3.左键与右键不同。4.编辑-合并到新轨-编辑,得到混缩文件,双击进入编辑状态。5.效果处理。效果-振幅与压限-渐变淡入与淡出。6.保存。4.3 4.3 声音处理软件声音处理软件声音处理软件声音处理软件AuditionAudition4.3.4 多音轨录

57、音主要步骤:1.多轨状态新建文件,导入伴奏音乐,保存会话。2.调节 音量大小,依次点击2个录音按钮。3.左键与右键不同。4.编辑-合并到新轨-编辑,得到混缩文件,双击进入编辑状态。5.效果处理。效果-振幅与压限-渐变淡入与淡出。6.保存。Adobe AuditionAdobe Audition声音处理实验声音处理实验声音处理实验声音处理实验1.录制一段语音(诗歌、散文、童谣等,题材不限),保存为yuyin.wav文件;2.将该yuyin.wav文件转换成yuyin.mp3文件;3.调整yuyin.mp3的音量到比较大,并添加回声;4.选择一段音乐(.wav或.mp3均可)作为背景音乐;5.调整

58、背景音乐的音量到比较小;6.将录制的语音与背景音乐混音,剪切掉多余的背景音乐,并设置淡入淡出效果;7.保存混音后的声音文件为hunyin.mp3。本章复习1.声音特性2.声音信号数字化方法3.MIDI4.Audition应用9、静夜四无邻,荒居旧业贫。9月-239月-23Thursday,September 14,202310、雨中黄叶树,灯下白头人。20:32:4220:32:4220:329/14/2023 8:32:42 PM11、以我独沈久,愧君相见频。9月-2320:32:4220:32Sep-2314-Sep-2312、故人江海别,几度隔山川。20:32:4220:32:4220:

59、32Thursday,September 14,202313、乍见翻疑梦,相悲各问年。9月-239月-2320:32:4220:32:42September 14,202314、他乡生白发,旧国见青山。14 九月 20238:32:42 下午20:32:429月-2315、比不了得就不比,得不到的就不要。九月 238:32 下午9月-2320:32September 14,202316、行动出成果,工作出财富。2023/9/14 20:32:4220:32:4214 September 202317、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。8:32:42 下午8:32

60、 下午20:32:429月-239、没有失败,只有暂时停止成功!。9月-239月-23Thursday,September 14,202310、很多事情努力了未必有结果,但是不努力却什么改变也没有。20:32:4220:32:4220:329/14/2023 8:32:42 PM11、成功就是日复一日那一点点小小努力的积累。9月-2320:32:4220:32Sep-2314-Sep-2312、世间成事,不求其绝对圆满,留一份不足,可得无限完美。20:32:4220:32:4220:32Thursday,September 14,202313、不知香积寺,数里入云峰。9月-239月-2320:

61、32:4220:32:42September 14,202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。14 九月 20238:32:42 下午20:32:429月-2315、楚塞三湘接,荆门九派通。九月 238:32 下午9月-2320:32September 14,202316、少年十五二十时,步行夺得胡马骑。2023/9/14 20:32:4220:32:4214 September 202317、空山新雨后,天气晚来秋。8:32:42 下午8:32 下午20:32:429月-239、杨柳散和风,青山澹吾虑。9月-239月-23Thursday,September 14,202

62、310、阅读一切好书如同和过去最杰出的人谈话。20:32:4220:32:4220:329/14/2023 8:32:42 PM11、越是没有本领的就越加自命不凡。9月-2320:32:4220:32Sep-2314-Sep-2312、越是无能的人,越喜欢挑剔别人的错儿。20:32:4220:32:4220:32Thursday,September 14,202313、知人者智,自知者明。胜人者有力,自胜者强。9月-239月-2320:32:4220:32:42September 14,202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。14 九月 20238:32:42 下午20:

63、32:429月-2315、最具挑战性的挑战莫过于提升自我。九月 238:32 下午9月-2320:32September 14,202316、业余生活要有意义,不要越轨。2023/9/14 20:32:4220:32:4214 September 202317、一个人即使已登上顶峰,也仍要自强不息。8:32:42 下午8:32 下午20:32:429月-23MOMODA POWERPOINTLorem ipsum dolor sit amet,consectetur adipiscing elit.Fusce id urna blandit,eleifend nulla ac,fringilla purus.Nulla iaculis tempor felis ut cursus.感感 谢谢 您您 的的 下下 载载 观观 看看专家告诉

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!