《音频信息处理》PPT课件

上传人:san****019 文档编号:16181697 上传时间:2020-09-22 格式:PPT 页数:33 大小:3.22MB
收藏 版权申诉 举报 下载
《音频信息处理》PPT课件_第1页
第1页 / 共33页
《音频信息处理》PPT课件_第2页
第2页 / 共33页
《音频信息处理》PPT课件_第3页
第3页 / 共33页
资源描述:

《《音频信息处理》PPT课件》由会员分享,可在线阅读,更多相关《《音频信息处理》PPT课件(33页珍藏版)》请在装配图网上搜索。

1、第2章 音频信息处理,21 音频处理基础 22 音频处理软件Adobe Audition 23 音频处理综合应用案例,2.1 音频处理基础,1. 声波 (1)声波:由各种机械振动或气流扰动引起周围的弹性媒质发生波动。 (2)声源:产生声波的物体,如人的声带和乐器等。 (3)声音:人的听觉系统所能感知到的声波。 音频的频率范围:20 Hz 20000 Hz 语音的频率范围:300 Hz 3000 Hz 次声波的频率范围: 20 kHz (4)声强:对于一定频率的声音,要能引起听觉,其声强也有一定的范围。 下限:是恰能引起人听觉的最小声强,叫做该频率的可闻阈; 上限:是指人耳能听闻的最大声强,高于

2、上限的声强,人耳感觉疼痛,所以叫做该频率的疼痛阈。,常见声音的分贝量级,2声音的基本特征,(1)声波信号的物理特征 周期(T):声波的两个波峰或波谷之间的相对时间。 频率(f):周期的倒数(f=1/T),即每秒波峰或波谷出现的次数。 幅度:从声波信号的基线到波峰的距离,幅度越大声波的强度也越大。通常也用声压、声强或声功率来表示声音的强弱。,人们感知到的声音特征称为心理学特征 音调:在音乐中又叫音高,是由发声物体的振动频率决定,振动越快(即频率越大),音调越高,振动越慢,音调越低。音调的高低与声音基频的对数(20*log)成线性关系。基频越低,给人的感觉是声音越低沉,基频频率增加一倍,在音乐上就

3、叫升高了一个八度。 音色:这是一个主观评价声音的量,声音的音色取决于声音的频谱结构,一般高次谐波越丰富,音色越明亮并具有穿透力。 响度:人耳对声音强弱的感觉程度,主要取决于振幅和声压。通常振幅越大声音越响,其次人耳距离声源越远,声音越小。,(2)声音信号的心理学特征,(3)声音质量的评价 声音质量与带宽有关,频率范围越宽,声音质量越高。 1)声音质量分级:按照声音信号的频率范围将声音质量分为5级。,2)信噪比(SNR):即有用信号与噪音信号的强度之比,单位是分贝。 3) 声音主观质量的度量:主观度量就是大多数人对声音质量的感觉。,3音频信号的表示,(1)音频信号:通过麦克风等设备转换成的电信号

4、。 规则音频信号:带有语音、音乐和音效的有规律的音频信号,承载了一定的信息。 语音:语言的载体,有丰富的语言内涵,是人类交流的信息载体。 音乐:是一种规范的符号化的声音。 音效:自然界中各种声音效果,如掌声、雷鸣声,爆破声等。 不规则音频信号:不包含任何信息的声音,比如噪声。 (2)音频信号的表示 音频信号的数学表示,0: 声音的基音,决定了音调的高低 n0: 声音的泛音,决定了声音的音色 An : 声波的振幅,表示声音的强弱,2)音频信号的波形表示,3)音频信号的频谱表示 声音信号的频率分布曲线。复杂的声音是由振幅和频率不同的正弦声波叠加而成的,这些正弦波的幅值按频率排列的图形就叫做频谱。

5、男声的基频较低,低频分量更加丰富,因此听起来会更加低沉、浑厚。,1. 音频信号数字化 声音信号在时间上是连续的,在幅度上也是连续的,属于模拟信号。 (1)采样 声音信号在时间上的离散化,即每隔一段时间抽取一个信号样本。 采样频率:每秒采样的次数。 奈奎斯特理论(Nyquist theory):采样频率不低于声音信号最高频率的两倍,这样就能把数字声音还原成原来的声音,称为无损数字化。 f s = 2 f max 电话话音信号的最高频率约为3.4kHz,所以采样频率取为8kHz。,2.1.2 音频信号的数字化,声音信号在幅度上的离散化 也就是采样过程中对每一个采样点的幅度值用数字量来表示。如果幅度

6、的划分是等间隔的,称为线性量化,否则为非线性量化。 采样精度:即量化的位数,位数越多量化等级数也越多,所能表示的声波幅度的动态范围也越大,当然需要的存储空间也越大。,(2) 量化,(3) 编码 就是用一组二进制码组来表示每一个有固定电平的量化值,或者说将量化值转换成二进制码组。 典型的音频编码方法:脉冲编码调制法(PCM)。 (4)数字音频的数据量 数据量 = 采样频率* 采样精度* 采样时间* 声道数 / 8 (字节数) 单声道:一次只产生一组声波数据, 立体声:一次产生两组声波数据。 例2.1 计算一分钟未压缩的高保真立体声数字声音数据的大小。 60 * ( 44100 * 16 * 2

7、) / 8 = 10.09 MB 一首未经压缩的4分钟的歌曲文件的大小约为40MB,那么一个容量为512MB的MP3播放器也只能播放12首这样的歌曲。,2. 数字音频压缩标准,(1)电话质量的语音压缩标准 (2)调幅广播语音压缩标准 G.722 (3)高保真立体声的宽带音频压缩标准,电话质量的语音压缩标准,MPEG音频:第一个高保真立体声音频压缩的国际标准 MPEG音频压缩标准提供三个独立的压缩层次: 1)Layer 1:编码器简单,输出数据率为384 kb/s,主要用于小型数字盒式磁带。 2)Layer 2:编码器较复杂,输出数据率为256 kb/s192kb/s,主要应用于数字广播声音、数

8、字音乐、CD-I和VCD等。 3)Layer 3:编码器复杂,输出数据率为64kb/s,主要用于ISDN上的声音传输。,1WAV文件:波形文件,微软开发,需要的存储量大,多用于存储简短的声音片段和旁白。 2MIDI文件:记录的是生成音乐的指令,MIDI文件短小。由于MIDI记录的并不是真正的声音,所以不同的声卡,不同软波表,不同硬件音源的音色是不相同的,相同的MIDI文件在不同的设备上播放也会有不同的效果。MIDI文件适合作为背景音乐来播放。 3MP3文件:是MPEG音频第3层的简称,有损压缩,压缩比达12:1。MP3利用人耳的掩蔽特性,削减音频中人耳听不到的成分,同时尽可能地维持原来的声音质

9、量。 4RA文件:属于Real Media的音频部分,采用流式传输方式,可以在非常低的带宽下提供足够好的音质让用户能在线聆听。 5WMA 文件:Windows Media的音频部分。无损压缩,支持多声道编码。 6AC3文件:又叫杜比数码环绕立体声,压缩比10:1,提供的环绕声系统由5个全频域声道和1个超低音声道组成,称为5.1声道,一般作为DVD的伴音。,3. 数字音频文件的格式,1. 数字音频技术 结合数字技术和计算机技术而实现传统音频处理的技术 (1) 特点 1)处理长样本文件的能力,录音时间只受硬盘本身大小的限制。 2)随机存取编辑 3)无损编辑 (2)应用 1)声音剪辑和CD刻录。 2

10、)日常音乐录制。 3)大规模音乐录音和混音。 4)影视音乐的制作与合成。 5)多媒体音乐制作与合成。,数字音频工作站,2.1.3 数字音频处理技术,2)语音识别系统分类 对说话人说话方式的要求 孤立字(词)语音识别系统 连接字语音识别系统 连续语音识别系统。 对说话人的依赖程度 特定人语音识别系统 非特定人语音识别系统 词汇量大小 小词汇量语音识别系统 中等词汇量语音识别系统 大词汇量语音识别系统 无限词汇量语音识别系统。,(1)语音识别技术 1)语音识别的发展 50年代:AT&T Bell实验室实现了第一个可识别十个英文数字的语音识别系统Audry系统。 60年代:提出动态规划(DP)和线性

11、预测分析技术(LP)。 70年代:提出了动态时间归正技术(DTW),矢量量化(VQ)和隐马尔可夫模型(HMM)理论,实现了特定人孤立语音识别系统。 90年代:开始进入实用阶段。,2. 智能语音处理技术,利用计算机合成语音的技术,使计算机具有类似人的说话能力。 语音合成的三个层次 从文字到语音 从概念到语音 从意向到语音 语音合成技术的特点 清晰度 自然度 表现力 复杂度 语音合成的应用 文语转换 语音查询,(2) 语音合成技术,2.2 音频处理软件 Adobe Audition,单轨编辑界面,2.2.3 Audition界面及基本操作,多轨编辑界面,2.2.4 音频信号获取 直接读取计算机磁盘

12、上的音频文件; 提取视频信息中的音频信号; 直接录音。Audition允许同时进行多音轨录音,当然需要有相应的硬件支持,比如多个音频输入接口、多个录音源等。,1录音前声卡设置 “选项 | Windows 录音控制台 ” 2建立录音文件 3导入伴奏音乐 4控制录音电平 5录制声音,2.2.5 音频编辑,单轨编辑状态:可以进行波形的各种编辑处理和效果的设置,还可以分别对左右声道单独进行编辑处理。 多轨编辑状态:适合对多个音频轨道进行编辑、录制和合成处理。最多可以同时处理的轨道数为128个。按钮“R”表示录音、“S”表示独奏、“M”表示静音。,1常用编辑 (1)裁剪音频波形 波形的选择 波形的删除

13、波形的移动与复制,混合工具:拖曳左键选中波形,拖曳右键移动波形。 时间选择工具:拖曳左键选中波形。 移动/复制剪辑工具:拖曳左键移动波形,拖曳右键移动或复制。 刷选工具:拖曳左键可以播放选中波形。,(2)切分和合并音频 在多轨编辑状态下,可以对活动音轨上的波形进行分割,使其变成多个波形片段,定位播放线,执行“剪辑|分割”或右击鼠标点选“分割”。 使两段波形首尾相接,按住Ctrl键将两段波形都选中,执行“剪辑|合并”或右击鼠标点选“合并”即可完成。 (3)锁定音频波形 锁定使音频的绝对时间位置不变。 (4)编组音频波形 编组则可以使多个音频片段的相对位置固定,移动时可整体移动。,2包络编辑,(1

14、)音量包络编辑 音量包络是指音频波形随时间变化而产生的音量变化,也即是音量变化的走势曲线。通过控制音量包络曲线来改变某音轨上音频信号的音量大小,是一个非常直观和简单有效的方法。 (2)声相包络编辑 声相就是声音在左右声道中所处的位置。声相包络线处于中间时(0点),声音在左右声道中达到平衡的效果,声相包络线位于上半部,声音偏向左声道,声相包络线位于下半部,声音偏向右声道。,(3)音量淡化包络编辑 Audition提供了简单快速的音量淡化包络。在音乐制作领域,淡化(fade)指音量的逐渐变化,音量由小到大变化称为淡入(fade in),音量由大到小变化称为淡出(fade out)。,3时间伸缩 用

15、于改变声音播放的速度,且不影响音高。 “查看|启用剪辑时间伸展”,时间伸缩,2.2.6 加载效果器 加载效果器按照使用方法可分为: 插入效果器:作用的声音范围是一整条音轨; 波形效果器:作用于音轨中的某一段音频片段; 总线效果器:加载在总线通道上的效果器,它使所有的音轨加入相同的效果器;,1插入效果器 多轨编辑下,2波形效果器 单轨编辑下,允许多个音频片段分别进行效果设置。,2.2.7 效果器,Audition的效果器按照功能分为: 振幅类效果器 滤波类效果器 延迟类效果器 降噪类效果器 波形发生类效果器 声码器,1动态处理效果器,属于幅度类效果器,用于将某个范围内的声音电平按比例增大或缩小。

16、,2嘶声抑制降噪器 降噪类效果器可以精确分析音频信号中的嗡嗡类噪音进行消除,也可以根据实际录音环境进行噪声消除。 嘶声抑制降噪器可以消除音频信号中的高频嘶嘶声。,3合奏效果器 属于延迟类效果器。对人声进行润色可以使发薄的声音变得厚实丰满。,合奏效果器,2.3 音频处理综合应用举例,2.3.1 消除人声,1、采用VST插件直接消除 菜单“效果|幅度|通道混音器”,在预设效果中选择“Vocal Cut” 2、将双声道转换为单声道 菜单“编辑|转换采样类型” 选中“单声道” 左混音:100% 右混音:-100%,2.3.2 穿插录音技术,穿插录音:用于对已经录制好的声音片段进行重新录制。 1、首先选

17、定不满意的声音片段 2、右击选择“穿插入”,选定部分变为空白,轨道左边的“R”处于按下状态 3、点按“录音”按钮,那么声音将自动录制在选定的片段。,选择要重新录音的片段,右击选择“穿插入”,进入录音状态,2.3.3 声音信号降噪处理,噪 声样本,“效果|恢复|降噪处理”,2.3.4 配乐诗朗诵制作,1、 导入背景音乐 2、 录制诗朗诵 3、 声音的降噪处理 4、 声音幅度调整 :使用效果器“幅度|包络”,可以把音量“高的压下来,低的提上去”,对声音的力度起到平衡的作用。 5、 人声润色 :使用“延迟效果器|混响”使录制的人声变得更为厚实和丰满。 6、 混音 :打开“混音器”,调整音量大小 7、 混缩输出 :“文件|导出|混缩音频”,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!