《通信声学》报告

上传人:z**** 文档编号:120504245 上传时间:2022-07-17 格式:DOC 页数:24 大小:816KB
收藏 版权申诉 举报 下载
《通信声学》报告_第1页
第1页 / 共24页
《通信声学》报告_第2页
第2页 / 共24页
《通信声学》报告_第3页
第3页 / 共24页
资源描述:

《《通信声学》报告》由会员分享,可在线阅读,更多相关《《通信声学》报告(24页珍藏版)》请在装配图网上搜索。

1、通信声学 本份汇报详细讲述第一章,第四章内容,二三章属于学过的内容,不重点概述,第五章及其 之后的章节对内容进行概括,并挑选重点理解的部分进行说明。第一章 听觉场景的分析和合成所谓分析:在某种声场景下,对场景内的声音进行分析和评价所谓合成:通过计算和分析,对声场景进行模拟1.1 引言1.历史回顾上世纪声学发展迅速,随着计算机迅速发展,促进了声学的前进,数字信号处理已经成为了 通信声学中不可或缺的部分,许多声学技术围绕现代技术继续前行,可以预见,未来通信系 统将会包含越来越多的内置智能和知识。2.通信经典范例:双耳技术 通信传输系统结构:信息源-编码器-传输通道-解码器-接受信号 声学传输重要的

2、一点是:声信号发送接受,在两种场合下的听觉感知要彼此一直,在这点上, 最严格的任务是真实再现。体现真实再现的可行方法:双耳技术双耳技术:在收听双耳入口,真实再现声音信号。 输入信号从真人的耳道拾取,用耳机完成回放。 3.经典传输连的分离 将经典传输分为了两个部分,分别是:两者级联成为一个传输系统睛分判分理评AVE听觉虚拟环境系统ASA听觉场景分析系统信号处理哥1.2表示从囲I I中的方眶图分鋼得到常示逍国。(a)斤愛场景分析票统(ASA); 心)听觉虏拟环境I产生慕统AVE17蛊竄嶽出 9婪宣输入 亠信号牡理左右耳蝦檯块势耳模块图L.3殺耳信号址理模型的基木结构(请淫意,处理严档地由信号驰功.

3、是自下 帀上的方向)1.2 听觉场景分析ASA 双耳信号处理模型 *K9 UpM IM1中耳槌块;中耳模块;!aE M SB RB Br|双耳活性显示耳间声级差佶计耳简到迖时差估计耳蝎樋块外耳模块获取信号输入,通过中耳模块带通滤波,送到内耳模型进行信号处理,输出信号反 馈到双耳接受信号模块中,分析内耳之间到达的时间差别和声级差,最总得到三维时变输出, 被称为是双耳活性图。举例 2 个1. 质量的识别和评价音乐演奏厅中记录的双耳房间响应,输入到上述模型,得到人工头耳中的直达声和个别反射 声,分析这些图可以预测该音乐厅的质量。故双耳活性图能够作为系统的听觉质量评价和估 计的基础。质量判断是从一组公

4、认的和可以命名的特征开始,然后与参考组的特征作比较2. 鸡尾酒会处理得到两个同时发音者的双耳活性图,进行分析讲话者图L5两个同时发音者桎不同的朮平方向的瞬间双耳活性图血I图中的高度和峰值表示两个发音者中,每一个激活的空间,时间,频谱位置。用适当的滤波 算法处理这些信息,能够增强想听的发音人的信号,并抑制不想听的发音人的信号。在图中 不想听的发音人激活的区域颜色发暗。显然,这种信号处理的 有效性取决于如何可靠的辨 认想听的发音人的激活点。只要处理的发音者有限,在无回声而且是较低的干扰噪声条件下 鸡尾酒会处理器是很有效果的。在混响大量的场景中,就会出现问题,对于辨别发音者有一 定困难。建立在双耳活

5、性图基础之上的听觉场景分析的应用分别是:1. 声品质的评价2.同时发音者的分离1.3 听觉场景的合成AVE 听觉虚拟环境听觉虚拟环境与通常的虚拟环境一样是人工的,有计算机产生,只停留在场景的参数表示上 虚拟环境 有诸多应用,先做一些简单介绍1. 双耳房间模拟从待建模空间的几何描述开始,包括 具有不同吸收系数的所有周围的表面,以及声源的位 置和方向特性,声场模拟确定了虚拟声源的层次,按照从收听者位置所看到的来描述声场 然后,这些虚拟声源所产生的冲激响应,再按规定的方向用收听者耳朵的冲激响应加权,该 响应预先已经测量,这样最后得到一组双耳冲击响应,在依次和没有回波的语音或者音乐卷 积,所得到的信号

6、再送到收听者的耳中。2. 虚拟环境发生AVE发生器的结构翁駐箱入外界模珂-蚱畀知识应用丄控制层V图IM 听觉-触近的處拟环境发生器示瘪图由于交互作用的要求,发生器系统的结构和静态模拟系统的结构不同,现在目标是要产生感 觉似真的场景,体现交互作用真实性感觉。从上面的发生器结构可以看到,发生器已经变成 多模态的,触觉,视觉和身体感觉的信息最终于听觉结合在了一起。听-触只是其中一部分 双模型例子。核心是外界的模型,具有数据库的作用。外界模型的 一个层面成为应用,列出很多规则, 用来调节虚拟目标相对于试图的特殊应用之间的相互作用。控制层收集在交互作用中使用虚 拟环境系统的被实验者的反应,促使系统做出适

7、当的响应。用户的头,手等被连续监视,这 些能够影响虚拟环境,影响有关的声源。信号最后通过参与其被反馈给被实验者,产生这些 信号的那些系统部件被称为执行器,听觉执行器最重要的部件就是声场模型,是基于双耳房 间模拟原理而产生的一组双耳冲击性响应。1.4 讨论和总结ASA和AVE需要变得越来越智能化,增加内置系统智能成为一种趋势。第二章 听觉通信进化中的适应性2.2 发送器的适应性 动物会根据周围声学环境调节自己的信号输出方式,这就是一种适应性。2.3 处理传输通道的特性 信号在传输到接收的过程中就有一些变化,但是信号仍然可以被识别,这些变化反过来又能 使接收器用来估计信号的传输距离。2.4 接收器

8、的适应性 在接收器的听觉系统中,应声学环境要求进行匹配,发展共性,这就是一种适应性。 典型的适应例子1. 听觉非线性的增益控制机制听觉系统必须分析的声音幅度范围可以超过6 个幅度量级,倘若动态范围有限,为了使机械 刺激感受器细胞表现这种幅度上的变化成为可能,听觉器官逐渐形成非线性转换机制和增益 控制的主动机制。2. 频率选择性 动物听觉系统从内耳开始就有选择的处理声音中的不同频率成分,这种能力用一组带通滤波 器表示,也就是听觉滤波器,他们构成了听觉系统。根据声信号的频率,在耳蜗的规定位置 表现出最大的震动幅度和速度,不仅增加了灵敏度,而且也使得频率选择性的尖锐化。3. 声音定位接收器受益于能够

9、精确测定声源的位置,定位能力不仅包括听到信号的发送器方向,还包括 他的距离,很多动物都面临声音定位问题,因为物种的头部较小,用来通信的声音波长比他 们头的直径大得多,在定位的过程中有两类线索,一类是耳间时间差,一类是耳间强度差。2.5 听觉场景分析 吧每种声源的声音分类为一种知觉对象的任务,听觉流指的是一个特定声源发出的声音,把 特定声源分析出来,并对同类声源做出适当的响应,就是听觉场景分析。第三章 人类外围听觉器官的功能性观察声音信号处理总是从人头的外部开始,外部声场必须耦合到声道,两个耳道和声源的相对位 置,导致了耦合强烈的依赖于频率,其中不包括低于几百赫兹的低频,在其中,耳廓和头部 都齐

10、了重要作用,这种线性滤波通常使用传输函数HRTF来描述。听觉器官结构复杂,传声有着自己独特的方式。3.2 耳蜗3.3 耳道和中耳3.4 到耳蜗的直接骨传导 都是关于人耳的介绍内容,不做详细总结第四章 双耳听觉的建模模拟双耳听觉,存在几种模型:1. 详细模拟神经细胞的特性2. 面向心理学,精确模拟听觉通道双耳定位模型,必要条件:1. 必须知道由听觉系统分析的空间线索2. 开发至少模拟一种空间线索的听觉分析算法3. 确定一种从空间线索分析结果中估计声源位置的方法4,2 人的双耳线索分析 早期双耳听觉基本定律:从单声源发射声波到达时间,由于到达两只耳朵的不同路径长度 通常在左右耳膜上不会严格相同,这

11、种左右耳之间到达时间差,成为耳间时间差ITD,两耳 之间头的存在不仅决定了行进的声波必须迂回,而且也引起声波在耳膜对侧的衰减,导致两 耳信号的耳间声级差ILD,在低频范围ITD是主要线索,在高频是,ILD是主要线索。他们可 以通过信号包络起伏来评价用ITD和ILD组合估计声源位置:我们的听觉系统对整个频率范围内的ITD都一样灵敏,对 于长时间周期,假设在听觉系统中ITD和ILD是被分开估计的,两者被估计的位置并不相同, 听觉事件经常包含使用两者线索位置之间的中途结果,导致进入相反的方向并相互补偿。在 描述听觉系统执行解码过程以前,ITD对于确定声源的左右偏侧性,仍然是可靠的线索。4,3 双耳线

12、索的计算分析1.外围听觉系统的模拟各级定位模型的通用结构表示:信号由模拟外耳,中耳,内耳等听觉外围的处理级来处理IIC内耳中央神弊皋蜒 内耳SWI.-B1! Jli.-JB1-JB J1 K駆藪熬到左耳的貉径:第彷牛声漁到右耳的略费曲模拟人声音定位模熨旳典型结构外耳用 HRTF 对信号滤波来模拟 中耳用不均匀的带通滤波器来模拟 滤波器的形状对于处理双耳任务和单耳任务相比,要有不同的选择。 比方在双耳任务中,要考虑模拟毛细胞特性,对毛细胞功能要做更为详细的模拟听觉外围的所有原件包含在模拟算法中,并不能严格分开,在算法中,使用心理学声学方法 所得到的只是听觉系统对耳信号的整体响应,生理学的方法允许

13、在听觉通路上任何位置做测 量,设计出心理声学模型,可以模拟毛细胞群体,得到双耳参数,进行定位模拟。2. 耳间时间差Jeffress 算法:模型包括两条延迟线,一条到达左耳的信号,另一条到达右耳的信号,他们 和一些耦合检测器连接,延迟线离散实现描述如下:(幅+1*阳斗 1=吒叭“) 1 W M 亡 N a二了i刑)尸(曲古1: n - l)=r(mil1 W幵W /V人尸(他/Vj =_片(忻)当从两个连接位置的延迟线上同时接受到输入时,一个耦合检测器被激活,由于信号在延迟 线上传播的速度有限,每一个耦合检测器被调整到不同的IDT,在两者激发相应的耦合检问题:没有明确规定两个脉冲尖峰如何重合,为

14、了达到这个目的,假定许多调谐到同一 ITD 的耦合检测器细胞是存在的,来自相反通道的两组脉冲激发一个确定的重合细胞概率,由这 些左右通道里脉冲数目的乘积给出。Sayers&Cherry算法:使用耳间互相关ICC确定ITD3互対关wb宜换附合c: WolfHd Lindemann 的榄型hle:部分泊除眛冲AJt: 1CCIUu.|1 1 11J-.oIP-IDDO1.0T/ms图4 6 对于1kHz正求信号使用鬲伺偶合椅测器的输出例子。(册互相关算准; (b育接符合算袪*芳相互通过时,脉冲总是会相互柞用;(c) Wolf的算法;(d) Lindemann的算法:(e)在重合以厉部分消除脉沖的重

15、台算铤;(f)互相关算搓, 取值为】CC的L0空幕*图中、宴线对应于町irii的TD.虚线对应于0.5 ms的 !TD相反通道的两组脉冲,当他们相互通过延迟线时总是会重合的,此时重合函数的输出不是每 一延迟时间在左右通道中幅度的乘积,而是这两个幅度的最小值,图中显示这种算法的输出 特性,与互相关算法的输出特性非常相似,只在顶部的峰值稍微略窄。假设两种脉冲在他们 重合以后应该抵消,在左右耳通道中的信号要预先压缩幅度。现今预测:ITD并不是由类似细胞阵列中相应细胞的激发峰值确定,可能是两组协调到度数 范围内耳间相位 移的细胞群体间的比值。问题:不能证明这种生定位模型在哺乳动物中怎样分析ITD为更好

16、描述。3.耳间声级差计算方式:4.单耳线索 单耳线索模型:所有频带上的功率相比较,无论信号是从前面表现还是从上面表现或者后面 都做一次逻辑判断,为了估计的单耳线索,收听者使用声音的内部表示。耳信号和这种内部 表示作比较。4.4 判决过程,需要模拟偏差,帮助探索听觉系统工作1.偏侧性模型通常感觉到有些声音在头内部的耳间轴线上离头中心有一段距离处,这个距离是偏侧性,通 常是用间隔或者比例标度测量模型一:Stern&Colburn可变位置模型从不同线索的ITD和ILD中集成信息模型二: Lindemann 模型时间图像是由 互相关曲线的峰值位置确定的,而强度图像是由单耳处理器的贡献确定的。 2.加权

17、函数之所以需要加权函数是因为,在确定声源的时候,需要一种适当的额方式来把所有分析线索 信息结合起来,所以这里普通的方法是通过时间和频率加权不同的信息加权函数表示:除此之外还有组合频率加权和内部延迟加权的加权方法,各有不同的表示方式。3. 定位模型针对在自由声场中的信号做优化。在自由场中,听觉事件被认为是来自三维空间的感觉。ITD 和ILD的水平角的频率依赖关系能够从HRTF的样本确定。有时候基于ITD的分析不能够显 示声音是来自前半球还是后半球,如果在分析中考虑的是三维空间,那么ILD线索必须处理。 如果只是用ITD和ILD在几个频带中的组合来确定生源位置具有困难。每个符合LINDEMAN模型

18、的细胞,按照在HRTF中找到的不同入射角和频率,调谐到ITD和 ILD的自然组合。在这种方法中,当两个延迟线,相应的偶合检测器相遇时,信号的ILD正 好抵消。为了能够在不同的方向补偿ILD,补偿因子必须在每两个符合检测器之间实现。最 后, ITD 必须简单的在方位基础上重新画出,以便估计声源的方位角。定位模型的这些形式是分析 lTD 和 ILD 两者,然后使用两种方法,或者在合成算法中处理 两种线索,或者先独立估计两种线索,然后把结果组合起来,以便仙计声源的位置。4.5 检测算法检测的是目标声音,使用很多模型 主要介绍 EC 模型.多模态:听觉触觉等多模态的集成引起了更多重视,这样的多模态虚拟

19、环境使沉浸该环 境的用户具有丰富的潜在能力,但也要避免出现不需要的效果。2.联合实现:真实的和虚拟的环境混合起来,能沟提高声学效果,需要几何空间信息和真 实环境的声音特性目前 AVE 系统在处理信号上可以做的选择大方向是数字编程,基于多模型虚拟环境在声音 质量方面有着重要的考虑和预测。第十二章 数字音频技术的进展时代在进步,从声音重构的质量放向来看,发展路程是,从光盘,DVD到CD,SACD格式出 现等;从压缩比率方向来看,发展路程是,一些适当的标准方便人们对信息网络进行访问 是的声音变成了音视频显示系统的一个集成部件。发展史:从发明了脉冲编码调制原理之后,受到计算机处理能力限制,只是做了一些

20、开创性 工作,随着计算机技术发展,由 DSP 芯片和新存储方式出现,数字音频方式重新开发,出 现了不同方式的压缩标准,纵观发展史可以看出音频和声学是首先引入 DSP 技术的领域之 一, DSP的进展也对语音技术提供了很好的帮助,未来发展基于此在新型模式下有很多展望, 会向网络化,容量化,全面化,智能化,与更多领域进行结合第十三章 语音的产生-声学,模型和应用语音产生的机理:通过人体发音器官 作用,原理不再介绍。 通过人体的发音器官,产生了基于语音产生的声管模型,是由均匀声管串联组成的语音产生 系统模型图13.5诸音严生的管子模5L 如果庫睨是用址在下面位宜的软腭耦合刮喉和门腔上,则用虎线表示存

21、在的连搖)结构比较复杂,需要适配器来实现物理等效。使用适合的适配器,可以模拟语音产生系统由 于发音而具有的时变特性。如果声管连接没有分支,可以在线性预测的基础上,估计他的反射系数,反射系数计算方法: 1.计算语言信号的自相关函数以后,用特定算法求解线性方程组2.使用逆滤波,每级执行得到反射系数。该管模拟还包括了对鼻侧腔的模拟,情况复杂,通过三维观察,主要利用逆滤波进行参数估 计。声管模型用于语音识别是可能的。第十四章 针对高质量和低数据率的语音和音频编码主要就是针对离散时间语音信号的有效数字表示。语音产生模型是很多语音编码方法的基础,音频编码器并不依赖与语音产生的模型,而是应 用接收端的特征。

22、在语音编码中,编码方案分为高速率和低速率,为降低比特率,需要遵循 三个基本概念:非线性量化,自适应,线性预测本章介绍了一些音频编码的算法过程,例如RELP编码,CELP编码,GSM全速率编码器有助 于连接编码间隙,使得编码质量提升,语音编码器和音频编码器还有一定区别。在流行编码方式中,普遍见到的是mp3,也就是MPEG-1pp诵析(32通適)标膿园子mi在 mp3 基础上加上同时掩蔽原理,在后来得到了频率域的优化,结合了已有的方法,被认 为是最成功的方法。音频编码:先进的音频编码器AAC,已经被MPEG二层和四层选用,后面的标准是分别针对 先进的环绕立体声,有五个通道,高达320kbit/s和可升级的速率和质量。语音编码:好的电话质量在4kbit/s速率下得到,好的宽带质量在12bit/s速率下被利用,高 质量高速率语音也正在研究,依赖于音调的波形内插概念发展中。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!