基于matlab的语音信号的分析与处理基于正交试验的特征选择方法的研究与实现毕业论文.

上传人:仙*** 文档编号:66187278 上传时间:2022-03-27 格式:DOC 页数:35 大小:127KB
收藏 版权申诉 举报 下载
基于matlab的语音信号的分析与处理基于正交试验的特征选择方法的研究与实现毕业论文._第1页
第1页 / 共35页
基于matlab的语音信号的分析与处理基于正交试验的特征选择方法的研究与实现毕业论文._第2页
第2页 / 共35页
基于matlab的语音信号的分析与处理基于正交试验的特征选择方法的研究与实现毕业论文._第3页
第3页 / 共35页
资源描述:

《基于matlab的语音信号的分析与处理基于正交试验的特征选择方法的研究与实现毕业论文.》由会员分享,可在线阅读,更多相关《基于matlab的语音信号的分析与处理基于正交试验的特征选择方法的研究与实现毕业论文.(35页珍藏版)》请在装配图网上搜索。

1、基于 MATLAB 的语音信号的分析与处理 基于正交试验的特征选择方法的研究与实现_毕业论文 安徽建筑大学毕 业 设 计 论 文 专 业 通信工程 课 题 基于MATLAB的语音信号的分析与处理 基于正交试验的特征选择方法的研究与实现 72013年 6月 1日 摘要 如何从较多的语音情感特征因素中实现最优化是情感识别过程中的重要环节正交实验设计是研究多因素多水平一种设计方法它是根据从全面实验中挑选出部分有代表性的点进行实验正交实验设计又称正交设计或多因素优选设计是一种合理安排科学分析各实验因素的一种有效的数理统计方法它是在实践经验和理论认识的基础上借助一种规格化的正交表从众多的实验条件中确定出

2、若干个代表性较强的实验条件科学地安排实验然后对实验结果进行综合比较统计分析探求各因素水平最佳组合从而得到最优或较优实验方案的一种实验设计方法How to get optimal emotion recognition from many voice emotional characteristics is an important part of the process while the orthogonal experimental design is a approach of studying multi-level and multi-factor which is based on

3、 a comprehensive experiment selected from a representative sample of the experiment Orthogonal experimental design called orthogonal design or multifactor preferred design It is a standardized orthogonalWe can get obtain optimal or optimum experimental program from Scientifically arranging experimen

4、ts and statistical analysingThis article describes the analysis of the basic idea of orthogonal experimental design principles and data analysis methods There are 15 examples of application of factorsuse orthogonal design to find the optimal combination to improve emotion recognition rateKeywords or

5、thogonal experiment orthogonal larray factor interaction optimal combination目录摘要IAbstractII1 绪论111 引言112正交设计的研究现状113 本文主要内容22 正交实验设计的原理321 正交法常用概念322正交法33正交试验设计的步骤931 确定试验指标932 确定试验因素并选取适当的水平933 选用正交表1034 表头设计1035 编制试验方案114 实验数据分析1241 实验数据的综合分析1242 实验数据的统计分析135基于正交试验的特征选择1951 问题分析1952无交互作用处理19参考文献24

6、致谢25附录一 数据处理程序26基于MATLAB的语音信号的分析与处理 -基于正交试验的特征选择方法的研究与实现电子与信息工程学院 通信工程专业 2009级2班 邵伟 指导教师 王坤侠1 绪论11 引言 如今科学的快速进步带来各种各样革命性的产品这些产品不是凭空而生而是人类科学家经过多次成功与失败的试验总结完善而成的试验设计融会于各种学科领域并非只存在于工学它是一个理论到实践应用实施的过程包括明确试验目的制定可行试验方案结合专业和统计学的知识做出周密完整、科学严谨的整个试验过程但试验往往需要消耗大量人力、物力和财力所以实际试验过程中我们应该仔细分析导致试验结果的影响因素挑选最合适的主干部分用最

7、优的方案去得到我们需要的试验结果而正交试验设计可以满足上述特点试验次数少效率高低成本本文主要论述单指标正交试验设计及其结果的分析12正交设计的研究现状 试验设计是离散优化的基本方法它从正交性均匀性出发利用拉丁方正交表等作为工具来设计试验方案实施广义试验直接寻求最优点试验设计作为一门相对独立的学科既是应用数学的一个新分支也是试验优化的一个重要部分20世纪20年代英comer运用均衡排列的拉丁方解决了长期未能解决的试验条件的不均匀问题提出了方差分析创立了试验设计design of experiments在试验设计的发展道路上Fisher创立的传统试验设计是第一个里程碑正交表的构造和开发是第二个里程

8、碑日本田口式正交表试验设计法是突出的代表而我国研创的正交试验法同日本田口式正交试验设计法相比指导理论正确合理程序简单优化效率高教育推广和普及更便利从而使多因素优化从欧美式的艰辛探索方法中跳出演化成简单易行行之有效的工作我国的一些学者自20世纪50年代就开始研究试验优化在理论研究设计方法与应用技巧方面都有创新构造了许多新的正交表提出了小表多排因素分批走着瞧在有苗头处着重加密在过稀处适当加密的正交优化基本原理和方法提出了直接看可靠又冒尖算一算有效待检验等行之有效的数据分析方法提出了直接性和稳健性择优相结合的方法提出了参数设计中多种减少外表设计试验点的新方法还构造了系列的均匀设计表创建了均匀设计法这

9、就形成了一套中国特色的试验设计法我国对试验优化的发展和推广应用也做出了显著的贡献尤其是20世纪70年代以来试验优化的实际应用越来越广取得了非常可喜的成果国内正交法的应用已有超过一万个自变量的例子据粗略估计仅正交试验设计的应用成果目前已超过十万项经济效益在50亿元以上但是与与开展这一工作最发达的国家相比与我国应达到的应用规模相比还有较大的差距试验设计的现代发展稳健设计实际应用在我国才刚刚开始因此大力推广应用试验设计技术对于促进我国科研生产和管理等各项事业迅速而健康的发展不仅具有普遍的实际意义也具有一定的迫切性13 本文主要内容 正交试验设计是研究多因素多水平的又一种设计方法它是根据正交性从全面试

10、验中挑选出部分有代表性的点进行试验这些有代表性的点具备了均匀分散齐整可比的特点是一种高效率快速经济的实验设计方法设计简单的2水平多因素正交表资料中有的可以直接借用没有的可以根据正交表设计原理自己构造 然后进行表头设计根据制表编制试验方案严格按照试验方案进行试验最后编写简单的MALTAB程序对正交表进行数据处理 实验数据的综合分析和统计分析1综合分析 每因素的最优水平及各因素的最优组合 各因素对目标函数影响的大小顺序 最优水平组合条件下目标函数估计值2统计分析 因素效应值 试验误差 各因素对目标函数影响是否显著利用实验值估计出的目标函数值的可靠性和估计给定水平组合条件下的目标函数的大概取值范围

11、正交试验设计是实现特征选择的一种简单又快捷的方法本文对正交试验设计的基本原理方法和步骤以及数据的处理进行简单的分析与研究并在实践中解决实际问题2 正交实验设计的原理21 正交法常用概念 正交试验设计法它以概率论数理统计专业技术知识和实践经验为基础充分利用标准化的正交表来安排试验方案并对结果进行分析来减少实验次数缩短试验周期若一个实验设计满足如下两条 每因素的各水平在总实验中出现的次数相同 每两个因素的各水平组合在总实验中出现的次数也相同则称该设计为正交设计通常上述条件 称为均衡搭配原则正交法常用的概念 1指标正交设计中根据试验目的而选定来考察或衡量试验结果好坏的特性值指标和试验目的是相对应的例

12、如试验目的是提高情感识别率则识别率就是试验要考查的指标 2因素是实验中考查对试验指标可能有影响的原因或要素通常用大写字母ABC等来表示一个大写字母代表一个因素还需要指出的是试验设计中因素与试验指标的关系虽然类似数学中的自变量与因变量之间的关系但并非确定的函数关系而是相关关系因此试验指标的处理必须运用数理统计的原理和方法 3水平试验中选定的因素所处的状态和条件的不同可能引起试验指标的变化因素的这些状态和条件称为水平通常用123表示同理一个因素也可分为4水平5水平或者更多水平以此类推4交互作用 交互作用是指因素间的联合搭配对试验指标的影响作用事实上因素之间总是存在着或大或小的交互作用它反映了因素之

13、间互相促进或互相抑制的作用这是客观存在的普遍现象22正交法com 正交表 正交法的基本工具是正交表它是一种依据数理统计原理而制定的具有某种数字的标性质准化表格正交表符号为其中字母L表示正交表n表示试验次数m为因素水平数k为试验因素数以基本的为例 纵列数 3个纵列能安排3个因素 因素水平数本表为2水平 横行数4个横行每行为一个试验方案 正交表代号Latin square表2-1 正交表表2-2 表 1234111112122231333421235223162312731328321393221 表2-1是一个3列4行的矩阵每一个因素占用一列该表最多能考察3个因素每个因素分为2水平共4行也就是有

14、4个试验方案每1行是一个试验方案假若用A因素占第一列B因素占第二列C因素占第三列则1号方案为2号方案为3号方案为4号方案为只要依据上例各因素水平对号入座方案就确定好了有几个横行就有几个因素方案再以表2-2 为例根据上表的理解此表为4列9行的矩阵该表最多安排4个因素有9个试验方案每个因素有3个水平即每个纵列有123这3个数码通过认真分析这两个正交表发现正交表有两个特点1每列每个因素中不同水平出现的次数相同如表1每列1和2都出现2次2任意两个纵列任意两个因素之间不同水平都要进行搭配搭配的次数相同也可以说是任意两列把同一行的两个数字看成有序数字对所有可能的数字对出现次数相同如表1任意两个纵列其横向形

15、成的有序对111222出现的次数相同即1和2均衡搭配com的构造 阿阵定义以11为元素并且任意两列都是正交的矩阵 性质1每列元素个数都是偶数 2任意两列两行交换后仍为阿阵 3任意一列或行乘1以后仍为阿阵 标准阿阵第一列全为1列用对行乘1可得 阿方阵行列相等阿阵偶阶方阵 定义设两个2阶方阵AB它们直积记为AB定义如下 定理1 设2阶方阵AB如果它们中的两列是正交的则它们的直积AB的任意两列也是正交的 定理2 两个阿阵的直积是一个高阶阿阵据此可以用简单的低阶阿阵用求直积的方法得出高阶阿阵例如有依此类推有以正交表的构造为例 取标准阿阵H4 如下 将全1列去掉得出 将1 改写为2按顺序配上列号行号就得

16、到2水平正交表 上法只能构造 2 水平正交表更多水平的正交表用正交拉丁方的方法来解决com 正交表的分类1 标准表 2水平 3水平标准表的构造特点是 2-1 凡是标准表水平数都相等并且水平数只能取素数或素数幂利用标准表可以考查因素间的交互作用2 非标准表 2水平 其他水平二水平非标准表的构造特点是 2-2 非标准表是为了缩小标准表试验号的间隔而提出的它虽然是等水平的但却不能考查因素间的交互作用com的原理 如果按照常规的网络设计方法全面设计法需要将所有因素和水平搭配如果是3因素3水平的条件需要做次试验相当于立方体上的27个节点如图1这种设计对于因素和水平之间的关系剖析的比较清楚但如果是4因素3

17、水平的试验需要进行次若是10因素3水平则试验次数将达到显然这样的工作量是难以接受的那么能否用少量的试验在选定区内铺开而又保持全面试验的特点呢正交试验就可以解决这个问题图中3个坐标轴代表3个因素坐标轴上的点代表因素的水平共27节点代表全面试验的27个方案利用正交表所安排的9个试验方案在图1中用黑点表示由图可知在立方体的每个面上恰有3个试验点而且立方体每个线上也均有一个点9个试验点均衡的分布于立方体内每个试验均有很强代表性这就是正交试验的均衡分散性能够比较全面的反应优选区的情况3正交试验设计的步骤31 确定试验指标也称目标函数试验设计是为了更好更快的达到试验目的而对试验方案进行的最优化设计因此试验

18、设计时必须首先明确试验目的人们十分清楚设计试验到底为了什么要达到什么目的否则不需要进行试验优化通常试验的目的主要有寻求某设计技术配方工艺和生产等在试验空间内的最优化考查试验因素的变化规律或试验因素与试验指标间的统计规律满足某些特定或特殊的要求或需求试验指标是由试验目的确定的一个试验目的至少需要一个试验指标试验设计时对试验所要解决的问题要有全面而深刻的理解试验指标的具体确定需要周密的考虑要达到一项试验的一个目的有时不止需要一个试验指标而要达到同一项试验中几个不同的试验目的相应地就需要更多个试验指标这要根据专业知识和试验要求具体分析实际试验合理确定试验指标 就本次课题而言试验目的就是提高语音情感的

19、识别率32 确定试验因素并选取适当的水平 选取因素时首先要根据专业知识、以往的研究的结论和试验的经验尽可能全面地考查影响试验指标的诸因素然后根据试验要求和尽量少选因素的一般原则选定试验因素 在实际确定试验因素时应主要选取对试验指标影响大的因素尚未完全掌握其规律的因素和未曾被考查研究的因素那些对试验指标影响小的因素以及对试验指标的影响规律也完全掌握的因素应尽量少选或不选但要作为可控的条件因素参加试验试验要求考查的因素必须确定为试验因素不能缺漏并且有时列为主要因素在试验中加以重点考虑应当指出在某些条件下特别是在试验条件完全允许的情况下也可以考虑尽量多安排一些因素例如在用正交表安排初步试验筛选因素而

20、人力、物力和时间又允许的场合下在增加因素而可以不增加试验号的场合下在某些广义试验中在试验的目的只是为了寻求最优组合时都尽量多选定一些试验因素这样做的好处是试验因素多试验空间维数较高一般情况下在高维空间里寻优比在低维空间寻优的结果更接近于预考查系统的全局最优事实上试验效率也提高了试验因素的水平一般以24为宜以尽量减少试验次数在分批试验的场合尤其应尽量少选水平分批走着瞧在有苗头处着重加密在过稀处适当加密是节约试验次数的一条根本原则在多批试验中在不增加试验次数的前提下可以多选因素少取水平这意味着每批用小号正交表做少数次试验即通过各批很少的总次数就能找到当前设备和工艺技术前提下的最优生产条件当试验因素

21、考查的范围较宽时若仍然只选2水平进行试验就会有很多范围没有机会进行考查试验结果就可能得到局部最优此时试验因素应多选水平以便找到全局最优在一项试验中如不能分批或只能少分批的试验如数学试验均匀试验也希望多取水平33 选用正交表 选定了因素数和水平数后则可选择合适的正交表具体选哪张正交表应该根据因素和水平多少以及试验的工作量大小而定例如每个因素有2水平时当因素为23时一般选正交表当因素47个时一般选用当因素个数较多时试验条件又允许事也可用正交表通常情况下选用正交表时既不允许裁减试验因素也不允许缩减试验因素的水平即因素水平表必须在选用的正交表中得到完全的安排如果选用的正交表既能容得下所有试验因素又使试

22、验号最小就认为所选的正交表是合适的因此在选正交表时只要试验因素能安排的下就尽量可能选小号的正交表例如挑好4个因素如果每个因素取4个水平则必须用正交表要做16次试验为了节约试验次数改为每个因素取3个水平则用正交表只做9次试验就可以了到底用哪个正交表则应根据实际情况进行选取试验次数的多少各有利弊不能一概而论一般以快为主的时候选用试验次数少一些的正交表而以好好为主的时候做则应选用试验次数稍多一些的正交表34 表头设计 正交表只提供了一些列和各列对应于每次试验的水平号这与所选取的因素和水平并没有一一对应的关系研究人员还必须把所选的每一个因素都安排到一个合适的列上这种把各个因素分别安排在正交表的适当列上

23、的过程称为表头设计这一步在一些简单的情况下是很容易的可以将所选定的因素随意安排在正交表的不同列上但当考虑交互作用时往往比较复杂一般而言避免混杂是表头设计的一个重要原则也是表头设计选优的一个重要条件混杂是指在正交表的同一列安排了两个或货两个以上的因素或交互作用这样就无法确定同一列中的这些不同因素或交互作用对实验指标的作用效果但是有时为了满足试验的某些要求或是为了减少试验次数可以允许一级交互作用的混杂也可以允许次要因素与高级交互作用的混杂但是一般不允许因素与一级交互作用的混杂35 编制试验方案表头设计完成后将正交表安排有因素的各列中不同数字换成对应因素的相应水平即构成试验方案安排考查交互作用的各列

24、对试验方案及试验的具体实施不产生任何影响试验过程中应当严格保证各号组合处理严格控制试验因素的水平试验条件应当尽量保持一致试验方案中的试验号并不意味着是实际进行试验的顺序为了加快试验进程最好进行同时试验同期取得全部的试验结果如果条件只允许一个一个的进行试验为了排除外界的干扰应使试验号随机化即采用抽签掷骰子或查随机数字表的方法确定试验顺序不论用什么顺序进行试验一般都应进行重复试验以减少随机误差对试验指标的影响试验结束后将试验结果直接填入试验指标栏内4 实验数据分析41 实验数据的综合分析 正交设计中数据的综合分析方法的步骤为第一步 算出所有数据的总评均值 将所有数据的总平均值记为 一般求总平均值的

25、公式为 4-1 式中n为试验次数第二步 算出各水平的平均值定义 在n次试验中第i因素的j水平出现的各次实验所对应的实验数据的平均值称为i因素j水平的水平平均值记为 4-2式中是指在第k次试验中i因素取j水平第三步 算出各因素的极差定义 因素的全部水平平均值中最大值与最小值之差称为该因素对目标函数影响的极差简称为i因素的极差记为则 4-3一个因素的极差说明了该因素在试验范围内对目标函数的影响的大小极差越大说明该因素对目标函数影响越大反之越小利用对试验数据进行综合分析的方法可得到以下几个方面的有用信息 每因素的最优水平及各因素的最优水平组合根据水平平均值 各因素对目标函数影响的大小顺序根据 最优水

26、平组合条件下目标函数估计值利用此方法也可计算出任意水平组合条件下目标函数的估计值这些信息是非常有用的但仔细考察发现还有以下几点不能让人满意的问题 各的值到底有多大 本次试验的误差有多大 各因素对目标函数都有一定影响但这些影响是否可以忽略不计或者说这些因素影响是否是显著的 利用实验值估计出的目标函数值的可靠性如何也就是说估计的误差有多大上面这些问题对我们来说是非常重要的不知道的确切值想求出因素对目标函数影响的确切关系是难以做到的不知道试验的误差有多大就不知道试验所得数据的可靠性不知道因素对目标函数的影响是否显著也就不知道试验的效果不知道利用试验值估计出来的目标函数值的可靠性如何就不能贸然将这种估

27、计值用于生产实践这些问题用综合分析的方法是很难解决的需要用统计的方法来加以解决下面就介绍试验数据的统计分析方法42 实验数据的统计分析com应值定义 i因素第j水平的数据平均值与总平均值之差称为i因素j水平的效应值i因素的所有水平的效应值统称为i因素的效应值简称i因素的因素效应记为 4-4 由于和都可以确切的计算出来所以的值也能计算出来可以用约束条件来检查因素效应值的计算是否正确若某因素的全部效应值之和不为0则该组因素效应值的计算是不正确的需要重新校核当然由于四舍五入一个因素效应值之和可能不为0但也只能是较小的差异如果在计算中没有四舍五入则一个因素的各效应值之和就必须为0相反各效应值之和为0并

28、不能说明计算是肯定正确的com自由度定义 求解一组未知数所需要独立方差的个数称为这组未知数的自由度那么一个因素各水平的自由度是 多少呢若一组因素的水平为则可知这个因素效应值之间有一约束条件 4-5这就是说解这个未知数只需要-1个方程即可于是得出一个因素的自由度为该因素的水平数减1将其记为则有 4-6com应 若在一个正交设计中各因素的自由度之和加1小于试验的容量即 4-7 则根据线性方程组的理论取其中的一部分线性无关的方程就可解出未知数但由于试验误差的存在即使是两次实验的条件完全相同所得的结果也会有差别这样当方程的个数多于未知数个数时就会出现矛盾方程反而解不出来未知数来要解决这类问题需要加上松

29、弛未知数也就是误差这就像我们多次测量同一个物体的长度时若测出的数值不同时反而不知道应该取哪一个值才好但当引入误差后可以将这些数的平均值作为这个物体的长度然后根据平均值和测量值可以求出若干个误差如正交表中的一列既然没有安排因素就不应该有效应值也就是说各效应值都为0但由于实验中总有误差这一列的试验条件尽管没变但其效应值一般不为0这类似于多次测量同一个物体的长度所得到的值可能各不相同一样可以这样解释这一现象假定空闲列上也安排了某一因素但该因素各水平的取值为一常数尽管不符合因素的定义但有助于理解于是各水平对目标函数的影响应该是相等的即应该有但由于实验中不可避免的存在误差因而导致了各效应值不全为0这相当

30、于在完全相同的条件下进行了两次试验其结果也不会不同一样这种差别就是误差将空闲列看成误差列后这一列的效应值就是误差通常称为误差效应误差效应的求法与普通因素效应值的求法一样各水平平均值与总评均值之差误差一般记为i 12其中i为正交表中的第i个误差列当误差列多于一列时com检验 某因素的不同水平引起总平均值的变化是大还是不大呢换句话说这种变化是明显还是不明显是否可以忽略不计呢要解决这一问题需要进行一定的判断已进行取舍这就要取一个可比较的参数及一个极限值一个因素的效应值是否明显应该依赖于客观标准而不应该依赖于主观选取的标准那么客观的标注是什么呢这就是误差将因素效应与误差效应相比若某因素的因素效应明显地

31、大于误差效应则认为该因素的因素效应应对目标函数的影响是明显的不是由误差由误差引起的一般称之为是显著的若某因素的因素效应与误差效应相比差别不大则很难断定它对目标函数的影响是不是由误差引起的这时称该因素是不显著的 对于2水平正交设计的显著性检验常用t-检验Student-t法t-检验是用于检验数据平均值齐性的方法即判断数据平均值是否有显著性差别的方法由于2水平因素的效应值实际上只有一个我们可以用某一个水平效应值的绝对值来作为该因素效应的平均值对于2水平正交设计用t-检验十分方便可以减少大量的计算 在t-检验中因素效应的平均值可以作为效应值的绝对值可以用误差的均方根作为误差的平均值t-检验的具体步骤

32、如下 计算因素效应值 计算误差的均方根标准差 4-8 若在安排实验时没有构造误差列则可根据正交性先求出De在根据De用下求出se 4-9 4-10 查t-分布表求出 根据查的数据求出 Se 4-11 Se 4-12 Se 4-13 比较判断若 Se则称该因素是不显著的Se Se则称该因素是显著的Se Se则称该因素是很显著的Se则称该因素是极显著的应当注意的是在用t-分布进行显著性检验时所取得的显著性水平为a2经显著性检验后不显著的的因素的方差及自由度都应归入误差 4-14 4-15这就说明不显著的因素可以看成与误差是等价的com合的确定 当实验中要考虑交互作用时最优组合的确定就有些困难了对于

33、没有交互作用的因素其最优水平的确定就是根据因素水平平均值但对于那些有交互作用的因素就需要统一考虑这是因为若因素Fi和因素Fj有交互作用且不考虑交互作用时Fi的l水平Fj的k水平为最优水平也就是说最优但如果要考虑交互作用就必须在上再加上交互作用项但由于有了项其总和就不一定是最优的了这时就要考察不同组合条件下的项总和最优的才能算是最优如果交互作用的因素超过一对但都是由不同因素构成的那么只需要按以上方法逐对将有交互作用的因素的最优水平找出来并与无交互作用的因素的最优水平一起构成最优组合即可如果一个因素同时在几对交互作用中出现就要把这个因素所涉及的全部具有交互作用的因素集合在一起需要将这些因素的全部水

34、平组合连同交互作用一起从中找出最优组合例如因素1和因素2有交互作用同时因素2和因素3有交互作用在这两对交互作用中都包含因素2这时要确定最优组合就要将因素1、因素2和因素3的水平组合连同因素1与因素2 的交互作用及同时因素2与因素3的交互作用统一找出最优水平一共有种组合从中找出最优组合对于交互作用较多的正交设计确定最优组合的一般方法如下 将所有的交互作用的因素找出来 确定一组有交互作用的因素记为集合a 再将所有与该集合中的因素有交互作用的因素添加到该集合中构成新的集合a 重复直到找不到可添加的因素为止 假定集合a中有i个因素则这些因素的所有水平组合有种对应着每一种组合都可以求出这种组合对应的因素

35、效应与交互作用的代数和一共有个从这个值中找出一最优值这个值所对应的集合a中的各因素的水平组合即为这些因素的最优组合 从中找出的所有的交互作用的因素中去掉a中的所有因素在重复直到全部有交互作用的因素的最优水平都确定出来为止 将各有交互作用的因素的最优水平与没有交互作用的因素的最优水平统一起来即为试验的最优组合com公式 经过以上的讨论与数据处理之后就可以进行数据的预测了数据的预测实际上就是估计给定水平组合条件下的目标函数的大概取值范围数据的预测主要是根据数据处理后所得到的总评均值及因素效应值预测某种水平组合条件下的目标函数值这种根据总评均值及各因素效应值求给定条件下目标函数值的过程称为数据的预测

36、所求得的数值称为该组合条件下的预测值在求预测值时一般要把不显著的因素效应去掉只考虑显著的因素效应这是因为不显著的因素效应与误差差别不大可以看成误差 误差波动范围的确定 4-16 4-17 4-18 预测值公式 4-19 5基于正交试验的特征选择51 问题分析由于语音情感特征参数较多将所有特征用于语音情感识别存在无关特征和冗余特征不能达到很好的识别效果且特征提取时间开销较大本文提出基于正交实验的语音情感特征选择方法将所提取的特征通过正交试验分析进行选择从而选择出用于识别情感的有效的情感特征提高情感识别的准确度本课题共提取了18个特征因素分别是如何选取这18个特征因素的最优组合以提高识别率52无交

37、互作用处理 1先确定目标函数 将情感的识别率作为目标函数 2确定因素 为了节约时间减少试验次数本次无交互作用处理只选取了其中十五个特征因素 3确定水平 本次课题的特征只有2个水平取该特征因素时作1水平时作为2水平 4选取正交表 由于不考虑交互作用所以只15个因素的自由度是15只要n 15就可以了故选正交表 5表头设计 由于不需要考虑交互作用这几个因素可随意安排见表5-1 6编制试验方案 1为取该因素2为不取该因素 7综合分析见表5-2 表中影响大小数字i 1215依次代表a5d5d2 表5-1a5d5d4d3d2d1a5a5d5d5d4d4d3d3d2实验结果11111111111111162

38、07111111122222222500011122221111222265521112222222211116552122112211221122672412211222211221163791222211112222115690122221122111122586221212121212121250002121212212121216034212212112122121655221221212121121263792211221122112216724221122121122112603422121121221211256902212112211212215690 表5-2a5d5d4d3

39、d2d1a5a5612075603456056126012756077625646636056006142376012876099126077561208760560064876077625991251078706463021381081202162840380216215113最优水平12221221影响大小3 7 5 2 10 1 4 12 表5-2续 d5d5d4d4d3d3d26163756034506228386142256206875991376228505969876099135905255991375926756142255905121938806463323131508828

40、0121508832338最优水平1211121影响大小 14 8 9 13 11 15 6 7 统计分析在2水平正交设计中通常在实验前安排较多的因素及交互作用经数据处理后将效应值较小的因素及交互作用确定为不显著的然后将这些因素及交互作用作为误差来对其他因素及交互作用进行显著性检验 将效应值从小到大排列如下d401069 a501081 d201081 d503231 d503231 a505394 d305406 d407544 d307544 a507556 d509694 d314006 d416156 d216169 d142019 先初步确实前5个较小的效应值为误差 求Se 0207

41、7 差t-分布表得到根据查的数据求出 Se 0207725706 05674 Se 0207740322 08901 Se 0207768688 15162 比较判断不显著显著很显著极显著表5-3a5d5d4d3d2d1a5a5d5d5d4d4d3d3d2显著性误差误差误差误差误差 计算数据波动范围 03437 24380 确定最优组合因为不显著因素在试验范围内任意取值都对目标函数影响很小故可以忽略所以去掉不显著因素和误差列得表5-4因素d1a5d5d4d4d3d3d2最优组合21111121 最优值预测 根据最优水平组合可以求出最优值 com 也就是说最优水平组合下的目标函数值为702989

42、751749置信度为95经试验反馈在最优组合下的目标函数值即情感识别率是714286满足预测值的范围且识别率高对于本次情感识别的课题很有帮助参考文献 1任露泉试验设计及优化科学出版社2009 2com出版社2009 3邓春晖MATLAB基础及其应用教程北京大学出版社 2007 4黄程伟实用情感的特征分析与com 5 com开发与经济2002 6 赵力 语音信号中的情感识别研究软件学报2001 7 栾军现代试验设计优化方法上海交通大学出版社1995 8 Batliner AFischer K Huber R et alHow to Find trouble in CommunicationJSp

43、eech Communication 200340 1-2 117-143 9 Cowie RDouglas-Cowie E Tsapatsoulis Net alEmotion Recognitionin Human Computer InteractionJIEEE Signal Processingmagazine200118 1 32-80 10 S ChennoukhA GerritsG MietR Sluijter Speech Enhancement viaFrequency Extension using Spectral FrequencyA Proc ICASSPCSalt

44、 Lake City 20015 致谢 本论文是在老师的亲切关怀和悉心指导下完成的严肃的科学态度严谨的治学精神精益求精的工作作风深深地感染和激励着我老师不仅在学业上给我以精心指导同时还在思想生活上给我以无微不至的关怀在此谨向老师致以诚挚的谢意和崇高的敬意我还要感谢在一起愉的度过毕业论文小组的同学们正是由于你们的帮助和支持我才能克服一个一个的困难和疑惑直至本文的顺利完成在论文即将完成之际我的心情无法平静从开始进入课题到论文的顺利完成有多少可敬的师长同学朋友给了我无言的帮助在这里请接受我诚挚的谢意最后我还要感谢培养我长大含辛茹苦的父母谢谢你们最后再次对关心帮助我的老师和同学表示衷心地感谢1 1 1

45、 1 1 1 1 2 2 2 2 2 2 2 2 50001 1 1 2 2 2 2 1 1 1 1 2 2 2 2 65521 1 1 2 2 2 2 2 2 2 2 1 1 1 1 65521 2 2 1 1 2 2 1 1 2 2 1 1 2 2 67241 2 2 1 1 2 2 2 2 1 1 2 2 1 1 63791 2 2 2 2 1 1 1 1 2 2 2 2 1 1 56901 2 2 2 2 1 1 2 2 1 1 1 1 2 2 58622 1 2 1 2 1 2 1 2 1 2 1 2 1 2 50002 1 2 1 2 1 2 2 1 2 1 2 1 2 1 603

46、42 1 2 2 1 2 1 1 2 1 2 2 1 2 1 65522 1 2 2 1 2 1 2 1 2 1 1 2 1 2 63792 2 1 1 2 2 1 1 2 2 1 1 2 2 1 67242 2 1 1 2 2 1 2 1 1 2 2 1 1 2 60342 2 1 2 1 1 2 1 2 2 1 2 1 1 2 56902 2 1 2 1 1 2 2 1 1 2 1 2 2 1 5690 f 2r1c size data1 r c-1l r1fsum0 zeros fr -综合分析 for i 1r for k 1r1 for j 1f if data1 ki j sum0

47、 ji sum0 ji data1 kc 求和 end end endendsp sum0l 求水平平均值jc sp -min sp 求极差 jcpxlh sort jc 各因素对目标函数影响的顺序 升序序排列 F1 0for m 1r1 F1 data1 mc F1endfor i 1r if sp 1i sp 2i zy 1i 1 else zy 1i 2 endendzy 最优组合-统计分析 F0 F1r1 求总平均值F sp-F0 求因素效应值f1 f-1 求因素自由度for n 1r 求因素的方差D 1n F 1n 2 16 endDfor i 1r M 1i F 1i endN s

48、ort abs M x input 误差列数x 选择误差列数for i 1x for j 1r if abs M 1j N 1i A 1i j 求误差列号 end endendS 0for i 1x S F 1A 1i 2Sendfe xf1Se sqrt Sfe 误差总方差-显著性检验 查t分布表得t0025fe 25706t0005fe 40322t00005fe 68688L 0for i 1r if abs F 1i Set00005fe fprintf 该因素是极显著的 else if abs F 1i Set0005fe fprintf 该因素是很显著的 else if abs F

49、 1i Set0025fe fprintf 该因素是显著的 else L L1 不显著因素数 fprintf 该因素不显著的 B 1L i 找出不显著列号 end end endend-预测值公式-1 误差波动范围的确定-f_e L查t分布表得t0025 f_e 的值t0025f_e 23646W 0for i 1x W F 1A 1i 2W endY 0for i 1L Y F 1B 1i 2Y 不显著因素效应平方和Yend S_e sqrt Yf_e Bodong S_et0025f_esqrt r1-f_e 误差波动范围-2 预测算法-T 0for i 1L T Tabs F 1B 1i 不显著的endH 0for i 1r H Habs F 1i endFF F0H-T安徽建筑大学毕业设计论文- 1 -III22- 1 -128- 1 -

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!