说话人识别特征参数MFCC的提取与分析

上传人:小** 文档编号:48954673 上传时间:2022-01-16 格式:DOC 页数:1 大小:26.50KB
收藏 版权申诉 举报 下载
说话人识别特征参数MFCC的提取与分析_第1页
第1页 / 共1页
资源描述:

《说话人识别特征参数MFCC的提取与分析》由会员分享,可在线阅读,更多相关《说话人识别特征参数MFCC的提取与分析(1页珍藏版)》请在装配图网上搜索。

1、龙源期刊网 说话人识别特征参数 MFCC 的提取与分析作者:周春晖 卢荣 潘姿蓉来源:电子技术与软件工程 2016 年第 22 期摘要提取特征参数在说话人识别系统内是非常重要的步骤,说话人语音的很多特有个性信息包 含于特征参数内,例如发声特征或者语义特征,利用特征提取的方法一方面可以去掉声音里没 用的冗余信息,剩下有用的体现说话人个性不同的特征信息,特别是可以有效减少计算量、模 板数目以及存储空间。选用的特征参数的会直接关系到整个系统的工作性能,良好的特征参数 需要拥有好的稳定性和好的独立性,一方面可以不受到外界情况的干扰,不容易为其他的声音 所替代,另一方面,能够较好的辨别不同说话人,说明说

2、话人之间的差异。【关键词】特征参数 倒谱系数 LPCC MFCC1 前言当今说话人识别领域使用的特征参数有多种,它们各具特点,能够用于各种不一样的场 合,其中应用较为广泛的具有代表性的特征参数是:基音频率、线性预测系数(LPC )、线性预测倒谱系数(LPCC)、梅尔倒谱系数(MFCC)。2 MFCC 的提取与分析梅尔倒谱系数( MFCC),MFCC 是利用人耳听觉模型建立的倒谱系数,人类的听觉系统 可以看成一个非线性系统,它对于不同的频率信号的灵敏度是不一样的,一般是对数型关系。 正是由于 Mel 倒谱系数基于人耳感知这种特殊的特性, Mel 倒谱系数在抗噪声能力以及鲁棒性 这些方面都比其它特征参数要优秀了很多。对于不一样频率的语音,人耳有不一样的感知能力,声音的物理频率表示单位是梅尔(Mel )。频率和 MFCC 系数的关系如下式:其中,f的单位为Hz。参照Zvick的研究所说,临界带宽按照频率不同而改变,在1000Hz 以下时,维持线性分布,带宽在 100Hz 附近;在 1000Hz 以上时,表现为对数增长形 式,如图 1 所示。Mel 参数的提取过程:( 1)把之前预处理过的语音信号,即时域信号做傅里叶变化(DFT) 。计算得到线性频谱x( k),其转换公式为:

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!