基于MATLAB算法的数字变声器
《基于MATLAB算法的数字变声器》由会员分享,可在线阅读,更多相关《基于MATLAB算法的数字变声器(13页珍藏版)》请在装配图网上搜索。
1、.基于MATLAB算法的数字变声器【摘要】变声器的原理是通过改变输入声音频率,进展改变声音的音色、音调,使输出声音在感官上与原声音不同。变声器是借助对声音音色和音调的双重复合改变,实现输出声音的改变。通过自己发声,共振峰频率的改变是基于重采样实现的。同时用LPC倒谱分析法分析共振峰的围,通过MATLAB编写程序并构置GUI界面。实验过MATLAB软件对采集来的语言信号进展频谱分析,讨论不同人之间的噪音源参数和共振峰参数,通过对不同人语言信号频率和幅度的改变来实现不同人之间的语音转换。【关键词】短时自相关法; LPC倒谱;语音信号; matlab GUI;1引言随着生活水平的提高,科技的不断进步
2、,很多人为了娱乐,从而希望改变自己的声音;还有如今的许多的节目为了保护被者,都对声音进展了相应的处理。本设计通过编写matlab程序,借助对声音音色和音调的双重复合改变,实现输出声音的改变。共振峰频率的改变是基于重采样实现的,从重采样原理知道,这也同时印发了基频的变化,为保证基频变化和共振峰频率变化的独立、互不相关,在基频移动时必须考虑抵消重采样带来的偏移,理论上只要基频检测足够准确,确实可以保证基频改变和共振峰频率改变间的互不相关。保证变声效果的自然度主要是没有采用基因检测将基因移动和共振峰变化彻底隔离的缘故。本次课程设计就是运用我们所学到的理论知识,用MATLAB软件来实现对语音信号的变声
3、处理,理论联系实际,从而更好地掌握以及运用所学习的知识。2数字变声器的原理与算法2.1根本原理语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语音可分为有声语音和无声语音,前者是由声带振动鼓励的脉冲信号经声腔调制变成不同的音,它是人类语言中元音的根底,声带振动的频率称为基频。无声语音则是声带保持开启状态,制止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关,如下表,而无声语音则没有表达这个特征。说话人的个性化音色和语音的另外一个声学参数共振峰频率的分布有关。儿童由于声道短,其共振峰频率高于成年人,成年女性的声道一般短于成年男性,所
4、以女性的共振峰频率一般高于男性。在进展性别变声时,主要考虑基音周期、基频和共振峰频率的变化。其中男生、女生和童声的基频、共振峰的关系如图1所示;基音周期改变时,基频、共振峰同时变化,假设伸展既有男变女、女变童,反之亦可。本实验是基于翻开一种声音进展相关参数提取,修改接近于女声、男声或童声,实现声音的变换。图1 人群基频与共振峰的关系2.2实现过程及算法采用线性预测参数合成法。线性预测参数合成法利用LPC语音分析方法,通过分析自然语音样本,计算出LPC系数,就可以建立信号产生模型,从而合成出语音。大致流程如图2所示。图2 制作流程基于短时自相关法的基音周期估值对语言信号进展低通滤波,然后进展自相
5、关计算。在低通滤波时,采用巴特沃斯滤波器。根据人的说话特征设定相应指标参数,对本段语音设计算出巴特沃斯模拟滤波器的阶数N为5,3dB截止频率,算出为0.175,归一化低通原型系统函数为:其中将带人中,得到低通滤波器,根据设定的滤波器编写matlab程序,当信号经过低通滤波器后,对原始信号滤波产生结果如下列图2所示,低通滤波后,保存基音频率,然后再用8kHz采样频率进展采样,采样序列为*(n),然后进展下一步的自相关计算。图3 原始信号低通滤波语音信号的短时自相关函数定义语音信号自相关函数如下:其中k为信号延迟点数:为语音信号;N为语音帧长度。经过低通滤波之后,取160个样点数,帧长取10ms,
6、对每帧语音求短时自相关,取得自相关最大点数,自相关函数在基音周期处表现为峰值,这些峰值点之间的间隔的平均值就是基音周期。2.2.3 LPC倒谱法提取共振峰通过线性预测分析得到合成滤波器的系统函数为其冲击响应为h(n),为预测系数。然后求h(n)的倒谱(n),首先根据同态分析方法,有(z)=logH(z),因为Hz是最小相位的,即在单位圆是解析的,所以(z)可以展开成级数形式,即(z)=,也就是说(z)的逆变换(n)是存在的,设(n)=0,将等式两端分别对求导,得到:=有1-=, 令式左右两边Z的各次幂前系数分别相等得到:(1)=1(n)=+ 1(n)= np在本实验中,取预测阶数为10,语音的
7、样点数为160,按照上式可直接从预测系数求得倒谱(n),这个倒谱是根据线性预测模型得到,即称为LPC倒谱。线性预测语音信号合成根据线性预测的根本思想,用过去M个样点值来预测现在或未来的样点值:n=n是预测信号,为预测系数,y(n)为取样信号,预测误差n:E(n)=E为使E(n)最小,对求偏导,并令其为零,有:Ey(n-)=0 =1,M上式说明采用最正确预测系数时,预测误差与过去的样点值正交。由于语音信号的短时平稳性,要分帧处理,对于每一个样点值记为(n), (n+N-1),这段语音记为Yn。对于语音段Yn,并记(j,i)=E,对于语音段Yn,它的自相关函数为: n=1,M根据Yulewalke
8、r方程,可以解出样值,用这种方法定期地改变鼓励参数u(n)和预测系数,并使用修改正后的基因周期和共振峰参数,就能合成出语音,合成语音样本如下:Sn=+Gu(n)为预测系数;G为模型增益;u(n)为鼓励;合成样本s(n);p为预测器阶数;运行算法流程图开场开场翻开音频导入语音数据S 数据归一化变童声女变男男变女建立滤波器重建语言合成并加窗确定帧数线性预测法预测p个系数计算减小基音周期提取共振峰合成语音合成鼓励3数字变声器的软件实现及仿真结果3.1 界面设计在设计数字变声器的界面时,使用了MATLAB提供的可视化的界面环境Guide。相比通过编写程序进展GUI的设计,可视化的界面环境更加方便快捷。
9、见图4图4 界面设计 1按钮组:设计中使用了两个按钮组,把翻开、原声、男变女、女变男、童声三项功能放在一组;另一个把语音的图像即4个a*es放在了一组。 2按钮:最常用的控件,用于相应用户的鼠标单击,按钮上有说明文字说明其作用。设计中使用了五个按钮,分别用于翻开、原声、男变女、女变男、童声。3 轴:用于显示图像。3.2回调函数对控件的Callback属性编程是实现GUI的根本机制,我们下来就要在各函数中编写程序代码,完成各回调函数的功能。1翻开function dakai_Callback(hObject, eventdata, handles)filename,pathname=uigetf
10、ile(*.wav,ALL FILES,选择声音);ifisequal(filename pathname,0,0)return;endstr=pathname filename;temp,Fs=audioread(str);temp1=resample(temp,80,441);handles.y=temp1;handles.y1=temp;handles.Fs=Fs;guidata(hObject,handles);2原声function yuansheng_Callback(hObject, eventdata, handles)c=handles.Fs;sound(handles.y1
11、,c);plot(handles.a*es1,handles.y1)title(handles.a*es1,时域图);ysize=size(handles.y1);y1=fft(handles.y,length(handles.y1);ysize=size(y1);plot(handles.a*es2,abs(y1);*label(handles.a*es2,频率);ylabel(handles.a*es2,幅度);title(handles.a*es2,频率特性);3男变女function nanbiannv_Callback(hObject, eventdata, handles)FL =
12、 80 ; % 帧移 WL = 240 ; % 窗长 P = 10 ; %预测系数个数 s = handles.y;fs = handles.Fs;% 定义常数 s = s/ma*(s); % 归一化 L = length(s); % 读入语音长度 FN = floor(L/FL)-2; % 计算帧长,floor;向负无穷方向% 预测和重建滤波器e*c = zeros(L,1); % 鼓励信号,double类零矩阵L行1列zi_pre = zeros(P,1); % 预测滤波器状态s_rec = zeros(L,1); % 重建语音zi_rec = zeros(P,1);% 变调滤波器e*c_
13、syn_t = zeros(L,1); % 合成的鼓励信号,创立一个L行1列的0脉冲s_syn_t = zeros(L,1); % 合成语音last_syn_t = 0;% 存储上一个段的最后一个脉冲的下标zi_syn_t = zeros(P,1); % 合成滤波器hw = hamming(WL); %汉明窗%滤波器% 依次处理每帧语音for n = 3:FN %从第三个子数组开场% 计算预测系数s_w = s(n*FL-WL+1:n*FL).*hw; %汉明窗加权 A,E=lpc(s_w,P); %线性预测计算预测系数% A是预测系数,E会被用来计算合成鼓励的能量s_f=s(n-1)*FL+
14、1:n*FL); % 本帧语音%利用filter函数重建语音 e*c1,zi_pre = filter(A,1,s_f,zi_pre); e*c(n-1)*FL+1:n*FL) = e*c1; %计算鼓励%利用filter函数重建语音 s_rec1,zi_rec = filter(1,A,e*c1,zi_rec);s_rec(n-1)*FL+1:n*FL) = s_rec1; %重建语音% 下面只有得到e*c后才可以s_Pitch = e*c(n*FL-222:n*FL); PT(n) = findpitch(s_Pitch); %计算基音周期pt G = sqrt(E*PT(n); %计算合
15、成鼓励的能量G% tempn_syn = 1:n*FL-last_syn;% e*c_syn1 = zeros(length(tempn_syn),1);% e*c_syn1(mod(tempn_syn,PT)=0) = G; %*一段算出的脉冲% e*c_syn1 = e*c_syn1(n-1)*FL-last_syn+1:n*FL-last_syn);% s_syn1,zi_syn = filter(1,A,e*c_syn1,zi_syn);% e*c_syn(n-1)*FL+1:n*FL)=e*c_syn1; %计算得到合成鼓励% s_syn(n-1)*FL+1:n*FL) = s_sy
16、n1; %计算得到合成语音% last_syn = last_syn+PT*floor(n*FL-last_syn)/PT); PT1 =floor(PT(n)/2); %减小基音周期poles = roots(A);deltaOMG =100*2*pi/fs;for p=1:10 %增加共振峰ifimag(poles(p)0poles(p) = poles(p)*e*p(1j*deltaOMG);elseifimag(poles(p)=0.85*Rop Rop=R2; Top=T2;endif R30.85*Rop Rop=R3; Top=T3;endPT=Top;return3女变男fun
17、ction nvbiannan_Callback(hObject, eventdata, handles)FL = 80 ; % 帧移 WL = 240 ; % 窗长 P = 10 ; %预测系数个数 s = handles.y;fs = handles.Fs;% 定义常数 s = s/ma*(s); % 归一化 L = length(s); % 读入语音长度 FN = floor(L/FL)-2; % 计算帧长,floor;向负无穷方向% 预测和重建滤波器e*c = zeros(L,1); % 鼓励信号,double类零矩阵L行1列zi_pre = zeros(P,1); % 预测滤波器状态
18、s_rec = zeros(L,1); % 重建语音zi_rec = zeros(P,1);% 变调滤波器e*c_syn_t = zeros(L,1); % 合成的鼓励信号,创立一个L行1列的0脉冲s_syn_t = zeros(L,1); % 合成语音last_syn_t = 0; % 存储上一个段的最后一个脉冲的下标zi_syn_t = zeros(P,1); % 合成滤波器hw = hamming(WL); %汉明窗%滤波器% 依次处理每帧语音for n = 3:FN %从第三个子数组开场% 计算预测系数s_w = s(n*FL-WL+1:n*FL).*hw; %汉明窗加权 A,E=lp
19、c(s_w,P); %线性预测计算预测系数% A是预测系数,E会被用来计算合成鼓励的能量s_f=s(n-1)*FL+1:n*FL); % 本帧语音%利用filter函数重建语音 e*c1,zi_pre = filter(A,1,s_f,zi_pre); e*c(n-1)*FL+1:n*FL) = e*c1; %计算鼓励%利用filter函数重建语音 s_rec1,zi_rec = filter(1,A,e*c1,zi_rec);s_rec(n-1)*FL+1:n*FL) = s_rec1; %重建语音% 下面只有得到e*c后才可以s_Pitch = e*c(n*FL-222:n*FL); PT
20、(n) = findpitch(s_Pitch); %计算基音周期pt G = sqrt(E*PT(n); %计算合成鼓励的能量G% tempn_syn = 1:n*FL-last_syn;% e*c_syn1 = zeros(length(tempn_syn),1);% e*c_syn1(mod(tempn_syn,PT)=0) = G; %*一段算出的脉冲% e*c_syn1 = e*c_syn1(n-1)*FL-last_syn+1:n*FL-last_syn);% s_syn1,zi_syn = filter(1,A,e*c_syn1,zi_syn);% e*c_syn(n-1)*FL
21、+1:n*FL)=e*c_syn1; %计算得到合成鼓励% s_syn(n-1)*FL+1:n*FL) = s_syn1; %计算得到合成语音% last_syn = last_syn+PT*floor(n*FL-last_syn)/PT); PT1 =floor(PT(n)/2); %减小基音周期poles = roots(A);deltaOMG =100*2*pi/fs;for p=1:10 %增加共振峰ifimag(poles(p)0poles(p) = poles(p)*e*p(1j*deltaOMG);elseifimag(poles(p)0 ; poles(p) = poles(p)*e*p(1i*deltaOMG);elseif imag(poles(p)
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。