一种二胡音乐的WAVE转MIDI的设计方法

上传人:ba****u 文档编号:210797542 上传时间:2023-05-18 格式:DOCX 页数:8 大小:17.63KB
收藏 版权申诉 举报 下载
一种二胡音乐的WAVE转MIDI的设计方法_第1页
第1页 / 共8页
一种二胡音乐的WAVE转MIDI的设计方法_第2页
第2页 / 共8页
一种二胡音乐的WAVE转MIDI的设计方法_第3页
第3页 / 共8页
资源描述:

《一种二胡音乐的WAVE转MIDI的设计方法》由会员分享,可在线阅读,更多相关《一种二胡音乐的WAVE转MIDI的设计方法(8页珍藏版)》请在装配图网上搜索。

1、一种二胡音乐的WAVE转MIDI的设计方法聂子卿;杨士颖【摘要】文中的目的是介绍一种将WAVE格式的二胡音乐文件转换成MIDI格式 的设计过程.具体方法如下:首先,利用小波变换和快速傅里叶变换联合提取出音符的 基频;其次,根据 MIDI 音乐的消息格式,将得到的各基频转换成相应的 MIDI 音符; 再次,根据二胡音乐的特性,设定双门限阈值筛选出有效的音符.最后加入其他控制信 息,最终结果是组合成MIDI的音轨文件经实验得出结论,该方法针对二胡音乐的音 高提取有较高的准确率,同时能够生成所需的有效MIDI文件.Mainly introduced the specific design proce

2、ss of converting an erhu mine file from WAVE to MIDI. Firstly .abstract the fundamental frequency of the notes by means of DWT and FFT analysis. Seccndly.transfonn the fundamental fnquency Id MIDI notes on the bans of specific message format of MIDI files. Thirdly,set specified dual-threshold accord

3、ing to the properties of emu to screen valid notes,and finally compote them with other control information to formMIDI files. Experiments show mat the method owns a higher pitch extraction accuracy for the erhu mask .and can generate the required effective MIDI file.【期刊名称】 计算机技术与发展【年(卷),期】 2012(022)

4、007【总页数】4页(P17-19,23)【关键词】二胡;DWT变换;FFT变换;基频;音乐;MIDI;WAVE作 者】聂子卿;杨士颖 【作者单位】上海大学影视艺术技术学院,上海200072;上海大学影视艺术技术学 院,上海200072【正文语种】中文【中图分类】TP310引言传统的WAVE到MIDI的转换,其核心技术主要是提取音符的基频和时值,并且 大多是针对于诸如钢琴等键盘类的乐器,而对于二胡这种中国传统的拉弦乐器,其 识别效果不是很好。究其原因,主要源于二胡乐曲自身有很多自然泛音和人工泛音, 以及很多的谐波分量,导致在使用传统的识别方法进行识别的过程中,端点之间的 检测在识别过程中会出现

5、音符的误差,从而导致识别过程中音符的缺失以及时值的 非准确提取1。文中通过在提取参数之前加入小波变换进行相应的预处理以及 在提取出各个特征参数之后利用二胡特有的频率范围设置相应音符提取阈值参数的 方法,大大地提高音符的识别率和转换的准确率2。1实现方法与MIDI特性文中介绍的从WAVE到MIDI的实现过程主要包括乐音识别和MIDI音乐的合成 两个部分。其中乐音的识别则主要包括基频的识别和提取。在这过程中采用的是离 散小波变换(DWT)和快速傅里叶变换的结合的方法,并通过对功率谱函数的处理, 最终得到各个音符的基频;在MIDI音乐的合成过程中,则主要根据MIDI音乐的消 息格式3。首先将上阶段识

6、别好的基频,按照相应的变换公式,转换成MIDI 的音符,然后通过音符的双门限设定,筛选有效的音符,接下来再通过note on和note off两个指标量来确定有效音符中具体哪些音符需要乐器发音,哪些乐器 需要关闭,以及相应的响应时间,最终在确定整首曲子的节拍(tempo)的情况下, 将所有的音符信息和其他相应的控制信息,整合到MIDI的音轨中,从而完成音乐 合成的整个过程。在介绍具体的实现过程之前,关于乐音识别和MIDI音乐的合成两方面,有以下几 个知识点需要简要的说明一下。1.1离散小波变换(DWT)信号f(t)的连续小波变换为:其中a为尺度因子,b为平移参数,申(t)wL(R)L2(R),

7、当申(t)的傅里叶变换申(w) 满足时,申(t)则为基本小波4。对a,b进行如下的离散采样:则小波变换申a, b(t)变为因此离散小波变换的定义为:1.2快速傅里叶变换(FFT)非周期性连续时间信号x(t)的傅里叶变换可以表示为式中计算出来的是信号x(t)的连续频谱,但是在实际的控制系统中能够得到的是连 续信号x(t)的离散采样值x(nT)。因此需要利用离散信号x(nT)来计算信号x(t)的频 谱5。快速傅里叶变换是离散傅里叶变换(DFT)的一种快速算法,其中有限长 离散信号x(n)的N点序列X n 0 + 组 成。表1 MIDI消息中头块的结构定义头块(Header Chunk)类型长度数据

8、4个字节4 个字节6个字节MThd文件头描述部分的字节数设置格式类型、轨道个数、基本 时间格式类型表2 MIDI消息中音轨块的结构定义音轨块(Track Chunk)类型长度数据4个字节 4个字节二进制数据MTrk4个字节表示数据部分的总字节数 + 2 具体的实现过程2.1 基频的提取 乐音音符主要是由基频分量和倍频分量的泛音组成,其中基频决定了音符的实际音 高,它是音符中最重要的频率分量7。在传统的乐音识别过程中,多半采用的 是钢琴音源,它节奏相对明了,谐波分量不是很多,所以一般采用谐波峰值法提取 基频8。但是对于二胡音乐来说,其高频分量的泛音非常丰富,而且基频分量 也相对较小。其波形可参考

9、图1。这时再去单单采用谐波峰值法的话,其误判的可 能性会非常大。因此针对这一情况,采用了工程上使用的较多的daubechies小波 对二胡的音源文件进行预处理,它的近似函数平滑性好,高频分解迅速。图1 二胡音乐的原始波形对读入的WAVE格式的源文件进行离散小波(DWT)变换,将其分解到低频尺度, 这一过程的基本原则就是把尽可能多的能量保留在基音附近的频率分量上,而过滤 掉其他的高频分量9。在分解的过程中,分解尺度j和信号的采样率fS以及待 识别的音符的基频f0之间存在以下的公式:文中采用的WAVE声源的采样率为44100HZ , 16位分辨率双声道,因此中音区 的各个音符对应的小波分解尺度满足

10、表3 中的具体关系。表3音符和小波变换的尺度之间的对应关系中音cldlelflglalbl f0261.63293.66 329.63 349.23392440493.88 j6665555在对信号进行完分解以后需要对信号分量进行FFT操作,在这一过程中最重要的 两个参数,就是采样的点数N和采样率fS。它们决定了 FFT操作过程中最小的频 率间隔Af10 。同时也直接影响到基频的识别精度。由公式(6)可得,当FS采 用2. 2kHz , N =2048点时,山的分辨率为1Hz,完全满足基频识别的精度要求。在对小波分解后得到的低通分量进行FFT操作以后,得到的频率幅值是一对共轭 的复数,且数据量

11、也只为N/2的数据。为了更好的方便后续关于基频的查找识别 工作,在这里对FFT操作后的数据进行了求功率谱函数的操作。图2显示的是源 文件中的一个片段经过功率谱操作后的信号幅值。图2经过功率谱函数操作后的信号幅值图 计算功率谱的公式如公式7所示。(k = 0,1,2,N/2 - 1)XR(k )为 X(k )的实部,XI(k )为 X(k)的虚部。 最后通过求的最大值便可准确地找到基频。2.2 MIDI 音乐的合成在得到各个基频序列以后,根据十二平均律以及国际第一标准音高440Hz与 MIDI音符#69的相对应关系,可得出基频到MIDI音符的具体变换公式11:经过变换得到相应的MIDI音符,由于

12、分析的音源是二胡,其演奏的全音域为 293.7 1760Hz,其对应MIDI的音符值范围介于note top和note low之间, 经过这一次的筛选,可以确定需要分析的音符值。与此同时,在得到基频后,可以 根据公式9得到每个音符对应MIDI标准信息格式中的力度vel值1 2。由于MIDI的消息是具体规定音乐合成器开关的指令,所以消息中包括打开和关闭 乐器的两类信息。其具体的实现过程是通过设定双门限note on / note off(二者 是一个回环),来再一次筛选上一步得到的note值,哪些需要打开乐器,哪些需 要关闭乐器,以及该指令操作的时间参数delta - time的值。这一操作,等

13、同于 设定了音符的时值。最后需要操作的是设定音符演奏的tempo值,再联同有效的 音符值组成有效的音轨信息,并加上头块信息。最终成为一个合格的、可播放的 MIDI文件。详细实现过程见图3。图3 MIDI音乐合成的流程图3 结束语在整个实现过程中,充分考虑到二胡音乐的乐理特性。在基频识别的过程中,使用 了离散小波变换和快速傅里叶变换联合处理操作,并通过功率谱函数的操作,最终 准确地得到各个音符对应的基频,而在MIDI音乐合成的过程中,根据二胡的音域 范围以及双门限的灵活设置则能十分方便准确地得到有效音符,并最终生成所需要 的MIDI文件。参考文献:1 徐国庆,杨丹小波变换与FFT联合识别乐音J.

14、重庆大学学报(自然科学 版),2005,28(12):5154.2 Daubechies I小波十讲M 李建平,杨万年译北京:国防工业出版社, 2004:12 - 15.3李晨,周明全音频检索技术研究J.计算机技术与发展,2008 ,18(8):215 - 222.4 李海东,李青基于阈值法的小波去噪算法研究J.计算机技术与发展,2009 , 19(7):56 - 58.5 陈峰,成新民.基于小波变换的信号去噪技术及实现J.现代电子技术,2005(3):12 - 15.6 Itou N,Nishimoto K.Voice-to-MIDI System for Singing Melodies

15、with LyricsC/Proceedings of the international conference on advances in computer entertainment technology.s.l.:s.n.,2007.7 Xu J W,Principe J C. A novel pitch determination algorithm based on generalized correlation functionC/Proc. of Machine Learning for Signal Processing.s.l.:s.n.,2007.8 Xu Jianwu,

16、Principe J C.A Pitch Detector Based on a GeneralizedCorrelation FunctionJ.IEEE Trans on Audio,Speech and Language Processing,2008,16(8):14201432.9 Bello J P,Daudet L,Abdullah S,et al.A tutorial on onset detection in music signalsJ.IEEE Transactions on Speech and Audio Processing, 2005,13(5):10351047

17、.10 Hu N,Dannenberg R.Bootstrap leaning for accurate onset detectionJ.Machine Learning,2006,65(7):457471.11 Toh C C,Zhang B,Wang Y.Multiplefeature fusion based on onset detection for solo singing voiceJ. Proc. of ISMIR,2008, 32(9):515520.12 Lacoste A,Eck D.Onset Detection with Artificial Neural Networks for MIREX 2005C/Extended Abstract of the 1st Annual Music Information Retrieval Evaluation Exchange(MIREX 2005).London:s.n., 2005.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!