基于投影特征的简谱数字识别方法

上传人:lis****666 文档编号:148206368 上传时间:2022-09-04 格式:DOC 页数:3 大小:16.50KB
收藏 版权申诉 举报 下载
基于投影特征的简谱数字识别方法_第1页
第1页 / 共3页
基于投影特征的简谱数字识别方法_第2页
第2页 / 共3页
基于投影特征的简谱数字识别方法_第3页
第3页 / 共3页
资源描述:

《基于投影特征的简谱数字识别方法》由会员分享,可在线阅读,更多相关《基于投影特征的简谱数字识别方法(3页珍藏版)》请在装配图网上搜索。

1、基于投影特征的简谱数字识别方法摘要:简谱数字识别是光学乐谱识别中的一个重要分支,传统的识别方法是模板匹配,该方法计算量大,且对模板的依赖性很强,导致其鲁棒性较弱,对图像的噪声和位移敏感。考虑到简谱数字识别规模较小,通过分析数字对噪声较为稳定的几何特征,提出一种改良的投影特征匹配法对简谱数字进展快速识别匹配。理论分析和实验结果说明,改良的投影特征匹配法与传统的模板匹配法相比,识别精度和速度有所进步,鲁棒性也更强。关键词:投影;数字识别;模板匹配;欧氏间隔 DOIDOI:10.11907/rjdk.151538中图分类号:TP317.40 引言最为经典的OMR技术莫过于模板匹配法。该方法的根本思想

2、是通过为每个待识别字符定义一个典型的标准模板,然后采用直方图法【3】、轮廓矩、欧氏间隔 【6】、曼哈顿间隔 【7】等度量方法比拟待识别的样本与标准模板,根据度量方法得出的相似度来决定样本与模板是否属于同一类别。由于标准模板的存在,常规模板匹配方法识别与数字模板数字字体一致时的识别率很高,但是它对噪声敏感,并且对数字的不同字体也不具有适应性,鲁棒性不强当数字的字体字形变化、识别图片的分辨率较低或噪点较多时,该方法的识别率下降。另外,由于常规模板匹配直接涉及到两个图像矩阵级别的运算,其计算量通常较大,时间开销较多。考虑到简谱中的数字识别规模较小,只有07八个数字,可通过分析简谱数字对噪声较为稳定的

3、几何特征和程度或垂直投影特征,避开常规模板匹配法在鲁棒性上的优势,应用一种改良的投影特征匹配法对简谱数字进展快速识别匹配,并给出详细的算法流程,分析了算法的时间复杂度。理论分析和实验结果说明,改良的投影特征匹配法与传统的模板匹配法相比,识别精度和速度有所进步,鲁棒性也更强。1 算法原理1.1 预处理相机获取的信息多为32位真彩色信息,但乐谱只有黑白两色,人眼分辨乐谱不需要其它任何颜色信息。因此,在开场数字识别之前,可先采用加权平均值法转换三通道彩色乐谱到单通道灰度图,将彩色图像转换为8位灰度图,将图像的RGB三维信息转换为一维,可大幅度减小计算量,公式如下:上式中,红绿蓝三通道的权值是根据人眼

4、对颜色的敏感度测定的,所以,运用式1可以得到较为理想的灰度图像。为进一步减少计算量,还需要做二值化处理。将乐谱背景置为黑色值为0,音符置为白色值为255,在方便人眼观察的同时,可以为后续的图像处理技术带来操作上的便利。由于待识别的目的结果只有07八种数字,采用程度投影法和垂直投影法将图像从二维矩阵降维到一维向量以进展快速匹配。设图像宽度和高度分别为w和h,现对其做程度投影,得到后的向量除以255w,所得到的向量下标对应图片坐标系中的纵坐标,而指定下标的值对应某一像素程度方向所有非零白色像素占该图片宽度的百分比。同理再对其做垂直投影,得到后的向量除以255h,那么所得到的向量下标对应图片坐标系中

5、的横坐标,而指定下标的值对应某一像素垂直方向所有非零白色像素占该图片高度的百分比。其它数字依此类推,所有数字的程度、垂直投影向量如图1所示。观察8个数字及其程度、垂直投影向量的特征,这一步需要选取相比照拟稳定,即可以直接从图像上表达出的不怎么受噪声影响、鲁棒性较强的特征来区分它们。可利用大局部图像中都存在的接近于100%的峰值区间,它们的程度位置特征比拟具有唯一性。详细区分方法如下:3剩下3、6、0三个数字,可以通过比拟其垂直投影在前半段的峰值与后半段的峰值差来挑选出3一般对于0和6,前后峰值差超过10%,而3的前后峰值差那么会小于10%反映在图4中3图像的灰色局部。最后可利用6的程度投影在前

6、半段存在的跳变反映在图4中6图像的灰色局部区分出6和0。 进一步总结,上述3步也即是说,仅需要提取程度和垂直向量的峰值区间的位置作为特征,即可区分出07八个数字。算法1 投影特征匹配算法输入:二值化后的矩形图片矩阵I。输出:该符号的类型type07为数字,-1为识别错误。Step 1: 初始化type=-1,计算I的宽度w与高度h。1.3 时间复杂度设图像的宽和高分别为w与h,那么Step 2中求程度投影与垂直投影向量并对其缩放各只需要遍历一遍图像,时间频度为Tw,h=2wh;Step 3中,只需各自遍历一遍程度和垂直投影向量即可计算出最大值横纵坐标、平均值以及前后半段的峰值,时间频度Tw,h

7、=w+h;Step 4Step 10中,只用到了根本乘除运算和比拟操作,时间频度为Tw,h=C常数;Step 11中,还需再遍历一遍程度投影向量,时间频度为Tw,h=h。综上所述,该算法的总时间频度为Tw,h=2wh+w+2h+C,时间复杂度为Owh。2 实验结果与分析3 结语通过分析简谱数字的几何特征,提出了投影特征匹配法,即一种将图像从二维矩阵降维到一维向量的快速匹配方法。在给出详细的算法思想之后,计算了算法的时间复杂度,并用不同的实验结果证实了算法的识别精度、识别速度和鲁棒性都要优于传统的欧氏间隔 模板匹配法。而对于如何将数字识别扩展到字符甚至汉字的快速识别、如何进一步进步识别精度等,相

8、关工作有待进一步展开。参考文献:【2】 何欢.光学乐谱识别技术研究.北京:北方工业大学,2022.【3】 李小伟. 基于FPGA的灰度图像模板匹配并行处理研究.武汉:华中科技大学,2022.【4】 王慧.基于模板匹配的手写体字符识别算法研究.北京:北京交通大学,2022.【5】 孔金生,张小凤,王璇.基于轮廓特征的模板匹配方法及其应用.计算机工程与应用,202222:202203.【6】 黄琛.基于Hausdorff间隔 模板匹配的行人检测算法研究与应用.北京:清华大学,2022.【7】 CHING Y SUEN,JINNA TAN.Analysis of errors of handwritten digits made by a multitude of classifiers.Pattern Recognition Letters archive, 2022. 唐Q,李青.一种快速的模板匹配算法.计算机应用,2022 6:15591561,1564. 哈勤和,张畅,王泽兵,等.图象的快速一维投影模板匹配.计算机工程与应用,1998 1:3839,50.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!