清分机软件识别系统的研究

上传人:1777****777 文档编号:36125806 上传时间:2021-10-29 格式:DOC 页数:62 大小:3.63MB
收藏 版权申诉 举报 下载
清分机软件识别系统的研究_第1页
第1页 / 共62页
清分机软件识别系统的研究_第2页
第2页 / 共62页
清分机软件识别系统的研究_第3页
第3页 / 共62页
资源描述:

《清分机软件识别系统的研究》由会员分享,可在线阅读,更多相关《清分机软件识别系统的研究(62页珍藏版)》请在装配图网上搜索。

1、I目录 摘摘 要要.IABSTRACT .II一一 绪绪 论论.11 引言.12 课题的提出及研究意义.1(1) 适应市场的迫切需要,弥补金融电子化的重要一环.1(2)实现国产化、降低成本的要求.13 纸币清分机简介.2(1) 功能概述.2(2) 发展现状.24 本文研究内容.45 本章小节.4二二 数字图像处理基础数字图像处理基础.51 引言.52 数字图像处理基础.5(1) 基本概念.5(2) 基本的研究方法.63 利用统计法分析纸币图像特征.6(1) 直方图.64 在频域中分析纸币图像特征.7(1) 概述.7(2) 频率分析.75 本章小结.8三三 新旧清分算法的研究新旧清分算法的研究.

2、91 引言.92 直方图清分.92 LVQ(LEARNING VECTOR QUANTIZATION)分类.103 相关性分析新旧.114 灰度加权平均判新旧法.11(1) 灰度加权思想.11(2) 灰度加权算法与仿真.125 本章小结.13四四 纸币清分图像识别算法研究纸币清分图像识别算法研究.141 引言.142 利用神经网络进行模式识别.15(1) 多输出型.15(2) 单输出型.15II(3) 自组织映射.153 特征提取判别.16(1) 边界提取.16(2) 五线法判大小.18(3) 灰度加权判正反.214 晶格比率法判残缺.22(1) 原理介绍.22(2) 具体算法-补偿法.235

3、 本章小结.24五五 总结和展望总结和展望.251 总结.252 有待进一步开展的工作.25致致 谢谢.26参考文献参考文献.27附录一附录一 C+程序程序.28附录二附录二 英文文献英文文献.40附录三附录三 中文文献中文文献.45I摘 要图像识别技术是提高当前纸币清分机清分能力的重要手段,主要实现纸币的面额、面向及新旧残缺清分,要求具有较高的实时性、很好的可靠性。本文针对当前国内图像识别技术在纸币清分机中的应用不成熟而导致对人民币挑残能力弱、在人民币新旧程度和面向分类中的一致性差的情况,提出了一种基于区域灰度特征提取的灰度加权和五线找点的算法图像识别方法。本文的识别系统首先通过专门的 CI

4、S 传感器设备,对高速传动的纸币实时采集其图像。对于采集的图像数据,首先通过五线找点算法对纸币大小进行判定,从而确定纸币的面额。灰度值特征反映了人民币的明暗对比强度,其分布反映了纸币图像的特征走向。由于在特征区域内的灰度值包含了人民币图像的主要分布信息,因此它代表纸币图像的主体信息。因此根据灰度值提取纸币图像的特征区域。为了提高清分机对纸币的挑残能力,采用网格划分的方法,对各网格点进行采样,统计背景点与纸币图像点的数量关系,确定纸币的残缺率。最后根据灰度加权判定纸币的新旧。无论是区域特征提取还是残缺率的判别,都需要建立能与之进行对比的纸币标准样本库,这些样本库包括:特征区域位置、纸币长宽、纸币

5、区域灰度均值、纸币图像与背景图像比例等标准样本库。针对以上研究,开发、实现了图像识别系统原型,采用 MATLAB 仿真实现算法功能。试验表明,以上提出的方法在保证识别率和稳定性的情况下,能够满足实时性要求,具有良好的工程应用价值。 关键字关键字: 清分机 模式识别 灰度 图像处理 纸币 IIAbstractImage Identification Technology, which characters the real-time identification and steady reliability, is essential to enhance the identification

6、ability of Paper Currency Identification System . It can identify the denomination of the paper currency and seek out deformity . Concerning shortages of the previous designs of Paper Currency Identification Instrument, such as poor at deformity seeking-out and classifying the rank and directions of

7、 new and used bills , a new identifying method presented in this thesis is iteration based on regional gray scale and Five-line Seeking-points Method.The Identification System in this thesis collects the paper currency images by specific CIS Sensor while paper currencies circumgyrating with high spe

8、ed. The collected database of images will be located instantly by Five -line Seeking-points Method to analysis the size and determine the denomination . Then the characters of gray scale of images will be taken and analyzed. It illustrates light and shades of the paper currency. Consequently, it can

9、 represent the essence of identifying paper currency. Moreover, the gridding method is taken to improve seeking out deformity. Each gridding is going to be sampled and statistic in order to measure the relation between points on background and images so that deformity seeking is achieved.At last ,we

10、 can determine the taint degree. The paper currency sample database is required to be established for estimation both of regional characters and deformity. The sample database includes characterized region location, paper currency length, gray scale average and ratio between paper currency image and

11、 scanned background image. The Identification System is achieved by MATLAB simulation. The simulated test shows that the Identification Instrument has high value on project application with stability and real-time demands.Keywords: Bill Sorting Machine Mode Identifying Gray Scale Image Processing Pa

12、per Currency1一 绪 论1 引言引言商品的流动及因此产生的货币流动,是人类社会生活中两个基本的相互诱导的共生流。货币流动是商品流动的映像,若货币运行不畅,商品流动也不能畅通,商品生产也要受阻。第二次世界大战以来,商品生产的规模和交换方式都发生了很大的变化。科学技术的发展促进了劳动生产率的迅速提高,此外,全国性和国际性贸易也有了急速发展,无论是从规模还是从速度上,这都导致了商品流动和货币流动的急速加大。除了与商品流动有关的货币流动外,在现代银行业务中,还有大量与实物商品流通没有直接联系的货币流动。例如储蓄和信贷,仅此一项就可使货币流动的强度增大 10 倍。如此急剧增长的货币流通强度使

13、银行界陷入困境,整个银行界日益为堆积如山的金融纸票(现金、支票和各种凭证)所困扰。正当银行界为对付货币流通激增的局面寻找出路时电子计算机应运而生。计算机与通信技术(C&C)的引进,使银行界发生了革命性的变革,不仅使传统的银行业务迅速实现电子化,使银行界从困境中获得新生,还开辟了一些新的自助银行项目。总的来说,现在金融电子化主要包括:ATM(自动柜员机) ,POS(销售点)服务 HB(家庭银行)服务;柜员联机系统;为客户提供各种金融信息服务;公用信息发布、银行业务介绍存款利率发布、贷款利率发布等公共信息服务,等等。作为其中的一员,纸币清分机系统就是在这种背景下应运而生的。2 课题的提出及研究意义

14、课题的提出及研究意义(1) 适应市场的迫切需要,弥补金融电子化的重要一环在众多的金融业务电子化后,整个行业的运行效率迅速提高。然而,在银行内部,对破旧的钞票进行回收处理,要求上缴的钞票新、旧分类存放,这些日常事务仍然是依靠人工处理。而这种人工选钞是一项单调、繁重、重复性较高的体力劳动,不但占用较多的人员,而且速度、分选质量都存在很大问题。在以前,这种矛盾并不明显。然而,随着我国经济不断迅猛发展,市场的日趋成熟,纸币的发行量和流通量每年也都在飞速递增。而且,自从我国加入 WTO 以来,越来越多的外商来华投资设厂,近几年我国已经成为全球吸引投资最多的国家,进出口贸易飞速发展,因而,国外货币也越来越

15、融入我国的经济发展中来。在这种背景下,选钞工作越来越成为金融系统的负担,国内对自动化选钞的需求极为迫切。(2)实现国产化、降低成本的要求目前,世界上只有英国得利来、劳雷尔、日本的东芝、光荣等几家公司生产自动化选钞机,现在国内许多银行采用的也大都是进口产品。但是进口产品价格昂贵,每台估计在 30-45 万元之间,而且它们是专门针对国外货币进行设计的,对于人民币处理效果并不是很好。面对我国数量庞大的金融系统,实在是杯水车薪。如果研制国产的适合于人民币的自动化选钞系统,不但解决了金融系统的需求,而且会创造大量的社会财富。23 纸币清分机简介纸币清分机简介(1) 功能概述综上所述,纸币清分机必须代替人

16、工完成以下任务:纸币点算,伪钞鉴别,根据面额分类,根据纸币版本分类,把破损的纸币清分出来,使纸币按照一个方位排放整齐,按照新旧等级分类输出。因而,最终输出应当是按照要求排放整齐、类型一致的纸币,而且,为了提高效率必须达到一定速度。综合以上要求,根据国外同类产品的情况,清分机的基本功能和指标规定如下:、 点算功能:能够进行纸币张数统计,速度必须达到 1000 张/分钟以上;、 伪钞鉴别:能够识别当前流通纸币的各种防伪标记,可以准确的鉴别出伪钞,速度必须保证点算的正常运行;、 面额清分:能够识别出规定类型的纸币面额,把不同面额的纸币分类输出,速度必须达到 600 张/分钟以上。、 版本清分:能够把

17、不同版本的纸币分类输出,速度达到 600 张/分钟以上;、 残缺检验:能够检出残缺度(缺角、裂缝、破洞、卷角等)超过规定的纸币,速度达到 600 张/分钟以上;、 方位识别:能够正确识别纸币方位,可以把四种方位(正上、正下、反上、反下)的纸币分类输出,速度达到 600 张/分钟以上;、 新旧清分:能够正确识别纸币新旧,分辨率达到 10 个等级以上,速度达到 600 张/分钟以上; (2) 发展现状 把计算机技术应用到纸币清分上,很早以前就引起了国外研究者的广泛兴趣,目前国外在纸币识别领域技术已经较为成熟。对于面额、面向的识别率已经接近 100%,而对于新旧清分,国外也陆续采用过一些方法,如声音

18、识别、图像识别等。同时,作为这些技术的应用,一些产品也己经在市场上产生,如英国劳雷尔的 TDU-50C,日本光荣的GRU-200、东芝 FS-800 等。他们由于研发时间早,技术积累丰富,因而产品在市场上也占有较大份额。相比而言,国内在这方面明显落后。以前一直是采用人工完成纸币清分工作,采用国外进口产品的银行也是寥寥无几,对清分机的需求也不是很迫切。然而,近几年由于经济的迅猛发展,整个市场忽然有了“忽如一夜春风至”的感觉,对清分机的需求猛然间变得极为迫切。同时,从事清分机研究、开发的机构也如雨后春笋般纷纷亮相。最早的有哈工大的 CF2000,清华同方与东芝合作的 S-1 OOCN,鞍山聚龙公司

19、的 JL501 A 等产品也已经或即将上市。为了更好的了解清分机的发展形势,下面对目前市场上的全要产品进行比较。见表 1.13生产厂家型号功能速度适用范围英国劳雷尔TDU-50C纸币点数、金额计算、批量点数、面额清分、表里清分、正损清分、纸币厚度检测(防止两张同时通过)MG 磁墨检伪、UV 紫外线检伪(10个强/弱等级自由设定) 、纸币印刷错位检测。每秒 8 张,每小时约 2 万张第四套、第五套的 10元、20 元、50 元、100 元得利来小型现金清分机DLR3700E人民币( 10 元券以上主币)自动清分处理、鉴伪、残币识别、可视化操作界面、完备的操作记录功能、容易实现二次开发20,000

20、 张 / 每小时人民币德国BPS100清分点算人民币,欧元,美元,港币等多种纸币,并具有强大的防伪功能600 张/分钟人民币、欧元、美元、港币日本光荣UW 120一次就能清分出三类不同要求的纸币(如选出 ATM 适用钞、流通钞、待销毁钞(旧钞、残钞)并剔除伪钞、纸币面向排列功能500 张/分钟银行金库、各级分行、支行、出纳窗口,ATMCD 补增钞票,中央押运哈工大CF20001.自由点算、批量点算;2.面额清分;3.成色清分(10 个清分等级) ;4.正反清分、方位清分;5.伪钞鉴别640 张/分钟第四套、第五套的 10元、20 元、50 元、100 元清华同方CS-100CN强大的 CCD

21、图像检测功能可实现对票面污渍、折角、破洞、撕裂、涂写痕迹的检测和清分500 张/分钟第四套、第五套的 10元、20 元、50 元、100 元表 1.1 各清分机性能比较44 本文研究内容本文研究内容纸币清分在金融行业中是一个非常重要的工作,为完成这一工作而开发的纸币清分机是完成纸币的挑残、清分、点算等工作的专用设备。在详细研究国内外清分机生产厂家设计思想的基础上,结合研发纸币清分机项目的具体实践,本文对清分机中的算法进行研究,提出了基于灰度加权平均和特征区域提取相结合的人民币新旧版面识别算法。总的说来,本文共分为四部分:第一部分绪论。提出本文的研究课题和研究意义,参看别人的研究结果,在此基础上

22、提出本文的研究任务;第二部分理论基础,包括第二,三,四章。首先概述图像处理领域的主要研究方法,同时分析了纸币图像的特征。接着,重点讲述了作者提出的基于灰度加权和特征块提取的算法。最后,又详细论述了 清分机其它功能的图像处理算法。第三部分总结与展望。5 本章小节本章小节阐述了纸币清分机的研究意义和当前的发展现状,对前人的研究结果进行了系统的分析,并在此基拙上提出了本课题的研究内容,最后给出了全文的结构框架。5二 数字图像处理基础1 引言引言 从前一章中可以看到,纸币清分机中许多功能的实现最终都要依靠图像处理的方法来完成。而图像处理一方面具有较好的处理效果,另一方面图像采集不与纸币接触,速度快,灵

23、活性也比较大,因而在具体操作上也更加具有优势。而数字图像处理本身就己经成为工程学、计算机科学、信息科学、统计学、物理、化学、生物学等领域中各学科学习和研究的对象。为了更好的探讨后面的算法,下而首先简要介绍该领域中地基本概念和主要研究方法2 数字图像处理基础数字图像处理基础人类对于数字图像处理的研究源于两个主要应用领域:其一是为了便于人们分析而对图像信恩进行改进;其二是为使机器自动理解而对图像数据迸行存储、传输及显示。下面首先介绍一下一些基木概念.(1) 基本概念1) .灰度一幅图像可定义为一个二维函数 R(x. y). x, y 是空间坐标,而在任何一对空间坐标(x.,y)上的幅值 f 成为该

24、点图形的强度或灰度。2). 数字图像表示数字图像是把需要处理的模拟图像数字化。简单的就是用一个网格把待处理的图像覆盖,然后把每个方格中的模拟图像的各个亮度取平均值,作为该小方格中点的值。空间分辨率是指网格在水平方向和龚直方向上分为多少格,计为 MxN.因此一副 MxN 数字图像可表示为矩阵中的每个元素称为图像单元、图像元素或像素。密度分辨率在数字化过程中,对于 M 和 N 的值和每个像素允许的离散灰度级数 L 需要一个规定。对 M 和 N 除了必须取正整数外没有其他要求。然而出于处理、存储和取样硬件的考虑,灰度级典型的取值是 2 的整数次幕: L=2k这里,假设离散灰度级是等间距的而且是区间0

25、, L-1内的整数(一般取 k=8)。数字 b6存储数字图像需要的比特数,有 b=MNk 一副图像亮度层次变化多,则看起来越柔和越逼真,这个亮度层次的多少称为密度分辨率。 空间频串随时间周期变化的信号可用频率度量,如果把时间变量改为空间变量,即成为表示在空间距离上有周期性变化的信号,因此,当周期固定时,其周期的倒数就表示为空间频率。在图像中.这个周期性变量表示图像明暗变化的快慢。因而空间频率高的图像主要表征图像的细微变化或细节内容;空间频率低的图像则表征图像中的物体轮廓或变化趋势。这个概念是图像处理技术中频域处理的基础。(2) 基本的研究方法将数学形态学作为工具,从图像中提取对于表达和描绘区域

26、形状有用处的图像分量,比如边界、骨架、以及凸壳。另外,如果把一幅图像看作一个三维坐标的 x.y 平面,把灰度值看作 z 坐标,那么整副图像就成为一个立体图形,完全可以应用三元函数中的分析数字图像处理是一门计算机科学与数学以及其他学科的交又科学,因而主要有以下几种研究方法:、矩阵运算及数理统计在数字图像处理的应用因为,图像的数字表示是以矩阵的形式出现的,对它的基本运算也是建立在矩阵运算的基础上。简单的有加减法处理、对数变换、幂次变换、分段线性变换等,它们都是数字图像处理的基础。数理统计方法在图像处理中也有应用,最典型的是直方图,还有利用相关性进行图像匹配等。、信号处理在数字图像处理中的应用通过引

27、入空间频率的概念,数字处理中的许多问题就可以用信号处理中的方法来解决。例如各种噪声滤波算法、图像锐化、图像平滑、图像压缩、图像分割、图像提取等。、数学形态学在数字图像处理中的应用工具进行处理。3 利用统计法分析纸币图像特征利用统计法分析纸币图像特征(1) 直方图直方图1) 基本概念灰度直方图是灰度级的函数,描述的是图像中具有该灰度级的像素的个数:横坐标是灰度级,纵坐标是该灰度出现的频率(像素的个数)。经常用图像中像素总数来除它的每一个值得到归一化的直方图。直方图是多种空间域处理技术的基础,它能有效的用于图像增强,在图像压缩和分割中也是非常有用的。利用直方图还可以进行图像分析,察看它图像灰度的分

28、布情况。下面首先采用这种工具对纸币进行图像分析。2) 直方图像分析7 图 2.1 灰度直方图分析4 在频域中分析纸币图像特征在频域中分析纸币图像特征(1) 概述引入空间频率的概念后,图像中周期性变量就表示为图像明暗变化的快慢。因而,图像中明暗变化快的地方就是高频部分,变化慢的地方就是低频部分。如果要对图像根据明暗变化的不同进行处理,就需要用到信号处理的方法。其中滤波是信号处理在图像处理中用得最多的地方。主要的滤波器有:巴特沃斯低通滤波器、高斯低通滤波器、巴特沃斯高通滤波器、高斯高通滤波器、同态滤波器等。下面利用频域的工具对纸币进行分析。(2) 频率分析如下就是两副图像的二维傅利叶变换。 图 2

29、.2 纸币图像频域分析上图中第一副图像是标准的纸币图像,可见高频成分相对而言比较少:第二副图像是在经过空间对准后,一副脏币减去新币后的差分图像,其中除了残留的标准图案外.更多8的是剩余的污渍信息,从它右图中看到,高频成分减少了。可见,纸币标准图像的频域分布与污渍图像的频域分布基本一样,它们交织混杂在一起,利用一般的方法很难进行有效的分割。5 本章小结本章小结本章介绍了图像处理方面的主要概念和研究方法,并且利用图像处理的工具分析了纸币图像的特征:灰度分布比较均匀,许多图形都是由渐变的灰度值组成,不利于灰度特征提取;纸币图案复杂。首先是细小、分布面广并且互相连接的底纹。其次,大的图形中嵌套许多小图

30、形。而且,即使图案简单的图形也是由许多色点组成的,不具有均一性。增大了进行图形识别和分析的难度:污渍与纸币图像频域混杂,无法区分。以上这些工作.为我们下面的算法设计奠定了基础。9三 新旧清分算法的研究1 引言引言 一些特定的场合,如 ATM 机所使用的现金就要求票面比较新,这样才能保证操作的准确性。因此,有必要开发清分新旧现金的技术。要区分出新旧程度不同的现金,就必须找出它们之间的不同点。首先,新旧现金的纸质是不同的,新的纸币,之战弹性和韧性比较好,而旧的纸币弹性和韧性都较差。用手捏住纸币中间就能看到新币较硬一些,不容易弯折,而旧币在自身重力的作用下两端就会下垂。其次,新旧纸币对光的反射和透射

31、特性也是有区别的。新币表面比较干净,对光的反射,透射律都比较高。而旧币由于上面沾油许多污渍,表面比较黯淡,没有新币的光泽,而且透光率较新币低。另外,由于使用时间长,经手次数多,旧币一般磨损较为严重。在印刷纸币时压印留下的沟槽,新币用手摸能明显的感觉出来,而旧币没有明显的感觉。纸币的新旧识别,本质上就是找出任一纸币与标准新币的图像差异.而这个差异我们可以从三个方面去寻找:一是纸币图像与污渍图像的差异,无疑我们可以模仿人类的识别方式,采用模式识别的方法,但是由于纸币图案非常复杂,用现有的模式识别是很难凑效的,并且时间上也不允许,可见从空间上是没法区分的。那么在频域范围呢?从上一章中也可看出,污渍与

32、图像的频域是混杂在一起的,这条路行不通。二是直接把脏币与新币进行对比,直接求差分那是最简单的了,但是有两个困难空间精确对准和图案完全一致,首先我们不可能达到空间的精确对准,其次,由于制造和扫描的误差,即使两张全新的纸币或一张新币的两副图像也不可能没有误差。那么转而求其次,在误差存在的基础上,采用两种方法,一种是先求差分,再根据残留图像基本上属于高频区域而污渍图像基本上属于低频区域的特点.进行滤波,然而,由于纸币图像太复杂,很难滤掉所有误差图像,而且还损失了许多污渍信息。另一种是事先利用统计的方法做一张样本纸币每一个像素都包含了各种新币在空间尽力对准的情况下的灰度值,因而,在作差分时,样本纸币就

33、包含了上述两种误差,只要脏币对应像素点的灰度值落在样本纸币的统计范围之内就认为不是污渍,可以去掉,这种方法由于工作量大,并且位置误差不像想象的那样简单,也被抛弃。因此这条路也证明行不通。我们就几种新旧分类方法做了分析和比较,包括直方图清分,相关性分析,LVQ 分类等,并在此基础上提出了自己的一种算法灰度加权平均。2 直方图清分直方图清分直方图是刻画图像中灰度分布的一种工具,一般来说不同的图像具有不同的灰度分布。对于同一版本、相同面额的新钞来说,图像是相同的,因而其灰度直方图应当一致;如果是带有污渍的脏币,反映在图像上是不同的,那么它的灰度直方图也会有一定的差异。所以,如果把纸币的灰度直方图作为

34、携带纸币新旧信息的工具,那么衡量新旧等级的标准就变成衡量脏币直方图与标准纸币直方图的差异性大小的问题了。通过实例,可以总结规律如下:、 灰度直方图曲线与坐标轴所包围的面积是一定的,新旧币的差异表现在像素点数在不同灰度级的分布上。、 如果旧币灰度高的地方曲线所围面积比新币少,表明白色区域有污渍;如果灰度10低的地方面积减少,表明纸币褪色。在这两种情况下,所减少的面积有向中间移动的趋势。、 如果灰度低的地方面积增加,表明有颜色较深的污渍;如果灰度高的地方面积增加,表明有亮色(如黄色、绿色)污渍。、 污染程度不同的纸币表现在高灰度区域面积向中间集中的程度,越向灰度低的区域集中纸币越脏,而低灰度面积越

35、大脏点(线)越多。但存在很大的缺点: 、 由于与位置无关,无法排除灰度总量不变,但由于空间位置不同造成的差异即如果在一处灰度减少x,在另一个地方增加 4x 的情况(虽然这属于小概率事件)。、精度比较低,对于少量的脏点或线由于所占像素数比较少,在直方图上的差异变得极小,因而无法区分。2 LVQ(learning vector quantization)分类分类神经网络(ANN)是仿生学的产物,它通过网络节点的连接来存储信息,并完成分类。ANN 分类器通过学习,根据训练的特征样本向量集来调整连接的权值,构造出相应的分类曲面。ANN 的学习能力使其能够在复杂的分布中提取出人直观还不能理解的规律。在实

36、际系统中,需要面临纸币币种的扩充等问题,而 ANN 由于其固有的自组织、自适应和容错性,只须重新训练就可以完成对新旧的正确识别。目前广泛使用的 ANN 有:多层感知(MLP,BP 网)Kohonen 网络、PNN 自组织神经元树等。通过对多种神经网络的比较,我们发现 LVQ(学习矢量量化算法分类器) ,由于具有在输入节点的条件下,可以达到精确分类的目的,所以,在这里选择它作为分类器。LVQ 是一种 Kohonen 网络方法的扩展形式。LVQ 网络由两层组成,第一层为竞争网络,第二层为线性层。竞争层能够学习对输入向量的分类,这与自组织竞争网络非常相似。线性层将竞争层传来的分类信息转变成使用者所定

37、义的类别,将经竞争层学习到的类称为子类,将现行层学习得到的类称为目标类。其具体方法如下:计算图像数据(连同背景)的灰度直方图曲线,并取其中的灰度范围值 1-255 的作为特征一维数组 X=x1,x2,x255,其中 xi 是图像中灰度值为 i 的像素的个数。根据实验分析,由于图像扫描而导致的灰度值偏差一般小于 10,因此将特征一维数组 X 转换为Y=y1,y2,y50,采用 Y 作为特征数组,以减少由于图像扫描而带来的误差。y = i=1,2,50i5*54*5iiix在实际扫描系统中扫描的纸币图像大小约为 200*30,像素灰度范围值为 1-255,我们以纸币中心为起点,分别向左右两边按 1

38、7 个像素间隔取点,包括中心共取 10 个点。按垂直方向上下间隔 5 个像素各取一个点,包括中心点工 3 个点。这样,我们在整个纸币图像上共取了 30 个点。以这 30 个点为中心,分别取横向 17 个像素,纵向为 10 个像素的子区。取每一个子区的像素和作为分量,形成一个 30 维的特征向量 Z=z1,z2,.z30.该特征向量包含了图像的位置信息,反映了纸币图像的特征位置走向,在垂直方向相邻的方向快存在重叠,减少了垂直位移的偏差。最后,将特征向量 Y 和特征向量 Z 合并组成一个即包含位置信息,又包含了灰度分布的新的特征向量 P=y1,y2,y50 z1,z2,.z30。对样本纸币按上述方

39、法提取特征向量P(包含 80 个元素的特征向量) ,采用 LVQ 神经网络进行监督分类训练,采用的 LVQ 神11经网络有 80 个输入节点,4 个隐层节点,2 个输出节点。训练学习速率为 0。1 在实际系统中,将训练好的 LVQ 神经网络作为分类器,对待测试纸币提取特征向量 P,并输入到神经网络,得到最终分类结果。但 LVQ 分类的训练过程很久,而且输入节点的选取,学习速率的选取很难定,无法达到很好的效果。3 相关性分析新旧相关性分析新旧相关函数描述了两个信号之间的关系或其相似程度,也可以描述同一信号的现在值与过去值的关系,或者根据过去值、现在值来估计未来值。因而,这里如果要衡量两个直方图之

40、间的差异比较好的方法就是求它们的相关系数。利用公式:= NiNiNiiYiXiYiX12121)()()()(MATLAB 仿真程序如下:x,map=imread(10ub.tif); 读取图像数据;y=imresize(x,150 200); 改变图像大小;k,map=imread(100.tif);j=imresize(k,150 200);imshow(y,map); 显示图像;figure,imshow(j,map);R=corrcoef(j,y); 求两副图的相关性;但是仿真结果不太令人满意,误判较高,而且运算量较大,在 DSP 编程中数据处理太慢。因此,我不采用此方法。4 灰度加权

41、平均判新旧法灰度加权平均判新旧法(1) 灰度加权思想纸币的灰度值特征反映了其明暗程度,其分布反映了纸币图像的特征走向。由于灰度值包含了纸币图像的主要分布信息,因此它代表纸币图像的主体信息。经分析发现,纸币存在着一些特殊的区域两对称区域有着相当大的灰度均值差异,我们称之为强对比区域,在上章利用这些强对比区域灰度特征,确定了纸币的面向和方位。现在利用这些强对比区域灰度特征,纸币的新旧程度也可以由此确定。通过对多个有不同污染度的多个 100 圆、50 圆、20 圆、10 圆样品进行试验,发现正反两面灰度平均值差大于 5,而正反两面的两边强对比区域灰度差值均大12于 10,可以确定纸币的面向及方位,因

42、而提取区域灰度特征进行识别是可行的。(2) 灰度加权算法与仿真对于新旧程度,可以采用纸币灰度均值的大小进行确定。在 matlab 上对多张 100 圆、50 圆、20 圆、10 圆样本进行灰度提取并进行平均,得到两个等级:七成新及以上、七成新以下。其中七成新以下的纸币按照中国人民银行颁布的不宜流通人民币挑剔标准将作销毁处理。而通过试验,此两个新旧等级之间的灰度均值差值较大,容易分辨。新旧程度 matlab 仿真程序:X,map=imread(d.tif);j=imresize(X,150 400);RGB=ind2rgb(j,map);r=RGB(:,:,1);g=RGB(:,:,2);b=R

43、GB(:,:,3);r_aver1=mean(r);r_aver=mean(r_aver1);g_aver1=mean(g);g_aver=mean(g_aver1);b_aver1=mean(b);b_aver=mean(b_aver1);gray_aver4=r_aver*0.3+g_aver*0.59+b_aver*0.11; 其中变量 为对第 i 张 RGB 纸币图像取灰度均值所得结果,grey_aver i (i=1,2,n) RGB 对应的灰度值公式为: 。grey scale = r 0.3+g 0.59+b 0.11在工程上,RGB 对应的灰度值公式为: 。适应于黑grey s

44、cale = r 0.3+g 0.59+b 0.11白两色光照射,在彩色光照射下效果可能要差一些,但经过试验调整某些参数,还是能反映新旧状况的。纸币一13 纸币二纸币三 对于纸币一,gray_aver4 为 0.9985 是张全新的;对于纸币二 gray_aver4 为 0.8914;对于纸币三,gray_aver4 为 0.7211。使用 100 张纸币进行多次验证,误差较小,可靠性可以达到 95%以上。 5 本章小结本章小结本章中,综合比较了几种新旧识别的算法,包括直方图清分,LVQ 分类,相关性分析,灰度加权平均,最后选择了灰度加权。此算法弥补了国内已有算法新旧信息包含少,分辨率不高,运

45、算繁杂的缺点,为清分机的实现做出了最核心的工作.14四 纸币清分图像识别算法研究1 引言引言纸币的识别首先需要确定纸币图像在背景中的位置,根据纸币的位置确定特征区域位置,进行特征提取来对纸币图像进行识别。边缘检测算法常常用来对图像边缘进行识别,达到图像定位的目的。图像的边缘检测算法有很多,较低级的有如:拉普拉兹算法、索贝尔算法,罗伯特算法等,高级的有如:Houge Transform(霍夫变换)、Marr(马尔)、Canny(坎尼)、Shen-Castan(沈峻)(该算法准确可靠,识别能力上与 Canny 算法接近)、Sobel(索贝尔),他们共同的原理是:边缘提取即要保留图像的灰度变化剧烈的

46、区域,从数学上,最直观的方法就是微分(对于数字图像来说就是差分),在信号处理的角度来看,也可以说是用高通滤波器(前面的图像预处理即是低通滤波),即保留高频信号。这些算法的实现大部分可采用模板运算。运算时,把模板中心对应到图像的每一个像素位置,然后按照模板对应的公式对中心像素和它周围的像素进行数学运算,算出的结果作为输出图像对应像素点的值。对于低级算法,常见的模板大小为 33,也有 22、55 或更大尺寸的。其中,拉普拉兹算子是 2 阶微分算子,也就是说,相当于求取 2 次微分,它的精度还算比较高,但对噪声过于敏感(有噪声的情况下效果很差)是它的重大缺点,所以这种算子并不是特别常用。Sobel(

47、索贝尔)算子是最常用的算子之一(它是一种一阶算子),方法简单效果也不错,但提取出的边缘比较粗,要进行细化处理。另外,索贝尔算子也可提取出图像边缘的方向信息来,有文章论证过,在不考虑噪声的情况下,它取得的边缘信息误差不超过 7 度。对于高级算法,模板比低级算法大得多。其中,Marr(马尔)提出的边缘提取算法可以看成两个步骤,一个是平滑作用来消除噪声,另一个是微分提取边缘,也可以说是由两个滤波器组成,低通滤波去除噪声,高通滤波提取边缘。人们也称这种方法为 LOG滤波器,这也是根据它数学表达式和滤波器形状起的名字。当采用模板运算来实现这种算法时,但模板的大小一般要在 77 以上,所以运算复杂程度比索

48、贝尔算子等要大不少,运算时间当然也长许多。Canny(坎尼)算子在使用时要提供给一些参数,用于控制算法的性能,实际上,对于不同的图像或不同的边缘提取目的,需要提供不同的参数,以达到最佳效果,当采用模板运算时,模板的大小也比较大,和提供的参数有关,标准的大小差不多是 1717,可以根据算子的可分离性用快速算法使得速度得以提高,否则相当耗时。Shen-Castan 算法,一般被称为沈峻算法,是中国人的成果,效果和坎尼算子不相上下,这种算法在对边缘提取好坏的判别标准上有些不同,模板大小也不尽相同,但明显大于上述低级算法。Houge Transform(霍夫变换)基本步骤为:首先,初始化一块缓冲区,对

49、应于参数平面,将其所有数据置为 0;对于图像上每一前景点,求出参数平面对应的直线,把这直线上的所有点的值都加;最后,找到参数平面上最大点的位置,这个位置就是原图像上直线的参数。这就是霍夫变换的基本思想。就是把图像平面上的点对应到参数平面上的线,最后通过统计特性来解决问题。假如图像平面上有两条直线,那么最终在参数平面上就会看到两个峰值点,依此类推。实现霍夫变换不仅需要遍历整个源图像,而且还15要遍历参数平面进行分析,所耗运行时间较长。由上可见,低级算法中,拉普拉兹对噪声过于敏感且相当于 2 次微分,运行时间长且抗干扰能力差,无法满足本课题的要求。索贝尔算法相当于一阶微分,运行时间较少,但提取出的

50、边缘比较粗,要进行细化处理,消耗了时间,而且“边缘信息误差不超过 7度”这样的精度无法满足本课题要求。而高级算法虽然比较精确,但其算子小则 77,大则超过 1717,显然无法满足本课题的速度要求。因此,要想达到本课题实时、高速、精确的要求,必须采用特定的算法。通过以上各种算法的分析比较,可以看出,低级算法速度较快、耗时较少,但精度低,不能满足精度要求;高级算法精度高,但耗时太多、速度太慢,无法满足实时的要求。因此,针对清分机的实时性要求,无法选取以上任何一种确定的算法,必须要采用特定的算法。下面一步步分析如何确定特定算法,实现本课题实时高速、高精确度的要求。2 利用神经网络进行模式识别利用神经

51、网络进行模式识别在各种人工神经网络模型中,在模式识别中应用最多的也是最成功的当数多层前馈网络,其中又以采用 BP 学习算法的多层感知器(习惯上也简称为即网络 BP)为代表。由于网络采用的是监督学习方式进行训练.因此只能用于监督模式识别同题。一般有以下两种应用方式:(1) 多输出型网络的每一个输入节点对应样本一个特征,而输出层节点数等于类别数,一个输入节点对应一个。在训练阶段,如果输入训练样本的类别标号是 i,则训练时的期望输入设为第 i 个节点为 1,而其余输出节点均为 0。在识别阶段,当一个未知离别的样本作用到输入端时,在某些情况下,如果输出最大的节点与其它节点输出的差距较小(小于某个域值)

52、,则可以作出拒绝决策。这是用多层感知器进行模式识别的最基本方式。实际上,多输出型神经网络还可以有很多其它的形式。更一般地,网络可以有 m 个输出节点,用他们的某种编码来代表 c 个类别。上面这种方式只是其中地一个特例,有人把它称为“10”编码模式或者“c 取 1”模式。(2) 单输出型很多试验表明,在多输出方式中,由于网络要同时适应所有类别,势必需要更多的隐层节点;而且学习过程往往收敛较慢,此时可以采用多个多输入单输出形式地网络,让每个网络只完成识别两类分类,即判断样本是否属于某个类别。这样可以克服类别之间地耦合,经常可以得到更好地结果。具体作法是,网络的每一个输入节点对应样本一个特征,而输出

53、层节点只有一个。为每个类建立一个这样的网络(网络的隐层节点数可以不同) 。对每一类进行分别训练,将属于这一类的阿样本的期望输出设为 1,而把属于其它类的样本的期望值输入设为 0。在识别阶段,将为止类别的阿样本输入到每一个网络,如果某个网络的输出接近 1(或者大于某个域值),则判断该样本属于这一类,而如果有多个网络的输出均大于域值,则如果有多个网络输出大于域值,则或者将类别判断为具有最大输出的那以来,或者作出拒绝;当所有网络的输出均小于域值时也可以采取类似的决策方法。16(3) 自组织映射它最早由 Kohonen 提出的,是一个两层网络,每一个输入节点都通过一个具有可变权值的连接与每一个输出节点

54、相连。随着输入矢量依次输入网络,节点之间的连接权不断地被修正,当网络接受到足够的输入矢量后,各连接权就自动的形成各个相应的矢量中心。它可使得在进行特征提取前将输入信号映射到低维空间,并保持相同特征的输入信号在映射后的空间中对应临近区域。自组织神经网络可以较好地完成聚类的任务,其中每一个神经元节点对应一个聚类中心,与普通聚类算法不同的是.所得的聚类之间仍保持一定的关系就是在自组织网络节点平面上相邻或相隔较近的节点对应的类别.它们之间的相似性耍比相隔较远的类别之间大,因此可以根据各个类别在节点平面上的相对位置进行类别的合并和类别之间关系的分析。自组织特征映射最早的提出者 Kohonen 的科研组就

55、成功地利用这一原理讲行了芬兰语语音识别。他们的做法是,将取自芬兰语各种基本语音的各个样本按一定顺序轮流输入到一个自组织网络中进行学习,经过足够次数的学习后这些样本逐渐在网络节点中形成确定的映射关系,即每个样本都映射到各自固定的一个节点(在这个样本作输入时,该节点为最佳匹配节点或具有最大输出) ,而映射到同一节点的样本就可以看作是一个聚类。学习完成后,发现不但同一聚类中的样本来自同一音素,而且邻近节点对应的聚类中样本往往来自相同或相近发音的音素。这样,把各个聚类对应的发音标到相应的节点上,就得到了较好的结果。在识别时,对于新的输入样本,将其识别为它映射到的节点所标的发音即可。这种作法实际上是在非

56、监督学习的基础上进行监督模式识别。其最大的优点就是,最终的各个相邻聚类之间是有相似关系的 ,即使识别是把样本映射到了一个错误的节点,它也倾向于被识别成同一音素或者一个发音相近的音素,这就十分接近人的识别特性。可以发现,如果聚类分析的目的只是将样本集中分为较少的几个类。这种用自组织映射网络的作法没有明显的优势。为此,研究了一种改进的方法,称作自组织映射分析SOFM).其基本原理是,通过自组织学习过程将样本集映射到神经元平面上,将学习后一个样本映射到的节点趁早这个样本的像,而样本被称作这个节点的原像。在节点平面上统计各个节点的原像数目,得到像密度图。根据自组织神经网络的性质和上面提到的节点间对应大

57、的样本之间的关系,则可以按照密度图像把样本集分类,将像密度较高且较集中的节点对应的样本识别为一类。研究表明,这种方法不但无需事先确定聚类数目,而且比之前的聚类方法能够更好的适应不同的分布情况,事一种较有效的方法。当数据分布不呈现明显的单峰形式时,传统方法通常仍继续完成分类,单这种分类已经不能反映样本集中实际的分布和相似性关系,而这种情况下用自组织分析方法则可以从密度图反映出样本集中无明显据来的分布特性。因此,我们在 Cbuilder 下编程实现该算法。见附录 1但是经我们对多张纸币进行训练后,发现速度比较慢,因此不采用此方法。3 特征提取判别特征提取判别(1) 边界提取1) 三色分离RGB 图

58、像,也称为真彩图像,其每一个像素由三个数值来指定红、绿、蓝颜色分量。17在 MATLAB 中,一幅 RGB 图像由一个 unit8,unit16 或双精度类型的 mn3 数组来描述,其中,m 和 n 分别表示图像的宽度和高度。RGB 图像不使用调色板。每个像素的颜色由储存在相应的位置的红、绿、蓝颜色分量共同决定。RGB 图像是 24 位图像,红、绿、蓝个占用 8 位,因而图像理论上可以包含 2种不同的颜色。24在一个双精度类型的 RGB 数组中,每一个分量都是一个(0,1)范围内的 数值,颜色分量为(0,0,0)的 像素将显示为黑色,颜色分量为(1,1,1)的像素将显示为白色。每一个像素的 三

59、个颜色分量都储存在数据数组的 第三维中。为了分析红色纸币中红,绿,蓝三个不同颜色分量的作用效果,需将三种颜色分离出来。分离结果如下: RED GREEN BLUE 2) 图像分割要进行边界提取,首先要对图像分割。从数字图像理论可知,在图像中背景和前景的灰度值有显著的区别时,利用全局域值法来分割前景和背景。在清分机系统中,每张人民币每次扫描的 区域记为 D,其中 M 是扫描的行数,N 是扫描的 列数。在扫描区nm中包含有人民币图像区,这又称为前景区和非人民币图像区,即背景区。经过我们对多18张纸币进行扫描,图像分析后,人民币的 图像区和 背景区的 灰度转换量化值的 范围如下:0背景区灰度值62,

60、62人民币图像区灰度值255我们利用灰度与域值法可以很快将人民币图像区同背景区分割出来。实现如下:如果:像素点灰度值属于62,255则: 该像素点为图像区的点如果:像素点灰度值属于0,62则:该像素点是背景区的点由于清分机系统的 这一特点,是得图像分割设计变 得很容易快速实现,在后面得 图像处理阶段中,也 充分利用 了这一特点,这可以简化算法得 实现,但要注意 得 是,针对不同样机对不同人民币得 调试情况,图像区和 背景区得 灰度得 范围会有所调整。利用 MATLAB 编程仿真: 经过编译运行可以看到结果如下:可见边界很明显,很容易找到图像区。接下来这样我们便可对纸币进一步分析。(2) 五线法

61、判大小1) 边角找点算法原型假定纸币为完整的,无缺边缺角,则所成图像边缘为一矩形,当纸币倾斜时,矩形为倾斜矩形,如图 3.1。要确定纸币在背景中的位置和倾斜角度,求出下角点 A、右角点B 和上角点 C 即可。根据 AB 直线的斜率即可得到纸币图像的旋转角度,由 A、B、C 三点即可推算纸币的第四个角点,纸币的位置也可以由此确定。求点方法:从由下向上、左至右扫描,发现第一个非背景点即确定为下角点 A;同理,从右至左、从下至上扫描,第一个非背景点即为右角点 B;从上至下、从右至左,第一个19非背景点确定为上角点 C。这样,根据求得的三点,经过比较简单的数学运算即可求得纸币图像的位置和倾斜角。 从右

62、至左扫描,得到上角点 C A 从左至右扫描,得到下角点 B 图 4.1 扫描找点显然,这种方法对图像的要求非常高。即使满足不缺角、不缺边这样苛刻的要求,以下的情况也让图像无法识别: 图 4.2 扫描找点无法识别图顶上多出的部分实际上是一个或两个像素放大而已。当纸币边缘受污染或扫描图像时有微小干扰都会出现此问题。这样,按此扫描方法会得到的上角点是完全不正确的,后面的工作就无法进行。2) 改进找点方法实验表明,初步设想中的找点方法简单、速度较快,但对图像要求很高、过于敏感,找点结果不是很理想,必须改进。现依然假定纸币的四角完整,要准确的找到其中三个角点即可定位和求出倾斜角度。要避开上面扫描到中间的

63、点,那么利用角点和背景角点位置关系,通过背景角点找纸币图像角点,如图 4.3,这样就不涉及图像的中间点了。 从右至左扫描找不到上角点20图4.3 切线扫描求点方法:以背景角点为中心,求取离它最近的一个非背景点,作为纸币图像的角点。如以图 3.3 中左下角背景点为中心,向图示方向搜索,找到第一点即确定为纸币左下角点 A;其余 B、C 点同理。实验结果表明:如果纸币角点不破损,即使中间或者边缘有一些残缺,这种方法速度较快、结果比较准确。但是,当纸币角点破损时,如图 3.4,所测得的点 A、B依据破损程度会有不同程度的误差。图 4.4 切线扫描缺角纸币当只有一个角点破损时,可以通过矩形检测来修复测量

64、结果。但是,当破损点超过一个时,测量结果无法修复。经过大量的实验和大量数据的分析,以上两种方式都具有一定的可行性,但是当前比出现角度和边界破损以及在中心截短的情况下,判别面值就会出现很大的问题,所以针对以上问题,加上多次算法提出的甄选,我们选择开发了下面的五线相似三角形甄别面值法。由于在实际中不可避免的会出现钱币的破损和缩水,我们必须综合各种可能出现的ABCABCAB21情况和要解决的问题尽可能的进行算法的选择五线相似三角形甄别面值法是全面考虑了四个角和中部出现大面积残缺的情况下提出来的,示例图如下:(图4.5)具体过程如下: 、从左向右一次扫描,当我们探测到扫描线与钱币的第一个交叉点时,然后

65、,以3cm 的隔离行距从左向右扫描扫出五条线。如图中所示的 AB CD EF GH IJ 线段,在五条线段中,甄选出来两条最长的线段,根据试验多次的取样状况看,最长的两条为未经过破损处的,而未经破损处为小概率事件。、 在图中我们以AB与GH就图纸中阴影部分的两个三角形分析,他们是相似三角形。根据几何学的分析我们很容易得到:BO1/GO2=BH/GH 、求出GO2可以与样本库中20元,50元,100元的宽度比较。本方法经过大量实验仿真,效果良好,判断正确率在百分之九十五左右,是较为可行的方法。(3) 灰度加权判正反在对纸币各区域进行分析我发现 区和区,区和区的灰度存在很大的差别所以我们在算法时就

66、截取此四个区域如下 22A线 B线 (图4.6)如上图所示:、首先划出 A,B 线,各为纸币上方边线端点各向内 2cm 将钱划为图中的,区。、将,区各点灰度加权起来,若区灰度大于区,再比较,区域若区小于区则钱币为正面反置。、将,区各点灰度加权起来,若区灰度小于区,再比较,区域若区大于区则钱币为反面反置。、将,区各点灰度加权起来,若区灰度大于区,再比较,区域若区大于区则钱币为反面正置。、将,区各点灰度加权起来,若区灰度小于区,再比较,区域若区小于区则钱币为正面正置。本方法我们经过大量实验加上教研室李鸿老师指导,贺科学老师的辅助编程,结果很是令人满意,判断率几乎为百分之百。能迅速和有效地判别出纸币的正反倒顺放置。4 晶格比率法判残缺晶格比率法判残缺(1) 原理介绍除了要识别纸币的面向、方位和新旧程度外,清分机还要求对纸币的残缺率进行识别。我们采用网格划分的方法对纸币残缺进行识别。23如图(4.7) ,将纸币图像的横向和纵向按照一定间距划分成网格。对于一定面额的纸币,在纸币完整的情况下,其背景点数量是一定的,按网格点统计各面值背景点数量,使用上述区间估计的方法建立标准样本库。由于所采集的数字

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!