基于matlab多路径识别算法的研究毕业设计说明书

上传人:仙*** 文档编号:29872177 上传时间:2021-10-08 格式:DOC 页数:44 大小:968.02KB
收藏 版权申诉 举报 下载
基于matlab多路径识别算法的研究毕业设计说明书_第1页
第1页 / 共44页
基于matlab多路径识别算法的研究毕业设计说明书_第2页
第2页 / 共44页
基于matlab多路径识别算法的研究毕业设计说明书_第3页
第3页 / 共44页
资源描述:

《基于matlab多路径识别算法的研究毕业设计说明书》由会员分享,可在线阅读,更多相关《基于matlab多路径识别算法的研究毕业设计说明书(44页珍藏版)》请在装配图网上搜索。

1、毕业设计(论文)课题名称多路径识别算法的研究 院别: 电气工程学院 专业: 电子信息工程 摘要随着各省市高速公路的不断建设,基本上建成了大小规模不等的联网收费系统,在联网收费系统建设中,都面临了一个共同的问题车辆行驶路径的识别。路径识别不仅仅涉及对每一通行车辆如何计算通行费,同时还要考虑将收入的通行费拆分给哪个收费单位的问题,通行费的拆分直接关系到各条高速公路的合法利益,是联网收费的关键。所以说解决多路径识别问题在完善高速公路联网收费系统中起着至关重要的作用。本文介绍了多路径识别的多种算法,并着重分析了识别算法中的汽车牌照识别,根据车牌图像特点,对车牌识别算法关键环节包括数字图像预处理,车牌定

2、位,车牌字符识别等三部分一一进行了分析研究。本文采用直方图变换、边缘检测、二值化等方法对车牌图像进行了预处理。对车牌定位采用了一种基于灰度图像求取卷积能量极值区域的车牌定位方法。采用模板匹配法对车牌字符进行识别。并采用了MATLAB来完成算法的设计与实现。研究结果表明车牌识别率较高,适应性较强,实时性比较好。关键词:多路径识别;车牌识别;车牌定位;模板匹配;字符识别 ABSTRACTAs expressway construction unceasingly in provinces, numbers of online charging systems was completed basci

3、ally. In the construction of online charging system, we are facing a common problem The identification of vehicle path. Path recognition involves not only how to calculate the tolls to every vehicle, also should consider how to split the incomes to relevant charging unit. Toll split is directly rela

4、ted to the legitimate benifit of every expressway,and is the key to networking toll. So solving the problem of multipath recognition plays an important role in perfecting the expressway networking toll system.This article introduces the multipath recognition algorithms, And emphatically analysed the

5、 recognition algorithm of license plate recognition. Based on image characters of license plate, we have a deeply research on the key technologies of the vehicle license plate recognition system, which include three parts: digital image pre-processing, license plate location, license plate character

6、s recognition.In the vehicle images pre-procession, the paper use the methods of Histogram Transformation, Edge detection, binarization. For license plate localization using a kind of calculating convolution based on gray image energy extremum region of license plate locating method.The paper use pa

7、ttern matching which method has been improved to recognize the characters. And using MATLAB to complete the design and implementation of the algorithm. Research results show that the license plate recognition rate is higher, adaptability is stronger, better real-time performance.Key Words: Multipath

8、 recognition;License plate identification; license plate location; template matching; OCR目 录第1章 绪论11.1 研究背景和意义11.2 MATLAB的概述11.3 本文框架结构4第2章 国内外研究现状52.1 国外研究现状52.2 国内研究现状6第3章 多路径识别算法的基本理论83.1 多路径识别方法的分类83.1.1精确识别83.1.2概率识别93.2多路径识别算法的理论基础93.2.1 车牌照识别的主要算法93.2.2本文采用的识别算法12第4章 基于模板匹配的车牌识别详细设计154.1图像采集1

9、54.2图像预处理154.3车牌定位174.4倾斜校正184.5字符分割194.6字符识别204.6.1字符识别流程概述204.6.2本文字符识别流程21第5章 车牌识别系统在MATLAB工具下的实现275.1实验环境275.2平台搭建275.3识别过程285.4实验数据及分析33第6章 总结与展望356.1 总结356.2 展望36致谢38参考文献39附录4040第1章 绪论随着各省市高速公路的不断建设,基本上建成了大小规模不等的联网收费系统,在联网收费系统建设中,都面临了一个共同的问题车辆行驶路径的识别。路径识别不仅仅涉及对每一通行车辆如何计算通行费,同时还要考虑将收入的通行费拆分给哪个收

10、费单位的问题,通行费的拆分直接关系到各条高速公路的合法利益,是联网收费的关键。所以说解决多路径识别问题在完善高速公路联网收费系统中起着至关重要的作用。1.1 研究背景和意义随着高速公路路网规模的不断扩大,联网收费区域内的环状路结构变得更加复杂,仅河北省一片区(京津以南高速公路)联网收费区域内的已有路、在建路和未建路共有约20个最小封闭环路,如果在每个不同业主的路段设收费站,投资巨大,也会影响高速公路的效率,同时,传统的收费车道所采用的人工输入车牌号码后3位数字的方式时效性差,巨大的工作量直接影响高速公路的通行能力和服务水平。因此,高速公路上两点之间车辆行驶的多路径识别问题成为联网收费及网络费用

11、清分模式中迫切需要解决的问题。多路径识别主要解决高速公路通行费的合理收取以及通行费的准确拆分问题。同时由于高速公路中大型车辆倒卡、逃费现象十分猖獗,通常表现为利用目前机电系统存在的功能不完善漏洞,实现相同货车套牌倒卡具体表现为满载长途与空载短途同号牌车辆倒卡,即通过减少里程,逃避超载处罚力度。为高速公路正常收取车辆通行费造成的及大的损失,同时也带来了不良的社会影响。所以多路径识别在实现识别车辆的实际行驶路径从而进行收费拆分,同时也要解决倒卡、逃费问题。综上所述,多路径识别就需要解决以下三个问题:(1)高速公路通行费的合理收取。(2)通行费的准确拆分。(3)倒卡、逃费问题。1.2 MATLAB的

12、概述MATLAB是用于算法开发、数据可视化、数据分析以及数值计算的高科技计算语言和交互式环境。它具有以下特点:1友好的工作平台和编程环境MATLAB由一系列工具组成。这些工具方便用户使用MATLAB的函数和文件,其中许多工具采用的是图形用户界面。包括MATLAB桌面和命令窗口、历史命令窗口、编辑器和调试器、路径搜索和用于用户浏览帮助、工作空间、文件的浏览器。随着MATLAB的商业化以及软件本身的不断升级,MATLAB的用户界面也越来越精致,更加接近Windows的标准界面,人机交互性更强,操作更简单。而且新版本的MATLAB提供了完整的联机查询、帮助系统,极大的方便了用户的使用。简单的编程环境

13、提供了比较完备的调试系统,程序不必经过编译就可以直接运行,而且能够及时地报告出现的错误及进行出错原因分析。2简单易用的程序语言 MATLAB一个高级的矩阵/阵列语言,它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。用户可以在命令窗口中将输入语句与执行命令同步,也可以先编写好一个较大的复杂的应用程序(M文件)后再一起运行。新版本的MATLAB语言是基于最为流行的C语言基础上的,因此语法特征与C语言极为相似,而且更加简单,更加符合科技人员对数学表达式的书写格式。使之更利于非计算机专业的科技人员使用。而且这种语言可移植性好、可拓展性极强,这也是MATLAB能够深入到科学研究及工程计算各

14、个领域的重要原因。3强大的科学计算数据处理能力 MATLAB是一个包含大量计算算法的集合。其拥有600多个工程中要用到的数学运算函数,可以方便的实现用户所需的各种计算功能。函数中所使用的算法都是科研和工程计算中的最新研究成果,而前经过了各种优化和容错处理。在通常情况下,可以用它来代替底层编程语言,如C和C+ 。在计算要求相同的情况下,使用MATLAB的编程工作量会大大减少。MATLAB的这些函数集包括从最简单最基本的函数到诸如矩阵,特征向量、快速傅立叶变换的复杂函数。函数所能解决的问题其大致包括矩阵运算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、傅立叶变换和数据的统计分析、工

15、程中的优化问题、稀疏矩阵运算、复数的各种运算、三角函数和其他初等数学运算、多维数组操作以及建模动态仿真等。4出色的图像处理功能MATLAB自产生之日起就具有方便的数据可视化功能,以将向量和矩阵用图形表现出来,并且可以对图形进行标注和打印。高层次的作图包括二维和三维的可视化、图象处理、动画和表达式作图。可用于科学计算和工程绘图。新版本的MATLAB对整个图形处理功能作了很大的改进和完善,使它不仅在一般数据可视化软件都具有的功能(例如二维曲线和三维曲面的绘制和处理等)方面更加完善,而且对于一些其他软件所没有的功能(例如图形的光照处理、色度处理以及四维数据的表现等),MATLAB同样表现了出色的处理

16、能力。同时对一些特殊的可视化要求,例如图形对话等,MATLAB也有相应的功能函数,保证了用户不同层次的要求。另外新版本的MATLAB还着重在图形用户界面(GUI)的制作上作了很大的改善,对这方面有特殊要求的用户也可以得到满足。 5应用广泛的模块集合工具箱MATLAB对许多专门的领域都开发了功能强大的模块集和工具箱。一般来说,它们都是由特定领域的专家开发的,用户可以直接使用工具箱学习、应用和评估不同的方法而不需要自己编写代码。目前,MATLAB已经把工具箱延伸到了科学研究和工程应用的诸多领域,诸如数据采集、数据库接口、概率统计、样条拟合、优化算法、偏微分方程求解、神经网络、小波分析、信号处理、图

17、像处理、系统辨识、控制系统设计、LMI控制、鲁棒控制、模型预测、模糊逻辑、金融分析、地图工具、非线性控制设计、实时快速原型及半物理仿真、嵌入式系统开发、定点仿真、DSP与通讯、电力系统仿真等,都在工具箱(Toolbox)家族中有了自己的一席之地。 6使用的程序接口和发布平台新版本的MATLAB可以利用MATLAB编译器和C/C+数学库和图形库,将自己的MATLAB程序自动转换为独立于MATLAB运行的C和C+代码。允许用户编写可以和MATLAB进行交互的C或C+语言程序。另外,MATLAB网页服务程序还容许在Web应用中使用自己的MATLAB数学和图形程序。MATLAB的一个重要特色就是具有一

18、套程序扩展系统和一组称之为工具箱的特殊应用子程序。工具箱是MATLAB函数的子程序库,每一个工具箱都是为某一类学科专业和应用而定制的,主要包括信号处理、控制系统、神经网络、模糊逻辑、小波分析和系统仿真等方面的应用。 7.应用软件开发(包括用户界面)在开发环境中,使用户更方便地控制多个文件和图形窗口;在编程方面支持了函数嵌套,有条件中断等;在图形化方面,有了更强大的图形标注和处理功能,包括对性对起连接注释等;在输入输出方面,可以直接向Excel和HDF5进行连接。本文设计的系统采用MATLAB搭建车辆牌照识别系统,具有非常明显的优势:(1)可以直接使用MATLAB的Image Acquisiti

19、on Toolbox、Image ProcessingToolbox以及Neural Network Toolbox作为骨架来搭建整个系统。(2) 使用MATLAB的图形用户界面技术(GUI)编写牌照识别系统面板,可以达到与牌照定位切分程序及字符识别程序的无缝连接。(3) 使用专业工具箱,使得研究人员不必过于关心程序的细节问题,可以将主要的精力放在算法的研究、设计方面,极大地减少了工作量,为算法的研究改进提供了先决条件。1.3 本文框架结构本文通过对多路径识别算法理论进行系统认真的学习和研究,查阅了大量的国内外相关的文献和资料,主要完成了围绕汽车牌照识别技术的多路径识别算法的实现。本文的主要结

20、构如下所示:第一章,绪论。本章首先介绍了多路径识别理论研究的背景和意义,然后综述了陈述了本文的内容安排。第二章,国内外研究现状。本章介绍了多路径识别理论的历史、发展、国外各国发展现状及立足我国的研究发展方向。第三章,多路径识别基本理论。本章详细阐述了多路径识别理论的基本原理。首先讲述了多路径识别理论的构成,然后围绕多路径识别算法的精确识别中汽车牌照识别技术的主要算法展开讨论,介绍了该技术应用了哪些方面的知识,是如何实现的。第四章,基于模板匹配的车牌识别详细设计。本章是本文的重点,包括图像的采集、图像预处理、车牌定位、倾斜校正、字符分割、字符识别。第五章,实验环境平台搭建、识别过程、实验数据及分

21、析。第六章,总结和展望。本章总结了本设计所完成的工作,并对其中的缺陷做出了说明,指出了所采用算法的不足指出,对下一步的工作做了展望。 第2章 国内外研究现状多路径识别在高速公路联网收费系统中起到的关键作用,引起了大家广泛的关注和研究,下面我们将对该理论的历史和发展历程做出介绍。2.1 国外研究现状国外高速公路实行收费的虽然有一些,但是大部分规模不大,或者是路公司比较单一,他们的研究主要集中在电子不停车收费(ETC,即Electronic Toll Collection)系统上面,或者是更为智能的如德国研究的利用全球定位系统(GPS)的收费系统,但专门就在高速公路路径识别这方面的研究很少。日本是

22、一个典型的对高速公路实行收费制度的国家,其在高速公路收费防堵方面进行了不倦的探索。从2001年3月开始,ETC(电子不停车收费)技术在日本整体上投入运营。在实际应用中,ETC技术相对于传统收费技术来说有两个优势:一是更加适应于多个不同主体运营管理多条收费道路的情况;二是对非法行为、人为破坏和逃费行为有着更强的防范性。目前,日本高速公路 80%的出入口都实现了ETC化,而且越来越多的汽车安装了 ETC系统。据日本政府估计,到2007年,ETC的用户将达到1500万辆。日本最常用的ETC收费站采取3个门桥的样式,这3个门桥分别用于识别车型、识别入口和收费信息传输。关于其应用此项技术进行路径识别的研

23、究还没有见诸报道,但这样一来就有望通过大量的ETC用户,在关键路段安装扫描器,来达到高概率智能识别车辆行驶路径的效果。德国一直在高速公路上未建任何收费设施,对车辆收取的通行费包含在燃油费和养路费中。自2003年8月31日起,实施一项新的高速公路收费政策,即所有行驶在德国高速公路上的12吨以上的重型卡车,包括外国入境运输车辆, 都必须缴纳高速公路行驶费。所有收取的费用将用于改善德国交通基础设施,因为重型卡车将大量增加高速公路的建设和维护成本。德国实行高速公路收费没有采用传统的关卡式收费站,他们采用的是卫星定位和移动通讯技术相结合的收费系统。德国将投入的高速公路收费系统命名为“Toll Colle

24、ct”,是目前世界上不设收费窗口的最先进的道路收费系统之一。它采用卫星辅助探测技术,依靠每辆行驶在高速公路上的车辆上安装的收音机大小的接收机精确计算出车辆所行驶里程。接收机含有GPS导航信号接收机和一个移动通讯终端,一旦卡车启动,接收机便会自动记录行驶里程, 并将计算出的缴费金额数据发送到监控中心。这种技术相当于已经识别出了车辆行驶路径,但其依赖于美国的 GPS定位系统,受其控制的识别精度影响,目前GPS的导航精度为10m,但不排除美国改变其导航精度的可能,使识别精度受到质疑,另外其车载接收机的价格也是一个问题。2.2 国内研究现状目前许多省市建设的高速公路都具有相当规模,联网收费己成大势所趋

25、。由于路网结构的复杂性,有的里面具有环形结构,随着路网的不断完善这种环形结构将会越来越多, 而一个路网里面一般有多个路公司在管理,如何确定车辆行驶路径也就成为一个摆在眼前的问题了。国内对这方面的专题研究不多,目前以软课题的形式开展此类研究的有江苏省苏北高速公路网和浙江省高速公路网。江苏省以长江为界分为苏北高速公路网和苏南高速公路网,分别实现联网收费。江苏省苏北高速公路路径识别技术研究的对象即苏北高速公路网,苏北高速公路网的联网收费范围包括京沪高速沂淮江段、宁连高速淮连段、京福高速徐州东绕城段、徐宿高速公路、宁宿高速公路、宁通高速公路、广靖高速公路、连徐高速公路、宁靖盐高速公路、汾灌高速公路及江

26、阴大桥。在研究中针对当时苏北具体路网提出了苏北高速公路联网收费的多路径判别方法及相关措施。浙江省高速公路网对路径识别问题进行研究的时候,其高速公路路网中存在两个二义性路径的路环:一个是杭甫高速公路(沽清大朱家)、上三高速公路全线、雨台温高速公路(宁波东吴番枢纽)组成的路环;另一个是由沪杭、杭甫、绕城高速公路组成的路环。针对这两个二义性路径。浙江省当时采用的方法是以出口/入口隔离法为辅,通行费的拆分则是在对历史交通量和未来交通量的分析基础上,与路公司共同商讨,取得一致同意的情况下达成用节点位势法来进行多路径的路径识别,它仿照电学里面的节点位势法,确定用路段里程来表征路段阻抗,从而计算出多路径情况

27、下各路径的行驶车辆数,进而依次在各路公司拆分通行费,对车辆的通行费按照最短路径来征收。其拆分为了适应不断变化的交通流量,省收费结算中心和路公司定期组织对二义性路径的交通流量进行统计调查,并通过实际运行一段时间后(三个月半年),根据实际统计的流量状况和分布情况、车辆选择路径的情况以及与现用的二义性路径拆分原则的差距情况,对原来的分配方案和比例进行调整。山东省高速公路通车里程超过3000km,预计2008年将达到4000km,高速公路通车里程为全国第一,联网收费里程已达到2144km,路网内有多家路公司。最初山东省采用最短距离法进行路径识别与通行费收入拆分。随着联网收费高速公路网规模的不断扩大,不

28、同利益主体管辖的路段将会逐渐并入网中,路网结构日趋复杂,路径识别与通行费收入拆分问题日益突出,据估计由多路径产生的费用占路网总通行费用的3.396,每年达1000万元左右。为此山东省对山东省高速公路联网收费系统路径识别与通行费收入拆分问题进行研究认为:要从山东省高速公路总体路网规划出发,综合考虑设备投资、受益及今后运营成本等多方面因素提出方案;路径识别与通行费收入拆分问题主要从两个方面解决,一是收费车道业务操作层,主要是路径识别问题;二是收费管理层面,主要是通行费收入拆分问题。车道收费业务操作要求尽可能精确识别每一车辆的行驶路径,不损害道路通行者利益,合理收取通行费。在进行路径识别时,根据具体

29、情况对不同路段采取不同方法。根据当时道路情况,他们建议在对综合路阻之差在10%(可更多或更少)以上不同路径进行识别时,应用最短路径法;当不同路径的路阻之差在10%之内,且车流量较少,涉及的通行费较低时,可采取收费员入口指导,出口询问方式;当长度之差在10%之内,且车流量较大,多路径通行费较高时,也可以考虑在在关键点设立标识站,但标识站数量一定要控制, 尽量减少对全路网的影响;另外,在路径识别精度方面,不同路段也要有所侧重。当路网中多路径路段属于同一经营主体时,建议不对行驶路径进行精确识别。由于目前我国联网收费还是刚刚开始,对其相关的技术研究的还不是都很深入,路径识别技术的研究在这种环境下也只是

30、刚刚开始,在现有的“一路一公司”的情况下实行的协商法需要各路公司相互之间有良好的协调关系。高速公路多路径识别技术作为依附于高速公路联网收费的一门新技术必然会随着联网收费技术的进步而不断发展完善,特别是在当前提倡的电子不停车收费(ETC)技术不断成熟完善的情况下,对车辆行驶路径的精确识别必然会在现实和经济上都允许的前提下得以实现。第3章 多路径识别算法的基本理论多路径识别包含多种技术方法,下面主要介绍了多路径识别方法的主要分类,详细说明了识别方法涉及到的主要算法。3.1 多路径识别方法的分类目前,在高速公路路径识别的主要技术方法有:标识站法、车牌照识别法、最短路径法。从基本思路看,多路径识别技术

31、可以分为精确识别和概率识别两类。3.1.1精确识别精确识别的原理是识别出路网中每一车辆的实际行驶路径,避免路网中出现行驶路径的歧义,从而解决路网中多路径问题。标识站法、车牌照识别法都属于精确识别的范畴。要做到对车辆行驶路径的精确识别通常由两种方法:通过土建设施的手段,确保任意车辆从一个收费站(点)到另一收费站(点)间只能有唯一的行驶路径;通过标识方法采集车辆行驶路径信息,确认车辆行驶路径。第二种方法只需在产生歧义的路段设立标识站,获取车辆行驶的标识信息,就可以根据出口信息、入口信息、标识信息,识别出任意车辆的行驶路径。1.标识站识别法准确识别车辆的实际行驶路径,可分为停车式和不停车两种,以下提

32、到的标识站均为“停车式标识站”。在收费车道上安装非接触式IC卡读写设备,司机通过此路段时,将IC卡(通行卡)在读写天线的规定距离内划过,自动栏杆开启、车辆通行,并记录该标识站信息。标识站的主要缺点是车辆每次经过标识站时必须停车,导致行车速度减慢,降低了高速公路的服务水平,与联网收费的精神直接相违背,在实施时,轻易不采用。在国家政策方面,交通部交公路发 19999号文件关于认真做好公路收费站点清理整顿的通知中规定“对通行车辆一次完成通行费收缴和票证发放工作,不准设立旨在进行内部监督验票的检查站”。显然,国家法律法规的规定对设置停车式标识站做出了限制,设置停车式标识站已不可行。2.车牌照识别技术随

33、着图像识别技术的发展,也可应用“车牌照识别”技术进行多路径的识别。即高速公路入、出口以及路网内关键点设置车牌照抓拍系统,摄取通过车辆牌照。车牌照识别方法虽然不影响行车速度,但是应用车牌照抓拍系统进行多路径的判别,投资较大且系统精度根据图像识别算法的不同效果也不同一般不能达到100%。3.1.2概率识别一般来说,道路使用者路径选择行为是基于道路使用效益最大化和运营成本最小化的原则之上的,即:花最少的时间、最少的费用、走最短的路、获取最大的效益。因此,运行时间最少的路径对于时间价值导向型的道路使用者来说具有更强的吸引力,用户一般采用最短路径法。最短路径法取最短路径为行驶路径。从起点到终点存在两条或

34、两条以上的路径,将最短路径作为车辆选择路径,此方法最为简便,投资最少。最短路径法直接将多路径车辆通行费分配给最短路径业主,因此,这种方法的精确度取决于车辆在实际的路径选择过程中选择最短路径的概率。但是在高速公路中倒卡、逃费问题严重,因此这种算法的拆分关系到将通行费拆分给哪个收费单位的问题,影响了一部分单位的收益。所以在本次设计中主要研究了精确识别中的车牌照识别技术,分析研究图像处理得算法,用以提高车牌照识别的准确度。3.2多路径识别算法的理论基础在本文涉及到的多路径识别算法车牌照识别技术中,对于一个完整的车辆牌照识别系统而言应该包括图像采集、图像预处理、车牌定位、字符切分、字符识别以及图像编码

35、、数码传输与更新等步骤,基本可以分为硬件部分和软件部分,硬件部分主要完成车辆图像的摄取采集,软件部分主要完成对采集到的车辆图像进行车辆牌照定位、车牌字符切分与车牌字符识别等工作,这部分工作最为复杂,最后对识别结果进行数据传送和存储,将处理后的识别信息交给管理系统进行管理。整个系统的核心是软件部分的工作,能否通过牌照对车辆进行有效管理,很大程度上取决于软件部分识别车牌的准确性。3.2.1 车牌照识别的主要算法车牌识别的常用算法法有很多种,如结构模式识别方法、统计模式识别、人工神经网络识别等等。下面分别介绍各种方法:1.结构模式识别结构模式识别可能比较复杂,但都具有相当严格的规律性。换句话说,字符

36、图像含有丰富的结构信息。可以设法提取含有这种信息的结构特征及其组字规律作为识别的依据,这就是结构模式识别。结构模式识别是早期汉字识别研究的主要方法。其主要出发点是汉字的组成结构.从汉字的构成上讲,汉字是由笔划以及偏旁部首构成的;还可以认为汉字是由更小的结构基元构成的。由这些结构基元及其相互关系完全可以精确地对汉字加以描述,这种方法也叫句法模式识别。识别时,利用上述结构信息以及句法分析地方法进行识别,类似于一个逻辑推理器。基于这种方法来描述字符的结构在理论上是比较恰当的,其主要优点在于对字体变化的适应性强,区分相似字的能力强;但是,在实际应用中,其所面临的问题是抗干扰能力差,因为在实际得到的文本

37、图像中存在各种干扰,比如倾斜、断裂、粘连、污点等。这些因素直接影响到结构基元的提取。假如基元不能准确得到,后面的识别就成了无源之水。所以,在字符识别领域,纯结构模式识别方法己经逐渐衰落。2.统计模式识别统计决策论发展较早,理论也比较成熟.其要点是提取待识别模式的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决。字符的统计模式识别是将字符点阵看作一个整体,其所用的特征是从这个整体上经过大量的统计而得到的.统计特征的特点是抗干扰能力强,匹配与分类的算法简单,易于实现.不足之处在于细分能力较弱,区分相似字的能力差一些。常见的统计模式识别方法有:(1)投影直方图法。利用字符图像在水平及垂直方

38、向的投影作为特征。这种方法是模式识别早期使用的方法。(2)利用变换特征方法。对图像进行变换,变换后对图像从空间域变到频域,特征的维数大大降低。但是这些方法总的特征就是运算量太大,运算复杂度高,难以满足实时处理的要求。(3)傅立叶描述子和Spline曲线近似。这两种方法都是针对字符图像轮廓的。傅立叶描述子是利用傅立叶函数模拟封闭的轮廓线,将傅立叶和函数的各个系数作为特征,该方法致命缺点是对于轮廓线不封闭的字符图像不适用。车牌字符本身所占象素点较少,常常会出现笔划断裂轮廓不封闭。Spline曲线是在轮廓上找到曲率大的折点,利用Spline曲线来近似相邻折点之间的轮廓线,该方法的缺点在于对旋转现象比

39、较敏感。(4)特征点方法。它的主要思想是利用字符点阵中一些有代表性的点作为特征来区分不同的字符。这些点包括端点、折点以及交叉点等等,获得了比较好的效果。其特点是对于内部笔划粘连的字符识别的适应性较强,直观性好,但是不易表示为矢量形式,不适合作为粗分类的特征,匹配难度大。(5)基于微结构特征的方法。字符是由笔划组成的,笔划是由一定方向,一定位置关系和长宽比的矩形线段组成的。这些矩形则称为微结构。利用微结构及微结构之间的关系组成的特征对字符进行识别。其不足之处正好和特征点的方法相反,在内部笔划粘连时,微结构的提取会遇到困难。统计模式识别认为图像可能包含一个或多个物体,并且每个物体属于若干事先定义的

40、类型、范畴或模式之一。虽然模式识别可以用多种方法实现,但我们只关心用数字图像处理技术对它的实现。字符统计模式是把字符的点阵看成一个整体,通过做大量的统计得到所需要的特征。最常用的字符统计模式方法是模板匹配的字符识别方法。模板匹配的字符识别方法是通过一定准则确定决策函数,并进行分类判断的方法。模板匹配的字符识别方法是指度量输入模式与样本之间的某种相似性,取最相似者为输入模式所属类别。它根据字符的直观形象抽取特征,用相关匹配原理进行识别。这个方法不需要特征提取这个过程,字符图像直接作为特征与模板进行比较,相似度最高的模板即定为识别结果。它优点是可以并行处理,简单易行。缺点是如果进行简单的模板匹配,

41、只能够识别同种字体、同样大小的字符,对于笔划变粗、变细、倾斜的字符适应能力比较差,特别是模板与字符笔划的匹配失误时,会有很大的误差。3人工神经网络识别人工神经网络是模拟人脑思维方式的数学模型。神经网络是现代生物学研究人脑的组织成果基础上提出的,用来模拟人类大脑神经网络的结构和行为,它从微观结构和功能上对人脑进行抽象和简化。人工神经网络方法的优点和缺点主要表现在如下的几个方面:神经网络的优点:1,能逼近任意线性函数2,信息的并行分布式处理和存储3,可以多输入多输出4,便于用超大规模的集成电路或光学集成电路系统实现5,具有自学习的能力;6,具有联想存储功能;7,具有高速寻找优化解的能力.虽然人工神

42、经网络有上述的优点,并且在OCR中也取得了一些成果,但是在车牌字符的识别中仍然存在很大的缺陷:l,车牌字符象素点阵小,笔划常常出现断裂,通过学习规则,误差系数相差很小,容易出现误识;2,神经网络在进行学习时,每次迭代的梯度值都受样本中噪声干扰,影响较大,整个系统收敛速度较慢,不适合实时识别的要求。用于字符识别最常用的神经网络是BP神经网络,所谓BP神经网络是指误差反向传播神经网络,核心方法是梯度下降法,它采用梯度搜索技术,以期使网络的实际输值与期望的均方差为最小。BP神经网络主要有两种形态:(l)前向传播:计算网络的输出。隐层神经元的输入为所有输入的加权之和,即 (式2.1) 隐层神经元的输出

43、井采用S函数激发x,得 (式2.2) 输出层神经元的输出为 (式2.3)误差性能指标函数为 (式2.4)(2)反向传播:采用占学习方法,调整各层间的权值根据梯度下降法,权值学习方法如下:输出层即隐层的连接权值W2、学习算法为 (式2.5) 式中 为学习速率。BP网络有以下优点:只要能保证有足够的隐层和隐层节点,就可以逼近任意的非线性映射关系;由于其学习方法属于全局逼近算法,具有较强的泛化能力;神经网络有较强的容错性。虽然BP神经网络有以上的优点,但因为其有收敛的速度比较慢;当按梯度下降学习法进行学习的时候很容易陷入局部的最小值;难以确定隐层和隐层节点的数目的缺点,所以在用于字符识别的过程中,还

44、需要做大量的修改。3.2.2本文采用的识别算法本文采用的识别算法是基于模板匹配的车牌识别方案,模板匹配法就是将待识别字符与模板字符进行比对,从而确定字符内容。其大体步骤是:首先,制作模板并要求模板的大小必须统一。然后,对待识别字符进行图像的归一化操作,最后将字符与模板的每个像素点进行一一的对照,与所有模板比对完成之后,选取其中相似结果最高的,作为最终的识别结果。整个过程最重要的一步是模板的设计,它是后续工作的基础。模板的建立要针对字符的特征来进行,通常可以取笔画特征、几何特征还有图形的特征。模板匹配方法最大的优点是识别率很高,但是因为要逐点操作,所以效率比较低下。考虑到LRS对识别效果准确率要

45、求比较高,此种方法比较合适,但是怎么样能提高效率,这还是一个堕待解决的问题。算法实现总体设计方案中首先是要采集图片,而硬件设备采集到的图片要考虑其图像的存储格式。目前比较常用的图像格式有*.BMP、*.JPG、*.GIF、*.PCX等,本课题采集到的图片是*.JPG的格式。至于软件系统的选择,因为软件系统的编写大多采用VC或者MATLAB语言,本课题选用了MATLAB语言。整个牌照识别的设计流程图如下图所示:识别的整个流程就是:首先将采集到的汽车图像进行灰度化、灰度拉伸和滤波处理,以降低噪点、增加车牌部分的对比度。然后,通过对预处理后的图像进行小波变换分解提取图像边缘,并进行形态学处理,这时,

46、车牌的轮廓已经非常清晰,并且可以和非车牌区域明显区分开来了,接着,根据车牌的特点进行车牌初步定位,对车牌区域和伪车牌区域进行筛选后,采用投影法进行车牌二次定位,提取出车牌图像。将提取出的车牌图像进行二值化处理,根据投影图的特点查找倾斜的角度,采用坐标变换的方法进行车牌倾斜校正,并利用其垂直投影图中字符显示出的峰群的特点进行字符切分。最后完成了整个车牌字符的识别。最后搭建了一个测试平台,将上述三个部分进行了系统化,对系统的性能进行了测试和分析。开始输入汽车图像提取车牌边缘形态学处理一次定位是否有车牌进行二值化根据投影和坐标变换进行倾斜矫正根据垂直投影进行字符切分进行字符识别结果输出二次定位结束N

47、OYES图3.1 系统识别流程图第4章 基于模板匹配的车牌识别详细设计本设计处理的流程包括:图像采集-图像预处理-车牌定位-倾斜校正-字符分割-字符识别六个部分。4.1图像采集图像采集部分所采集的图像一般是采用CCD摄像机摄取的车牌前视图或后视图,这些通过由光照检测装置控制现场的光照,位置检测装置控制摄像机的拍摄角度而得到的。本设计中所用到图片是用数码相机拍的,模型如下图: 图4.1 照片模型4.2图像预处理图像预处理部分需要对采集到的图像进行图像加强、平滑滤波等操作,目的是突出车牌的主要特征,以便更好地提取车牌。图像预处理一般包括以下步骤:对图像的灰度进行处理、图像平滑、图像增强、图像二值化

48、、图像锐化、边缘检测。图4.2 二值化的图像 图4.3图像边缘提取的图像采集的车辆图像为彩色图像,应将彩色图像转化为灰度图像。由于光线不足或者反光等诸多因素,又可能造成车牌对比度较差,对接下来的纹理分析产生影响,所以有必要进行图像增强。本文对图像中特亮和特暗的地方进行灰度拉伸,有效增强图像对比度,提高车牌定位准确率。为了进一步提高定位准确率,我们通过连续的两帧图像定出车大概位置,再在车的位置上搜索车牌,这样不仅提高了准确率,还提高了整个程序的运行效率。同时为了减少图像中的孤立干扰点,保留车牌字符边缘,让车牌字符的图像灰度水平投影更有的连续性。选用 MXl的模板对灰度拉伸后的图像进行中值滤波。4

49、.3车牌定位从人眼视觉的角度出发,并根据车牌的字符目标区域的特点,在灰度图像的基础上提取相应的特征。车牌定位是车牌识别系统中的关键和难点,实际图像中的噪声、复杂背景等干扰都会使定位十分困难。车牌牌照的提取是一个寻找最符合牌照特征区域的过程。从本质上讲,就是一个在参量空间寻找最优定位参量的问题。自然环境下,汽车图像背景复杂、光照不均匀,如何在自然背景中准确地确定牌照区域是整个识别过程的关键。首先对采集到的视频图像进行大范围相关搜索,找到符合汽车牌照特征的若干区域作为候选区,然后对这些侯选区域做进一步分析、评判,最后选定一个最佳的区域作为牌照区域,并将其从图象中分割出来。流程图如下:导入原始图像图

50、像预处理增强效果图像边缘提取车牌定位 对图像开闭运算图4.4 车牌定位流程图本文采用车牌定位方法是一种基于灰度图像,求取图像能量极值区域的车牌定位方法,刻意避开二值化中闽值的确定问题。该方法充分利用车牌纹理复杂、对比度鲜明、外型规则等特征构造车辆图像的对比度能量图,然后通过选取极值区域来定位车牌。基于求取卷积能量极值区域进行车牌定位的实验步骤基本如下:首先,为了提高定位准确率,我们通过连续的两帧图像定出车辆大概位置,再在车辆的位置上搜索车牌,这样不仅提高了准确率,还提高了整个程序的运行效率。同时减少图像中的孤立干扰点,保留车牌字符边缘,让车牌字符图像的灰度水平投影更有连续性。其次,由于车牌区域

51、与车身相比,车牌区域的对比度特别大,灰度变化具有一定频度,所以我们先对图像的每一行相邻像素做求极值处理,再求相邻点间的差,从而减少由车身带来的误差。求极值处理公式如下: (式4.1)求相邻点间的差公式如下: (式4.2)最后,由于车牌区域的变化频度较大,在一般情况下,车牌区域的卷积能量都是最大的,特殊情况下也是第二大。又由实验可知,对图像求卷积能量时,卷积长度越接近车牌的宽度,定位就越准确。再由先验知识可知车牌的宽度与车宽成一定的比例,所以车牌宽度可由车宽求出,因此对每帧图像求卷积能量时,卷积长度采用自适应的方法,进一步提高车牌定位的准确率。卷积能量公式如下: (式4.3)其中h(n)为长度为

52、L的卷积核。图4.5 定位到的车牌图片4.4倾斜校正由于CCD摄像机采集车牌图像时,有时候会出现采集到的车牌图像里牌照区域是倾斜的。倾斜的牌照不利于后续的字符分割与识别,严重的还可能引起牌照内容的丢失,直接导致字符识别的失败。因此,在进行字符分割与识别之前,有必要对牌照进行倾斜校正。目前,车牌的倾斜校正方法主要有:通过垂直和水平边缘检测相结合的方法;进行水平边缘检测,并进行垂直投影的方法;Hough变换法;求得车牌上字符连通域的中心点,然后拟成直线的方法;求取车牌字符区域的极小特征点和极大特征点的方法;.通过模板匹配的方法。其中Hough变换的方法比较常用。Hough变换运用两个坐标之间的变换

53、来进行检测。平面内的有规则曲线和直线,将原始图像中直线和曲线上的点,都集中到变换空间上,形成峰点。这样就把原始图像中的曲线或直线的检测问题,转化为寻找变换空间的峰值问题。Hough变换只能对己知形状参数的曲线方程如二次曲线、直线来进行描述,不能对未知曲线来进行检测,这是此变换的缺点。但是变换的最大优点是抗干扰性强。只要检测出车牌的两条平行直线即可,符合变换的要求。图4.6 校正前的图片图4.7 校正后的图片4.5字符分割字符分割即是对获得的牌照分离出单个字符(包括汉字、字母和数字等),以便于字符识别。字符分割的算法有很多,通常是根据处理对象的不同有许多相应的方法。为了实现更好的分割,有关的总体

54、知识和先验信息是很有用的,根据包含在图像中的信息,可以制定相应的判决准则和控制策略,使其完成自动分割。传统的字符分割算法可以归纳为以下三类:直接分割法、基于识别基础上的分割法和自适应分割线聚类法。直接分割法简单,但它的局限是分割点的确定需要较高的准确性;基于识别结果的分割是把识别结果和分割结合起来,但是需要高准确的识别结果。它根据分割和识别结果的耦合程度又有不同的划分;自适应分割线聚类法是一个分类器,用它来判断图像的每一列是否是分割线,它是根据训练样本来进行自适应的神经网络,但是对于粘连的字符很难训练。由于本文处理的对象是相对类型较少,变化较小的车牌,因此采用直接分割法。具体就是采用投影法先将

55、字符粗分割,然后根据单个字符的宽度进行分类,将粘连字符再分割,断裂字符合并。完成牌照区域的定位后,再将牌照区域分割成单个字符,然后进行识别。由于字符在垂直方向上的投影必然在字符间或字符内的间隙处取得局部最小值的附近,并且这个位置应满足牌照的字符书写格式、字符、尺寸限制和一些其他条件。利用投影法对复杂环境下的汽车图像中的字符分割有较好的效果。分割步骤:按左右宽度切割出字符计算水平投影进行车牌水平校正去掉车牌的框架分析垂直投影找到每个字符中心位置 图4.8 车牌分割步骤 图4.9 分割后的车牌 4.6字符识别本文的字符识别采用的是基于模板匹配的识别方法。模板匹配是最为直观的一种方法,就如字面所理解

56、的,选用一些样本作为模板,当进行判断时,首先计算待测数据与模板之间的距离,这个距离通常是两个数据向量差的一个范数,例如它们之间的直线距离等。找出距离最短的那个模板这个模板的输出值就可以作为该数据对应的输出值。4.6.1字符识别流程概述当一幅车牌的原始图像经过车牌定位和字符分割处理后,得到这个车牌的字符图像,首先对字符图像做归一化处理,即把字符图像归一化成20 32的标准大小的图像,然后对这幅归一化的图像调用设计好的模板匹配程序进行识别,字符识别流程如下:1、识别车牌的第1个字符(若分割正确的话应该是汉字):(1)调用汉字模板库进行匹配识别,若识别结果为汉字,则最终结果为一汉字,识别结束;若识别

57、结果为空字符,即表示不是汉字,则进行第二步。(2)调用字母模板库进行识别,若为字母,则最终结果为一个字母,识别结束;若识别结果为空字符,则表示不是字母,进行第三步。(3)调用数字模板库进行识别,若为数字,则最终结果为一数字,识别结束;若为空字符,则最终结果为空字符,识别结束。2、识别车牌的第2个字符(若分割正确的话应该是字母):(1)调用字母模板库进行识别,若为字母,则最终结果为一个字母,识别结束;若识别结果为空字符,则表示不是字母,进行第二步。(2)调用数字模板进行识别,若为数字,则最终结果为一数字,识别结束;若为空字符,则表示不是数字,进行第三步。(3)调用汉字模板进行识别,若识别结果为汉

58、字,则最终结果为一汉字,识别结束;若识别结果为空字符,则最终识别结果为空字符,识别结束。3、识别车牌的第3、4个字符(若分割正确的话应该是字母或数字):(1)调用字母模板库进行识别,若为字母,则最终结果为一个字母,识别结束;若识别结果为空字符,则表示不是字母,进行第二步。(2)调用数字模板进行识别,若为数字,则最终结果为一数字,识别结束;若为空字符,则表示不是数字,进行第三步。(3)调用汉字模板进行识别,若识别结果为汉字,则最终结果为一汉字,识别结束;若识别结果为空字符,则最终识别结果为空字符,识别结束。4、识别车牌的第5、6、7个字符(若分割结果正确的话应该是数字):调用数字模板进行识别,若

59、为数字,则最终结果为一个数字,识别结束;若为空字符,则最终识别结果为空字符,识别结束。对于车牌图像的第1、2和3个字符,进行完全的识别,主要是因为考虑到字符的分割不一定正确,即不能保证分割后的第1个车牌字符为汉字,第2个车牌字符为字母,而第3、4个车牌字符为字母或数字。对这三个字符做这样的完全识别后,可以得到一些非常有用的信息,这些信息可以返回到字符分割模块,可以指导字符分割调整字符分割的策略。例如,若识别出的车牌图像的第2个字符是汉字,则说明字符模块做字符分割的时候在车牌图像的左边提取了一个多余的字符,因此字符分割模块要去掉这个多余的字符,从汉字字符起,依次提取出7个字符来。图4.10 车牌

60、中的字符 图4.11 模板字符 4.6.2本文字符识别流程模板匹配是车牌字符识别最早使用的方法之一,本文也主要是研究基于模板匹配的系统,所以本章重点研究这种算法。具体模板匹配的字符识别步骤如下:一般使用的模板匹配法是直接使用归一化后的图像作为待识别字符图像,而归一化后的图像由于预处理的原因,很有可能笔划粗细不均,并且存在着部分噪音点,不易于处理,所以我们首先采用细化的方法,将原来的待识别字符图像中的字符进行细化处理,然后再进行模板匹配的粗比对,在通过粗比对将字符图像分组后,再根据车牌字符的细节特征对字符进行细比对,最终得到识别结果,从而实现了我们识别字符的目的,算法流程如下图所示:图4.12

61、算法流程图 首先进行第一步,细化处理。细化,又称为骨架化,即在不影响原图的拓扑连接关系的条件下,将宽度大于一个像素的图形线条转变为只有一个像素宽度的处理过程,也就是抽取图像的骨架,由于细化能很好地展现图像的形状,并且,细化还有一个优点就是可以减少所需用到的内存空间,这样就可以在进行图像处理时简化一些操作,加快处理速度。因此,细化在图像处理中占有着重要的地位,是图像分析、信息压缩、特征抽取及模式识别常用的技术。由于细化处理在图像处理中的重要性,所以细化算法一直是人们比较关注的问题,人们也提出了许多的细化算法,这些算法的处理方法和结果也都不一样,但是不论其目的,用途怎样,细化过程都不能改变原图的拓扑连续性,也不能有显著的端点缩短和叉点分离的畸变情况。此外,在许多情况中,细化的过程占整个图像处理一半以上的时间,因而提高细化算法的速度也是非常有意义的。我们采用的是一种简单而且效果很好的算法,能够实现抽取骨架的功能。所谓骨架,可以理解为图像的中轴,例如一个长方形的骨架就是它的长方向上的中轴线;正方形的骨架就是它的中心点;圆的骨架就是它的圆心;直线的骨架就是它自身;孤立点的骨架也是自身。那么,如果去除那些骨架以外的点呢?显然,是要根据它的八个相邻点的情况来判断,以下就是几个例子,如图所示:

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!