基于静止图像的车牌照汉字识别系统设计与实现

上传人:仙*** 文档编号:32465004 上传时间:2021-10-14 格式:DOC 页数:46 大小:810KB
收藏 版权申诉 举报 下载
基于静止图像的车牌照汉字识别系统设计与实现_第1页
第1页 / 共46页
基于静止图像的车牌照汉字识别系统设计与实现_第2页
第2页 / 共46页
基于静止图像的车牌照汉字识别系统设计与实现_第3页
第3页 / 共46页
资源描述:

《基于静止图像的车牌照汉字识别系统设计与实现》由会员分享,可在线阅读,更多相关《基于静止图像的车牌照汉字识别系统设计与实现(46页珍藏版)》请在装配图网上搜索。

1、西 南 交 通 大 学毕业设计(论文)基于静止图像的车牌照汉字识别系统设计与实现年 级: 2005 级 学 号: 20052220 姓 名: 郭强 专 业: 自动化 指导老师: 侯进 二零零九年六月 西南交通大学本科毕业设计(论文) 第VIII页院 系 信息科学与技术学院 专 业 自动化 年 级 2005 级 姓 名 郭强 题 目 基于静止图像的车牌照汉字识别系统设计与实现 指导教师评 语 指导教师 (签章)评 阅 人评 语 评 阅 人 (签章)成 绩 答辩委员会主任 (签章) 年 月 日 毕 业 设 计 任 务 书班 级 自动化1班 学 生 姓 名 郭 强 学 号 20052220 专 业

2、自动化 发 题 日 期:2009年 1 月 10 日 完 成 日 期:2009年 6 月 10 日题 目 基于静止图像的车牌照汉字识别系统设计与实现 题目类型:工程设计 技术专题研究 理论研究 软硬件产品开发一、 设计任务及要求 车牌照识别是智能交通系统的一个重要课题,在车辆管理、不停车收费等系统中有广泛应用。基于中国车牌照的特点,我们需要设计一种能识别汉字的车牌照识别系统,使得这样的车牌照识别系统更优于其他只能识别数字和字母的系统,具有更广的适应性。具体要求如下: 1、对输入的车牌汉字字符图像进行字符特征提取; 2、基于车牌汉字的特点,建立一个车牌汉字字符标准识别样本字库; 3、通过训练统计

3、或模式识别法来识别汉字并给出结果。 二、 应完成的硬件或软件实验 1、利用MATLAB或VC+编程实现车牌照汉字的识别技术 2、设计一个人机交互界面能输入车牌照汉字图像并显示字符识别的结果 三、 应交出的设计文件及实物(包括设计论文、程序清单或磁盘、实验装置或产品等) 1、毕业设计论文(必须完全符合学校规范,内容严禁有丝毫的抄袭剽窃) 2、CD-R(含论文,程序,程序使用说明书,演示视频,盘面标注班级,姓名,专业,日期) 3、英文翻译按学校规定,导师无特殊要求 四、 指导教师提供的设计资料 1、研究报告介绍(包括课题背景、动机、内容、意义) 2、计划说明书 3、部分英文文献资料和Mediala

4、b LPR图像数据库 五、 要求学生搜集的技术资料(指出搜集资料的技术领域) 1、本课题相关领域国内外重要论文及资料 2、MATLAB、C+编程指南 六、 设计进度安排第一部分 查阅相关资料,学习相关编程语言 ( 5 周)第二部分 编制程序并进行软件调试 ( 8 周)第三部分 撰写毕业论文 ( 2 周) 评阅及答辩 毕业论文修改和参加答辩 ( 1 周) 指导教师: 年 月 日系主任审查意见:审 批 人: 年 月 日注:设计任务书审查合格后,发到学生手上。 西南交通大学信息科学与技术学院 2008年制摘 要在汽车普及的今天,道路运输已经成为超越铁路运输的最重要的地面运输方式,在国民经济和社会发展

5、中起着举足轻重的作用。但是随着汽车的普及、交通需求的急剧增长,道路运输所带来的交通拥堵、交通事故和环境污染等负面效应也日益突出,成为阻碍经济和社会发展的全球性共同问题。进入90年代以后,随着电子计算机软硬件技术的发展,智能交通系统(Intelligent Transportation System,简称ITS)成为解决这一矛盾的有效途径之一。在上述智能系统中,字符识别都是其核心内容,而汉字识别(Chinese Character Recognition,简称CCR)又是字符识别的重点和难点所在。这个项目的目标就是开发出一个识别速度快、准确率的高的车牌汉字识别系统。本文提供了一种简单的车牌汉字识

6、别方法。我国机动车使用的拍照主要是根据公安部1992年颁布的中华人民共和国机动车号牌标准(GA36-92)制作的,其中汉字大约50个。所以我们只要考虑这50多个字的结构差别就可以准确的识别出这些汉字来。首先,对输入的图像进行尺寸规格化、二值化、反色、细化等预处理。然后,对预处理后的图像进行特征提取,包括独立结构的个数,笔画横、竖、撇(包括点和捺)的个数,将这些数放在同一个向量中。最后,采用模板匹配分类器将特征提取中得到的向量与标准库中的向量进行比较,找到该向量对应的汉字,并输出结果。实验表明,本文所介绍的方法方便简单,准确率高,速度快。对识别对象已知的车牌汉字识别有很好的识别效果。关键词:智能

7、交通; 汉字识别; 二值化; 特征提取; 模板匹配分类器AbstractWith the prevalence of automobiles, nowadays, road transport has gone beyond rail transport and becomes the most important ground transport mode. It is playing an important role in the national economy and societys development. However, popularity of motor vehicle

8、s and rapid growth in demand for transportation inevitably result in negative effects such as traffic jams, traffic accidents and pollution, which have become increasingly severe global common problems that hinder the development of economy and society.Since 1990s, with the development of computer h

9、ardware and software technologies, the intelligent transportation system (ITS) became one of the effective ways to solve this contradiction. As mentioned above, character recognition is the core content of intelligent systems, while the Chinese character recognition (CCR) is the most difficult and i

10、mportant part of character recognition.The object of this project is to develop an efficient character recognition system for vehicle license plates with high speed and accuracy. This article provides a simple method. License plates on Chinas motor vehicles are mainly designed on the basis of the st

11、andard of the Peoples Republic of motor vehicle number plate (GA36-92), which is published by the Ministry of Public Security department in 1992 involving about 60 Chinese characters. We could easily identify these characters as long as we figure out the difference in their structures. First, pretre

12、atment needs to be carried out for the input picture including size-normalization, binarization, and anti-coloring, detailing. Second, the features of the pre-treated picture will be extracted and then put on the same vector, including the number of independent structures, horizontal strokes, vertic

13、al, write (including point and Na). Finally, comparing the vector coming from the feature extraction with the vector from the standard library, the Template Matching Classifier is able to identify the Chinese characters corresponding to the vector, and then output the result.The experiment result sh

14、owed the method described in this article is simple and efficient, and has a good effect on identification of the known Chinese characters on the license plate.Keywords: Intelligent transportation; Chinese character recognition; Binaryzation; Feature extraction; Template matching classifier目 录摘 要ABS

15、TRACT第1章 绪 论11.1 问题的提出及研究意义11.1.1 问题的提出11.1.2 研究意义11.2 国内外研究现状21.2.1 车牌图像识别技术应用现状21.2.2 车牌图像识别技术研究现状41.3 设计的研究内容和方法51.3.1 研究内容51.3.2 研究方法51.4 本文结构安排81.5 本章小结8第2章 汉字图像的处理92.1 汉字图像的预处理92.1.1 不同尺寸汉字图像的规格化92.1.2 灰度图像二值化处理122.1.3 反色处理142.1.4 二值化图像细化处理152.2 汉字图像的特征提取172.2.1 笔画方向线素特征172.2.2 汉字结构特征点特征172.2.

16、3 汉字结构笔画特征182.3 本章小结21第3章 汉字图像的识别223.1 模版匹配分类器识别法223.2 识别性能分析263.3 本章小结27第4章 基于MATLAB的界面设计284.1 GUI简介284.2 系统界面设计284.3 本章小结32结 论33致 谢35参考文献36 西南交通大学本科毕业设计(论文) 第37页第1章 绪 论1.1 问题的提出及研究意义1.1.1 问题的提出在汽车普及的今天,道路运输已经成为超越铁路运输的最重要的地面运输方式,在国民经济和社会发展中起着举足轻重的作用。但是随着汽车的普及、交通需求的急剧增长,道路运输所带来的交通拥堵、交通事故和环境污染等负面效应也日

17、益突出,成为阻碍经济和社会发展的全球性共同问题。进入90年代以后,随着电子计算机软硬件技术的发展,智能交通系统(Intelligent Transportation System,简称ITS)1成为解决这一矛盾的有效途径之一。智能交通系统是在比较完善的道路设施基础上,将先进的电子技术、信息技术、传感器技术和系统工程技术集成运用于地面交通管理所建立的一种实时、准确、高效、大范围、全方位发挥作用的交通运输管理系统。近年来,随着国内经济的快速增长,汽车工业和交通运输产业迅速发展,对智能交通系统(ITS)提出了更高的要求,包括移动车辆稽查、高速公路收费站管理、停车场(小区)车辆管理等在内的一系列智能管

18、理系统应运而生。在上述智能系统中,字符识别都是其核心内容,而汉字识别(Chinese Character Recognition,简称CCR)又是字符识别的重点和难点所在。虽然现在市面上已经有多种CCR软件出售,但是他们仅仅对高质量的标准印刷文本有较高的识别率,但是对于严重污染、变形、模糊、倾斜的忽地字符,特别是针对车牌识别系统中提取的车牌汉字字符,不能给出满意结果2。本课题通过对车牌汉字灰度图像识别的研究,提出针对汽车牌照中汉字字符的有效识别算法,以期达到较高的识别正确率。1.1.2 研究意义牌照识别技术在智能交通领域中的应用已经非常的广泛。 如在“公交车优化调度与智能管理”中要求建立车辆自

19、动登记系统,包括:车辆自动识别、车辆定位(如GPS、路边塔标)、车辆位置跟踪、数据库及数据管理。在“不停车电子收费系统(Do not stop electronic toll collection system,简称ETC)”中,电子收费将会减少不必要的收费闸门车道数目以及因排队交费所造成的交通延迟。其车辆通过的基本流程为:电子不停车收费系统(ETC)在一定的范围内,设置减速板、栏杆等装置,当车辆按一定的速度驶入高速公路进口处时,该系统通过车载电子标签中的交通卡,自动记录该车的车型、牌照、入口时间和地点;到出口处时,该系统读到这些数据并同时生成需付费金额,迅速在交通卡中自动扣除。万一在匝道出口

20、处没有电子不停车收费系统(ETC),也可以通过交通卡读到相关数据,进行人工付费操作。 有些“停车管理与停车场信息系统”中也应用了牌照识别技术,用来将车辆停泊信息记录在案,可以有效地加强管理,降低车辆丢失率,打击盗窃车辆的犯罪活动3。1.2 国内外研究现状1.2.1 车牌图像识别技术应用现状2002年,车牌图像识别产品第一次在国内实际应用于交通工程。刚开始主要用于高速公路收费辅助系统以降低交通通行征费收入的流失,后来逐步发展到城市交通、停车场管理、门禁管理等多种应用领域。 1车牌图像识别技术在高速公路领域的应用 高速公路是车牌图像识别技术在我国交通工程中最早应用的领域,也是车牌识别产品应用最多的

21、领域。据统计,目前我国车牌识别产品主流供应商(如北京汉王科技、昆明利普视觉、上海高德威、沈阳聚德、北京信路威等公司)的产品有一半左右是应用在此领域。主要用于高速公路收费管理、路径判别、收费征稽、交通数据采集等方面,其中,最常用的是高速公路收费辅助系统。 高速公路收费辅助系统一般是在高速公路入口处进行车牌图像采集、识别,将识别结果写入通行卡(票)或者通过网络传送至各出口站,在车辆到达出口时,再进行一次车牌图像采集、识别,并将识别结果与入口识别结果相比对,以防止或发现倒卡、换卡、换牌等逃费行为。 目前的高速公路收费辅助系统中,采用车牌图像识别技术在车牌识别速度指标基本可以满足,但识别结果正确率指标

22、还不是很理想。从一些产品的解决方案来看,实际使用时一般仍然需要人工复核。因此,虽然车牌图像识别技术在这一领域取得了较好的使用效果,但还不能实现真正意义上的智能化收费。 2车牌图像识别技术在城市交通领域的应用 随着我国机动车保有量的迅速增加,以及政府对公共安全的日益重视,城市交通监控和管理工作日趋繁重。因此,城市交通领域迫切需要应用一些较可靠、有效的智能化技术手段。目前,车牌图像识别技术己经开始在移动电子警察、城市卡口监控、超速布控报警等城市交通(治安)方面有了一定的应用。其中,最常用的场所是城市卡口监控。 城市卡口监控:公安部颁布的城市卡口监控系统部颁标准明确规定了车牌识别是城市卡口监控系统的

23、一个重要组成部分,越来越多的城市公安部门正在积极筹建卡口系统。公安系统设立城市卡口监控点的主要任务是对车辆进行车牌识别,并将识别结果与被盗抢、肇事、在逃、通缉的车辆牌号黑名单进行比对。 移动电子警察:移动电子警察现在逐渐应用到交警日常工作中,采用移动电子警察技术可以灵活地对非固定监控点的交通违章和事故进行取证处理,不仅提高了警察执法效率,而且增强了执法的公正性。 在城市卡口监控、移动电子警察方面,对车牌图像识别技术在车牌识别结果的正确率指标的要求比较高,否则将给执法工作带来很大的麻烦。目前的车牌图像识别产品在这方面尚不够理想,因此一般也是作为一种辅助手段,还不能实现真正意义上的智能化。 3车牌

24、图像识别技术在停车场收费管理系统中的应用 停车场收费管理系统:用于对出入车辆号牌识别和匹配,实现自动计时、计费管理。由于停车管理日益成为城市交通管理中一个严重问题,人们对停车管理的智能化呼声日渐高涨,通过车牌识别系统可以构建一个智能的停车管理系统,因此,在大中城市的商场、写字楼有很大的市场潜力。 停车场收费管理系统对车牌图像识别技术在车牌识别结果的正确率指标的要求也非常高,目前的车牌图像识别产品在这方面也不够理想,一般也需要人工干预。 此外,车牌图像识别技术超速抓拍、门禁管理等方面也有一定的应用,但与前述三个方面的应用一样,还存在着一些问题有待于解决。其中,车牌识别正确率是目前车牌识别产品中存

25、在的最主要的问题,也是国内主流厂商最为头疼的问题,各个厂商所声称的识别正确率一般在95%左右,与真正智能化的要求还有一定的距离。而且由于并没有建立一个标准规范的测试体系,因此有关数据的客观公正性、可比性和可靠性等方面尚值得商榷。由于各个厂商对其使用的车牌图像识别技术都是不公开的,我们很难了解其中采用的三个方面的关键技术(车牌区域定位、单个字符区域切分、字符分类识别)中使用的具体方法,因此很难具体评价其方法的优劣。但通过各个厂商在其有关网站提供的信息和对两家厂商提供的测试软件进行一定数量样本的测试后,可以发现,各个厂商声称的车牌识别正确率往往是通过对特定场所、特定时间范围内的样本进行测试而得出的

26、结论。也就是说,所采用的车牌图像识别技术往往还在一定程度上要依赖待识别图像具体的采集环境和采集方式等因素。如果这些因素变动时,就可能要根据具体的样本、通过一定的分析学习过程以确定和修改使用的有关参数,才可能获得较好的识别效果,否则其识别正确率可能不会很理想。由此可以推断,目前的车牌图像识别产品对于不同使用环境的适应性还不是特别理想,其原因主要是关键技术对于不同背景和不同自然条件下所采集图像的适应性还不是很好,会导致车牌识别产品软件的通用性还不是太好,往往需要在现场采集大量样本分析测试,并且要修改相应参数甚至方法,使得施工周期往往较长,识别结果的可靠性往往也不能让人完全放心。1.2.2 车牌图像

27、识别技术研究现状上世纪90年代中后期开始,随着数字图像处理基础理论的不断发展和视频处理技术、电子技术及计算机信息技术的迅速进步,国内从事车牌图像识别技术研发的厂商和研究人员增长迅速,提出了大量的关键技术算法,实际应用中也取得了一定的成果。 有关研究大多围绕车牌图像识别的三大关键技术(车牌区域定位、单个字符区域切分、字符分类识别)进行。通过对有关资源数据库中1998年2006年在各类期刊上公开发表的约380篇相关论文的统计,发现有关车牌区域定位的内容占50%以上。这在一定程度上反映了车牌定位技术的重要地位,也一定程度上反映出目前这方面尚有不尽人意之处。相关论文中提出了很多车牌图像处理、分割、分析

28、、识别的算法,主要利用较经典的图像空间变换、智能计算和数据挖掘理论,并在一定程度上进行了实验论证。 在车牌区域定位方面,公开资料中提出的方法主要有:基于神经网络分类器的车牌区域定位方法、基于彩色图像特征的车牌区域定位方法、基于纹理检测和边缘检测的车牌区域定位方法、基于区域的车牌区域定位方法、基于几何形状特征的车牌区域定位方法、基于离散图像空间变换的车牌区域定位方法、基于离散图像空间变换的车牌区域定位方法、基于遗传算法的车牌区域定位方法等。 在车牌字符切分方面,公开资料中提出的方法主要有:基于二值(灰度)图像水平(垂直)投影分布的车牌字符的切分方法、基于二值图像字符区域上下轮廓分布的车牌字符切分

29、方法、基于模板匹配的车牌字符切分方法、基于聚类分析的车牌字符切分方法、基于车牌二值图像字符连通性的字符切分方法、基于颜色分类的车牌字符切分方法等。 在车牌字符分类识别时的特征选择和提取方面,公开资料中利用的字符分类特征主要有:以二值图像中字符的笔画像素分布为基础的字符特征(主要包括四周边特征、粗网格特征、投影特征等)、以二值图像字符轮廓、骨架为基础的字符特征(包括字符笔画方向线素特征、汉字结构特征点特征等)、基于灰度图像小波变换的字符特征(包括小波系数特征、小波矩特征和小波能量特征)。 在车牌字符分类器设计方面,公开资料中提出的分类器主要有: 神经网络分类器、模板匹配分类器、基于概率统计的Ba

30、yes分类器、几何分类器等。 上述方法的提出,为本文的有关研究提供了重要的参考和对照,在本文的第三章中进行了相应的分析4 5。1.3 设计的研究内容和方法1.3.1 研究内容车牌照识别是智能交通系统的一个重要课题,在车辆管理、不停车收费等系统中有广泛应用。基于中国车牌照的特点,我们需要设计一种能识别汉字的车牌照识别系统,使得这样的车牌照识别系统更优于其他只能识别数字和字母的系统,具有更广的适应性。车牌区域定位、单个字符区域切分和字符分类识别作为车牌图像识别系统的三个关键技术,同时又是一个有机的整体。关键技术水平的高低,决定了一个车牌图像识别产品性能的优劣,在某种程度上也决定着车牌识别技术的应用

31、前景。对于92式普通民用车牌,识别的基本过程如图1-1所示。原始图像 车牌定位 字符分割 识别第一个字符 识别第七个字符图1-1 92式普通民用车牌识别过程上述过程可以看作是一个三个方面九个环节组成的链式结构,而本课题主要研究的是其第三方面第一个环节的“识别第一个字符”,即汉字识别的方法。所以不考虑车牌定位及字符分割对识别的影响。采用的汉字库为已经分割好的灰度图像。1.3.2 研究方法本文在参考大量有关车牌图像识别技术公开资料的基础上,围绕着车牌汉字识别技术实际应用的特点和要求,并通过一定的实验分析手段,主要进行了如下几方面的工作:1对输入的车牌汉字字符图像进行预处理 在这部分工作中,重点分析

32、研究了不同图像的规格化,灰度图像的二值化、反色、二值化图像的细化等方法在车牌图像识别中的作用和应用特点。(1) 关于图像的规格化 在实际车牌采集时,由于拍摄角度、摄像头与车牌的距离等原因,照成采集到的车牌大小不同。给汉字特征提取造成计算量的不确定性。所以我们想法将输入的图像转化为某一固定尺寸大小的图像。图像的规格化就是将输入的任意尺寸(大小)的字符图像都处理成统一尺寸的标准汉字图像。在这里,我们所说的规格化不是简单的宽和高的同比例缩放,还要求保持拓扑不变。在改变原字符图像宽高比例的同时,尽可能的突出所提取特征。降低汉字图像特征提取的计算的复杂度。(2) 关于图像的二值化 在车牌图像识别中,图像

33、二值化是一个非常重要的技术。目前提出的车牌字符切分和字符分类特征提取的方法,很多是以二值图像为基础的。二值化阈值的确定应该以对图像进行二值化时期望达到的目的为依据。通过阈值的正确选择可以使汉字图像的灰度图像中的部分干扰噪声取出。在车牌图像识别中,对车牌汉字图像进行二值化可以大大的提升图像处理速度,而且降低对计算机硬件的要求,减少硬件方面的开支。在实际应用和产品推广方面有巨大的优势。(3) 关于图像的反色 在所提供的汉字库中,车牌汉字图像为白底黑字。由于MATLAB所提供的很多图像处理函数是对黑底白字的图像进行处理。如果自负图像为白底黑字,MATLAB会默认为汉字图像的背景为待识别图像。所以我们

34、对二值化后的图像进行取反,将原二值化后的二值化图像转化为黑底白字的汉字图像,以供后面进一步进行处理。(4) 关于图像的细化 二值图像的细化处理是本课题中起着非常重要的作用。其主要目的是提取出汉字图像的骨架,使得在识别过程中不会因为笔画本身的宽度,如使得三像素宽的竖当成宽来提取,影响到汉字结构特征提取的准确度。所以我们使用细化处理,将图像汉字细化为一个单像素宽的汉字图像。这样就可以大大增加各笔画提取的准确度。2对输入的车牌汉字字符图像进行字符特征提取 特征空间的设计是模式识别系统的基础。所选用的特征空间应使各类样品能够分布在该特征空间中彼此分开的区域内,分类识别才有可能;如果不同类别样品在该特征

35、空间中混杂在一起,则一般不可能进行正确的分类识别。常选取的字符特征主要有以二值图像字符的笔画像素分布为基础的字符特征及提取方法,以二值图像字符轮廓、骨架为基础的字符特征及提取方法,基于灰度图像小波变换的字符特征等。本课题所用的特征提取方法在二值图像字符轮廓、骨架为基础的字符特征及提取方法的基础上改进而来的。我们称为汉字结构笔画特征提取法。 3基于车牌汉字的特点,建立一个车牌汉字字符标准识别样本字库 车牌汉字字符标准识别样本库的建立要根据第二步所提取的字符特征的提取来建立。在第二步中,我们提取的字符特征为汉字的不相连独立结构、汉字笔画横、竖及撇、捺、点的个数。所以建立的车牌汉字字符标准识别样本库

36、实际就是样本车牌汉字图像的四维特征向量库。 4通过训练统计或模式识别法来识别汉字并给出结果 在汉字识别系统中,现有的识别方法有神经网络分类器、模板匹配分类器、基于二值数据的Bayes分类器、几何分类器等等。对于车牌汉字来说可以采用模板匹配分类器来进行识别。因为车牌汉字只有50个,所以存储量不大;而且,每个待测样品与每个标准模板进行相似度判断的计算量也不大,根据对10个车牌汉字图像的识别用时的统计,识别用时低于0.5s。识别速度比较快,低于实验任务书要求。所以本课题中选用该识别方法。本课题总体流程图如图1-2所示。开始打开并读取图像文件图像规格化处理汉字识别结束汉字特征向量匹配输出识别结果汉字结

37、构特征提取图像二值化处理图像反色及细化处理图1-2 系统流程图1.4 本文结构安排在基于静止图像的车牌照汉字识别系统中,最主要的核心就是汉字图像的预处理及字符特征提取,因此本文在第二章主要给出了汉字图像预处理及特征提取的详细步骤和方法;第三章则给出汉字识别系统的识别方法及过程;第四章主要针对本系统软件设计中流程图及界面设计,同时针对本系统作了一个快速性和精确度的性能分析,最终实现比较完备的车牌汉字识别系统。1.5 本章小结本章由现在道路交通中所遇到的问题,提出了本课题研究的意义。然后介绍了国内外的研究现状及本设计所用到得车牌汉字识别的方法。使读者可以大概了解到本课题所使用的各种处理方法和步骤。

38、通过本文结构安排,读者可以对全文的结构有一个宏观上的了解。第2章 汉字图像的处理技术在进行车牌图像采集时,由于天气变化、光照不均、摄像头拍摄角度不同、车牌的新旧及其清洁度的原因照成了采集到的车牌图像质量下降,对我们后面的识别的准确率带来了很大的负面影响。所以在识别前,我们要对采集到的图片进行必要的预处理操作,以改善图像质量,提高识别率。本课题主要研究车牌灰度化汉字图像的识别,所以我们用到的预处理包括图像尺寸规格化(标准化) 、二值化、反色、细化等。预处理效果的好坏与汉字图像的特征提取有密切的关系,良好的预处理可以有效的保持图像的有效信息,减少各种外部客观因素对特征提取的干扰。是整个设计中比较重

39、要的部分。2.1 汉字图像的预处理2.1.1 不同尺寸汉字图像的规格化图像的规格化就是将输入的任意尺寸(大小)的汉字图像都处理成统一尺寸的标准汉字图像。在这里,我们所说的规格化不是简单的宽和高的同比例缩放,还要求保持拓扑不变。在改变原汉字图像宽高比例的同时,尽可能的突出所提取特征。我们采用分裂合并的规格化方法。具体方法如下:设原始图像的大小为MN,规格化后的图像为PQ(在本课题中我们才用2323)。此方法分为两个阶段,即分裂(split)和合并(merge)。在分裂阶段,将原图像的每一点放大PQ倍,即将该点的像素值复制到PQ的阵列中,则MN的阵列变成一个MPNQ大小的阵列;接下来是合并阶段,将

40、MPNQ阵列划分成阵列大小为MN的PQ个区域,对MN区域的所有像素取平均,使阵列MN收缩成一个像素点。经以上操作,MN尺寸的原始图像就可以归一化为PQ大小的新图像。如图2-2-1所示。图2-1(a)与图2-1(c)为2346大小的图,经过规格化后其大小变为2323。除了上面介绍的分裂合并的规格化方法以外,还有插值变换的规格化方法。该方法是通过归一化图像中象素对应在原图像中的点的位置来决定归一化图像中象素点的灰度值。设f(x,y)为原图像,g(x,y)为归一化后的图像,g(x,y)中的任意一点(x ,y ),对应于f(x,y)中的点(a,b),根据(a,b)的具体情况来确定g(x,y)中象素点(

41、x ,y )的值。归一化图像中象素点和原图像中象素点的映射关系见公式(2-1)。 a)规格化前 b)规格化后 c)规格化前 d)规格化后图2-1 图像的规格化除了上面介绍的分裂合并的规格化方法以外,还有插值变换的规格化方法。该方法是通过归一化图像中象素对应在原图像中的点的位置来决定归一化图像中象素点的灰度值。设f(x,y)为原图像,g(x,y)为归一化后的图像,g(x,y)中的任意一点(x ,y ),对应于f(x,y)中的点(a,b),根据(a,b)的具体情况来确定g(x,y)中象素点(x ,y )的值。归一化图像中象素点和原图像中象素点的映射关系见公式(2-1)。 (2-1) 式中width

42、是原图像的宽度,width是归一化后的图像宽度:height是原图像的高度,height是归一化后的图像高度。归一化图像中的点(x ,y )映射到原图像中的点(a,b),如果是整数,表明(x ,y )正好对应在原图像的网格点(象素)上,不必进行内插变换,直接令(x ,y )的灰度值等于位置(a,b)处的灰度值: g(x ,y )= f(a,b)。如果(a,b)不是整数,即在该点没有定义,那么要进行象素内插变换。一般有三种内插变换方法来决定g(x ,y )的值12:邻近插值法、双线性插值法、三次插值法。下面一一介绍。(1) 邻近插值法 图2-2最近邻点的图形表示邻近插值法中归一化的图像g(x,y

43、)的灰度值是用(a,b)邻接的四个网格点(1,j), (i+l,j), (i,j+1), (i+1,j+1)中最接近它的点的灰度值来近,即:g(x,y) = f(a,b),其中(a,b)为(a,b)距其相邻四个网格点中最近的一个网格点。从图2-2中可以看出(a,b)与(i,j+l)的几何距离最小,所以(i,j+l)就是(a,b)的最近邻点(a,b)。(2)双线性插值法 双线性插值法中(x,y)的灰度值是用与(a,b)邻近的四个网格点(i,j), (i+l,j),(i,j+l), (i+l.j+l),按照下面的公式(2-2)来近似。 g(,)=f(i,j)(1)(1)+.f (i+1,j)(1)

44、 +.f(i, j+1)(1)+f(i+1, j+1) (2-2)其中,i,j为a,b取整的值,=a-i, =b-j。(3)三次插值法 三次插值法中(x,y)的灰度值是用与(a,b)邻近的16个网格点的灰度值来近似的,计算公式比较复杂,此处不再详述。2.1.2 灰度图像二值化处理灰度图像通常由一个unit8、unit16或者双精度类型的数组来描述,其实质是一个数据矩阵,该矩阵中的数据均代表了一定范围内的灰度级,每一个元素与图像的一个像素点相对应,通常0代表黑色,1、255或65635(针对不同存储类型)代表白色。而二值图像是指一个取值只有0和1的逻辑组。不存在介于0和1之间的其他值。所以使二值

45、图像在数字图像处理中具有很多优越性。这是因为,一方面,在有些图像处理课题中,如处理文字、指纹、工程图纸等图像本身接近于二值图;另一方面,在某些情况下即使图像本身是有灰度的,我们也设法使它变成二值图像再进行处理(即灰度图像的二值化)6。通过对灰度图像的二值化处理,我们可以使实际的信息量巨大、灰度级丰富的原图像,转化为计算量小的二值化图像。这样不仅可以大大的提升图像处理速度,而且降低对计算机硬件的要求,减少硬件方面的开支。在实际应用和产品推广方面有巨大的优势。二值化的目的是将目标对象与背景分离。图像二值化一般作为一种预处理方法,评价其效果的优劣应当兼顾下面两方面的基本要求:1二值图像中目标对象的完

46、整性。2二值图像中噪声对于后续处理影响的大小。二值化的方法很多,MATLAB中自带了函数im2bw用于将亮度图像转化为二值化图像。其语法为g = im2bw(f,T) a)原图像 b) 二值化图像 c) 原图像 d) 二值化图像图 2-3 图像的二值化该函数通过阈值处理,将衣服亮度图像f转化为衣服二值图像g。如图2-3。输出二值图像g中值为0的像素点,对于输入亮度图像f中值小于阈值T的像素点;输出二值图像g中为1的像素点则对应于输入亮度图像f中的其他像素点。设原灰度图像为f(x,y),二值化后的图像为g(x,y),则二值化的过程可以表示为公式(2-3)。 (2-3) 阈值T的选择是关键,它可以

47、表示为一个三元函数,即:T = (x,y),f(x,y),N(x,y),其中(x,y)是图像中象素位置,f(x,y)代表图像中像素(x,y)处的灰度值,N(x,y)为(x,y)周围领域的灰度特征。式中某些元素可以省略,因此演化为以下三种形式: T = f(x,y) . T为全局阈值 T = N(x,y), f(x,y) . T为局部阈值 T = (x,y), N(x,y), f(x,y). T为动态阈值全局阈值法根据图像的直方图或灰度空间分布确定一个阈值,以此实现灰度图像到二值图像的转化。典型的全局阈值方法包括Ostu方法、最大熵方法7等。全局阈值算法简单,对于目标和背景明显分离、直方图分布呈

48、双峰的图像效果良好,但对于由于光照不均匀、噪声干扰较大或运动模糊等原因使直方图分布不呈双峰的图像,二值化效果明显变差;局部阈值法通过定义考察点的邻域,并由邻域计算模板,实现考察点灰度与邻域点的比较。非均匀光照条件等情况虽然影响整体图像的灰度分布却不影响局部的图像性质,从而使得局部阈值法比全局阈值法有更广泛的应用,Bernsen算法是一种典型的局部阈值法。但局部阈值法在文本图像识别中也存在某些问题和缺点,如实现速度比全局阈值法慢,不能保证汉字笔划连通性,容易出现伪影(ghost)现象(背景区域受到噪声干扰出现笔划)等:动态阈值法是一种自适应的二值化方法,它利用了象素自身及其邻域灰度变化特征,由于充分考虑了每个象素邻域的特征,能够更好的突出背景和目标的边界,使得相距很近的两条线不会产生粘连现象。2.1.3 反色处理在所提供的汉字库中,车牌汉字图像为白底黑字。由于MATLAB所提供的很多函数是对黑底白字的图像进行处理。所以我们对二值化后的图像进行取反。将原二值化后的二值化图像转化为黑底白字的汉字图像,以供后面进一步进行处理。如图2-4。 a)二值化图

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!