基于SIFT算子的车标识别实验报告

上传人:无*** 文档编号:128959125 上传时间:2022-08-02 格式:DOC 页数:18 大小:1.11MB
收藏 版权申诉 举报 下载
基于SIFT算子的车标识别实验报告_第1页
第1页 / 共18页
基于SIFT算子的车标识别实验报告_第2页
第2页 / 共18页
基于SIFT算子的车标识别实验报告_第3页
第3页 / 共18页
资源描述:

《基于SIFT算子的车标识别实验报告》由会员分享,可在线阅读,更多相关《基于SIFT算子的车标识别实验报告(18页珍藏版)》请在装配图网上搜索。

1、基于sift算子的车标识别软件小组成员:小组编号:专业班级:指导老师:日期时间:第一部分 绪论1.1研究目的与意义随着中国经济进入高速发展模式,人们物质文化水平也跟着大幅度的提高,人们对汽车的需求量也日益增大。面对着汽车数量越来越多的问题,如何对这些车辆进行有效的管理成为社会首要关注的问题。车标是车辆的一个重要的特征属性,相对于车辆其他的一些特征信息(譬如车牌),车标具有不易更改的特点。基于这一非常重要特性,本文将对车标的识别进行研究。 本文主要分为两大核心部分,定位部分(包括车牌的定位和车标的定位)和车标特征向量提取和识别部分。本文车标的定位是根据车牌和车标的先验知识,提出一种由粗到精的车标

2、定位方法。首先通过成熟的车牌定位方法对车牌进行定位,再根据车牌与车标的相对位置可以估计出车标的大概区域;接着利用 SOBLE 边缘检测算子对车标估计区域同时进行垂直边缘的检测和水平边缘的检测,分割车标区域与背景区域;接着再利用数学形态学进行腐蚀膨胀处理得到车标的精确区域。车标特征向量的提取本文利用 SIFT 算子进行提取。SIFT 算子的主要优点是信息量丰富,独特性好,适合在海量数据中进行快速、准确的匹配。另外 SIFT 算子的特征属性是图像的局部特征,具有对图像的尺度缩放、亮度变化、旋转保持不变性;对视角的变化、放射变换、噪声等等都保持很高的稳定性。除此之外,SIFT 算子也具备多量性和可扩

3、展性,少数的物体也可以产生较多的特征点,也可以很方便与其他形式的特征向量进行联合。所以本文通过 SIFT 算子对车标进行特征提取和特征向量的生成,最后通过欧式距离判断待匹配的车标向量与模板库的车标向量的相似性,最终达到识别出车标的作用。 如果将车标识别技术应用到现代车辆犯罪侦查中,将会大大减少对犯罪车辆的搜寻范围和相关部门的工作量,提高车辆识别的可靠性。车标识别技术可以应用在很多领域,比如公路收费、车辆管理、公路布控等等。因此开发一种能够识别出车标的技术在当今社会显得极为必要。 1.2主要研究内容与相关理论介绍 本文研究的主要内容可以分为三个模块: (1)车牌的定位模块。本文的第一部分是车牌的

4、定位。车牌的定位是否准确关系着车标的定位是否准确,所以车牌的定位非常关键。本文采用基于 HSV 颜色模型的方法定位,根据中国车牌只有三种颜色黄色、蓝色和白色,通过判断 HSV 各个通道的值确定车牌的区域。 (2)车标的定位模块。车标的定位总共分为两部分,车标的粗定位和车标的精定位。车标的粗定位是根据车标与车牌的相对位置这一先验知识得出的。然后对车标的估计区域进行车标的边缘检测,分离车标与背景,最后通过形态学滤波作用,精确定位出车标的位置。 (3)车标特征向量的提取和识别模块。车标特征的提取和特征向量的生成是本文的关键部分。在车标精定位之后,对车标区域利用 SIFT 算子进行特征提取。提取过程大

5、致可以分为:尺度空间的构建,极值点的检测,关键点的确定,关键点的描述。最后采用欧式距离判断向量的相似性,识别车标类别。 第二部分 车牌定位车标定位越准,框的越精确,噪声就越小,干扰就越小,提取的特征越能体现车标的属性,识别的准确率当然越高。所以选择一个合适的车牌定位方法非常重要。根据应用场地的需要和采集的数据集的特征,将采用基于 HSV 颜色空间和灰度形态学的方法对车牌进行定位。首先,通过车牌颜色定位算法简单,实现起来比较容易。其次车牌的底色目前中国只有黄、蓝、白三种底色,很容易通过车牌的颜色区分车牌与车身。具体定位算法步骤如下: 1.将 RGB 颜色空间图像转换为 HSV 颜色空间模型。 2

6、.设定 HSV 各个通道阈值。 3.通过阈值灰度化图像。 4.通过开闭运算整合连通区域。 5.通过颜色特征搜索候选区域。 6.通过特征值和车牌几何特征确定车牌区域。 车牌定位流程图如 3-1所示:颜色空间模型转换阈值设定二值化图像数学形态腐蚀膨胀处理通过车牌的几何特征判断车牌区域图 3-1 车牌定位流程图 3.1 确定车牌颜色在 HSV 空间的阈值 每一种颜色的车牌需要进行采样估计,以确定每一种颜色在 HSV 空间的阈值。因为中国不同地方的车牌颜色不一样,各个亮度、饱和度、色调都不相同。另一个原因车牌颜色会随着时间的流逝而退化,每一类车牌颜色的各个 HSV 通道值是一个范围,而不是一个精确地数

7、值。所以为了更准确的定位好每一类的车牌,需要对每一类车牌进行大量的抽样统计分析。 同样,通过类似的方法可以得到其他颜色车牌各个分量的阈值范围,最终得出三种车牌的颜色的阈值范围。 黄色 蓝色 白色 H 187,245 25,56 不考虑S 0.33,1 0.35,1 0,0.16V 0.32,1 0,3,1 0.89,1本实验采用的数据是通过手工截取每一张车辆车牌区域的图像,并且按照颜色类型以不同文件夹存储好,方便确定车牌颜色阈值使用。 通过大量的实验表明,蓝色车牌、黄色车牌从背景的分离可以通过已经确定的好的 H和 S 分量阈值,通过 V的分量把黑色和白色车牌区域从背景中分离出来。 3.2 搜索

8、候选区域,判断车牌区域 二值图像经过数学形态学滤波之后会出现多个候选区域,如图 3-2所示。这时必须根据车牌的一些固有特征进行判断筛选,譬如可以根据车牌的长度、宽度、以及长宽之比进行判断,也可以根据车牌的面积进行判断。因为摄像机安装在一个固定的位置下(一般卡口摄像机的位置都是固定不变的),拍摄出来的车辆照片宽度、长度以及两者之间的比例在一个范围之内。 图 3-2车牌候选区域 根据中国车牌的特性,中国汽车车牌外部特征大概有以下几个特点: 1.几何特征:车牌长度、宽度以及长宽的比例在一定的范围之内; 2.形状特征:车牌的形状都是矩形; 3.灰度特征:车牌的水平直线灰度呈现连续的波峰、波谷、波峰的分

9、布; 4.灰度值统计特征:车牌的边缘直方图有两个分离的分布中心; 通过上述的几种特征取交集,就可以很快的缩小范围,判断车牌区域时,根据长度、宽度、长宽之比以及面积可以判别,判别条件如下: Width(min)WidthWidth(max) ; Height(min)HeightHeight(max); Area(min)AreaArea(max); Ratio(min)RatioRatio(max); 其中,Width 表示车牌的宽度,Height 表示车牌的高度,Area 表示车牌的面积,Ratio 表示车牌的长宽之比。min 和 max 表示车牌的宽度、高度、面积和长宽之比的最小值和最大值

10、。通过上述条件判别,可得到车牌的区域,如图 3-3所示: 图 3-3 车牌区域 为了进一步优化车牌判断效率,提高软件性能,减少运行时间,可以根据这一地区出入的车辆的车牌颜色概率高低依次进行判断,比如,经统计某个地方出现蓝色车牌的车辆概率最多,这时就可以先判断是否为蓝色车牌,然后再判断是黄色还是白色车牌,这样在一定的先验条件下可以提高车牌定位的效率,减少搜索目标区域时间。 第三章 基于车牌定位先验知识的车标定位 4.1 一种由粗到精的车标定位方法 车标定位是车标识别的重要环节,也是车标识别是否准确的关键所在。目前车标定位有很多种定位方法,但是基于车标的大小在整个车辆图像所占的比例之少,以及车标边

11、缘与复杂纹理背景之间的关系,本文采用一种由粗到精的车标定位方法。车标定位流程图如 4-1所示: 程序开始通过车牌的位置粗略估计车标的位置对车标粗略区域进行滤波处理利用 SOBEL 算子进行车标边缘检测 去除干扰噪声 数学形态学运算,精定位车标位置 程序结束 图 4-1车标定位流程图 由于车标相对于整个车身而言太小,如果通过整幅图像搜索车标区域,会导致整个车标识别系统的速度下降,性能降低。因此本文通过车牌与车标的相对位置,搜索车标的区域,缩小搜索车标的时间,为整个车标识别系统减小了时间,提高了整个系统的性能。 4.2 基于车牌定位先验知识的车标粗定位 4.2.1 车标的特征 根据目前中国市场上车

12、辆统计,经过大量实验观察,有几乎接近 100%的车辆的车牌是悬挂在车身的正后方和正前方,如图 4-2所示: 图 4-2 车牌与车标相对位置图 但是车标本身的一些特点使得车标的定位比车牌定位要难很多。主要体现在以下几个方面: 1. 车标形状各异。车标的定制式由汽车厂商自行决定的,既有圆形的又有椭圆的,既有方形的也有一些特殊形状的,譬如字符的。 2.车标相似性大。很多车标都很相似,譬如北京现代与日本本田 3.车标的位置没有统一的标准。车标的具体位置并非一成不变的。有些车标在车灯之间,有些车标在车身上,有的车标在散热片上。即使是同一品牌不同系列的车标也不尽相同。4.车标所在散热片的纹理具备多样性。大

13、部分的车标都是在车辆散热片上,不同类型的车辆纹理也不一样。纹理本身也具有丰富的边缘特性,这对于分割车标和散热片有很大的不利。 4.2.2 车标的粗定位 车标中心确定:由图 4-2可以看出,车牌和车标处于同一中轴线上,根据车牌与车标的相对位置,可以粗略的估计出车标的位置,如图 4-3所示。假设根据已知条件得知车牌的中心点的坐标为( x , y ),那么x = x ,y = y + h,其中( x , y )为车标的中心点位置,h 是根据大量数据得到的一个经验估计值,大约为 150 个像素点的长度,也就是车标的中心离车牌中心的估计高度。根据大量实验可以得出车标的左右上下边界与车标中心满足关系如下:

14、图 4-3 车标粗定位 4.3 基于 SOBLE 算子的车标边缘检测 在目前的目标定位技术中,模板匹配技术和特征匹配技术占主导地位,这两种技术可以应用在目标种类单一的定位中。而在车标识别技术中,车标的种类繁多,况且尺寸的大小也参差不齐,同时有的车标所在的区域纹理特征丰富,基于这样一些特点,单纯的采用模板匹配不太合适。本文采取 SOBLE 算子的边缘检测算子的方法检测车标的边缘。实际上,SOBLE 算子是一种离散的差分算子,通过图像亮度函数运算,得到灰度变化的近似值,SOBLE 算子在复杂边缘检测中应用的比较多。SOBLE 算子包括一个纵向和一个横向 3*3的卷积因子,两个卷积因子如下: 垂直卷

15、积因子 水平卷积因子 将纵向卷积因子和图像作平面卷积,水平卷积因子和图像作平面卷积,可得到图像的纵向亮度差值和横向亮度差值。假设 A 是原始目标图像,Gx 、Gy 分别为横向和纵向的边缘检测图像灰度差值,检测公式如下: (4-3) 将卷积模板因子与原始图像每一个像素点的灰度值相乘,得到该点的灰度,如果该点灰度满足极值条件,就认为该点为边缘点。边缘检测效果如图 4-4所示: 图 4-4 SOBLE算子边缘检测车标 车标的背景可以大致分为两种,一种光滑的车面,另一种就是散热片。SOBLE 算子在检测水平边缘的同时也检测垂直的边缘响应。SOBLE 算子根据像素的上下邻域像素点,左右邻域像素点灰度的加

16、权,当边缘达到极值时实现检测,对噪声有一定的平滑作用,得到比较准确的边缘方向信息,缺点是边缘定位度不够精准,但是这一缺陷并不影响车标的识别。因为 SIFT 算子对这方面要求不是很高,所有说,SOBLE 和SIFT 算子结合是一个完美的结合,能够在识别准确率和算法性能上都有着不错的效果。 4.4 对车标区域进行形态学滤波处理 在通过 SOBLE 边缘检测车标边缘后,仍然会有很多噪声存在,普通的滤波的方法可以很好的抑制一些噪声,但是对于一些存在裂缝的连通区域无法进行整合,特别是对于具有字符的联通区域,很容易出现裂缝,出现许多小的连通区域,这种情况下很可能丢失车标许多有用的信息,使得车标定位不准。这

17、时为了更精确地框出车标,同样和车牌定位一样,需要进一步对车标区域进行数学形态学滤波处理。 利用形态学可以修补裂缝,有效的消除噪声干扰,同时可以把几个小的连通区域整合成一个大的连通区域,加强车牌的特征信息。 假设 A,B 为两幅图像,A 为 3*3 的结构元素,B 为车标图像即处理对象。用 A 结构元素的每一个像素点去扫描 B(车标图像)的每一个像素点,然后与 A 覆盖 B 中的每一个像素点进行与操作,如果都为 1,则结果图像的像素为 1,否则为 0。最终的目的和效果是消除车标周围一些孤立的噪声点。同理,用 A 的每一个像素与 B 中的每一像素进行或运算就可以对内部进行填充了,处理的效果是使得图

18、像车标的内部和边缘像素进行连通,加强车标的几何特征。根据实际的情况可以对处理的对象进行开运算和闭运算。开运算是先进行腐蚀后进行膨胀,闭运算刚好相反,先膨胀后腐蚀,开运算和闭运算是一对偶运算。 形态学滤波器的性能由结构元素矩阵中的元素决定。基于软件的实际应用情况和图像数据的分辨率,本文的结构元素采用 3*3 的矩阵。用 3*3 的结构元素的探针去扫描车标区域,与车标区域进行膨胀、腐蚀、开运算、闭运算得到最终的目标前景图,最后处理的大众和现代车标效果图如图 4-5所示。 图 4-5 车标精定位 4.5 车标定位实验结果与分析 本论文实验数据采用 9 种品牌的车辆图像,总共 1142 张,在车牌定位

19、准确的基础上,能够准确的定位出车标的位置有 98%,其中有几张是因为纹理背景为网格,且图像光照条件不足,模糊不清导致定位不准。 在车标定位的过程中,采用的是一种由粗到精的定位,在粗定位的过程中,是根据车牌和车标的相对位置给出的。但是不同车辆的车牌和车标位置是不同的,有少数车辆的车标与车牌的位置过大,有些车标和车牌的位置过小,导致在车标粗定位的过程中,有的区域过大,有的又没被包含进去,导致最终的车标定位不准。 第四章 基于 SIFT算子的车标匹配识别 5.1 SIFT 算子简要介绍 SIFT 即尺度不变特征转换(Scale-invariant feature transform),是一种用于描述

20、图像邻域的局部算子,在图像中可以检测出图像的极值点。SIFT算子是由 David Lowe 在1999 年提出的,在 2004 年加以完善。本文的研究之所以选取 SIFT 算子作为特征向量的提取方法,是因为相比于其他特征算子,SIFT算子具有以下几个非常显著的特点: 首先,信息量丰富,独特性好,能够准确、快速的在大量的数据库中进行匹配; 其次,对亮度的变化、尺度的缩放以及旋转可保持不变性;对仿射变换、变化的视角、噪声也可以保持相对高的稳定性; 再次,SIFT 算子本身具有多量性,哪怕是少数的几个物体也可以产生较多的特征点; 最后,SIFT 算子本身具备可扩展性,通过 SIFT 算子生成的特征向

21、量可以很方便的与其他形式的特征向量进行联合; 经过大规模重复实验,SIFT 算子应用在车标特征提取中能够取得非常稳定的特征点,最后识别的效果很好。 5.2 特征向量提取 在车标精确定位之后,利用 SIFT算子对整个车标精确区域进行特征提取,特征提取包括极值点检测、关键点的确定、关键点的描述。特征提取之后再进行特征的匹配识别,通过欧氏距离判断特征向量与数据库中特征向量的相似性。整个车标特征向量的生成和相似性判断过程如图 5-1所示: 图 5-1 车标匹配识别流程图 5.2.1 构建尺度空间 为了保持特征点不随尺度变化而变化,通过高斯函数构建空间尺度金字塔。高斯金字塔主要特点是用分层结构区分尺度,

22、每一个 表示一个空间尺度,也就是一层,每一层有很多组,每一组是用原始图像和高斯函数卷积相乘得到。 尺度空间理论的基本思想:在图像处理模型中,引入一个与尺度空间相关的参数,通过连续改变这个相关参数便可以获得很多个空间尺度的图像序列。SIFT 算子通过高斯模糊函数构建尺度空间,然后在不同尺度空间上检测极值点,只有那些在各个尺度空间都为极值点的最后才确定为关键点,最终可得到关键点的位置和尺度。能实现尺度变换的线性核仅有高斯卷积。 尺度空间的构建:定义 L ( x , y , )为图像尺度空间函数,高斯函数 G ( x , y , )为尺度变化函数,尺度变化函数 G ( x , y , )与原图像 I

23、 ( x , y )进行卷积得到尺度空间函数即: (5-1)其中: (5-2) 其中卷积运算用*表示。高斯模板维度用 m ,n 分别表示, 则代表尺度空间因子, 值越小,图像被平滑的程度就相对较少, 越大,图像的梯度越陡峭,越能够反映图像的全局特征。图像的概貌特征是通过大尺度反映的,图像的细节部分则通过小尺度传达。在实际应用中,通过高斯函数进行离散计算近值时,对于那些大于 3 距离的像素点被认为是无效的,这些像素点可以被忽略为无效点。 5.2.2 检测空间极值点,确定关键点 SIFT 算法主要分为两步:第一,在尺度空间进行极值点的检测,并确定关键点以及关键点的位置和所处尺度;第二,以关键点为中

24、心点,计算中心点邻域的梯度方向,统计所有方向值确定主方向,把该方向作为中心点的方向。 经过翻阅大量文献,高斯拉普拉斯函数的极大值和极小值能够产生稳定的图像特征。高斯差分函数(Difference of Gaussian)简称 DOG 算子,与尺度归一化的函数非常相似,可以使用高斯差分金字塔来近似 LOG 算子,推断步骤如下: (5-3)利用差分近似代替微分 , 2 (5-4)所以有 (5-5)k-1 是个常数,不影响极值点的位置。Tony Lindeberg 认为只有尺度规范化的 LOG 算子才具有真正意义上的尺度不变性,但是 Low 则认为,可以使用高斯差分金字塔来近似LOG 算子,这样可减

25、少规范化所消耗的时间。本文的尺度空间模型使用高斯金字塔表示,用于在尺度空间检测极值点,确定关键点,有利于提高时间性能。 在具体的工程应用中,在高斯金字塔中,对每一组中相邻的两幅图像进行差值,得到高斯差分图像,检测公式: (5-6)本文高斯金字塔是尺度空间的描述,采用近似方法检测极值点,通过高斯金字塔差分模拟 LOG算子,检测尺度空间极值点。特征点选取都是从梯度极值点中选取,为了筛选出在不同尺度上都表现为极值点的点,也就是关键点,需要对尺度极值点再一步筛选,极值点筛选的两个标准是梯度值和梯度方向,把那些满足梯度值范围和方向值范围的极值点筛选为关键点。 关键点检测:关键点是 DOG 空间的局部空间

26、极值点,为了得到 DOG 空间关键点,DOG 空间的每一个像素点都要和这个像素点所在尺度平面领域像素点相比较,也要和他相邻尺度的对应领域区域相比较,也就是说一个像素点要和它所在尺度的 8 个领域相比较,也要和它上下相邻的两个层次对应的 9 个像素点比较,这样就可以确保像素点在所在尺度空间以及原始图像空间都能检测到极值点。 经过上述检测,得到离散空间的极值点,接着可以通过拟合三维二次函数得到更加精确的关键点的位置和尺度,同时也去除了低对比度的关键点和不稳定的边缘的相应点,由此一来增强了匹配的稳定性和抗噪声能力。 5.2.3 特征向量的生成 当这些关键点被检测出来之后,为了得到特征向量,必须赋予每

27、个关键点一个描述符,也就是用一组向量描述这个关键点。这个描述符号不能随着光照、视角变化而变化,所以这个关键点的描述子不仅仅包括关键点的基本信息,而且应该还包括周围那些对关键点有贡献的像素点。按照 LOWE 的思想,以关键点为中心,取尺度空间内4 乘以 4 的窗口中计算 8 个方向的梯度信息,这样每一个关键点就被描述成 128 维的特征向量了。为了使生成的特征向量具有旋转不变性,就要为关键点分配方向值,本文使用图像梯度法求取关键点的稳定方向,对于在金字塔检测出来的关键点,梯度的模值和方向值检测公式如下: 2 2 (5-7)其中 L 代表关键点所在的尺度空间值,使用直方图统计梯度模值和方向。如图

28、5-2所示,箭头的方向代表梯度方向,箭头的长短代表梯度的大小。梯度方向总共 360 度,分为 36个柱,每一柱表示 10度,方向的统计峰值代表了关键点的主方向。 通过以上几个步骤,对于每一个关键点都有三个基本信息:尺度、位置、以及梯度方向。为了使生成的特征向量不随视角的变化、光照条件的变化而变化,需对关键点进行以下处理,具体步骤如下: 1.为了保持增强特征匹配的鲁棒性,只保留峰值大于主方向值的 80%的方向作为关键点方向的辅助方向。 2.为了保持旋转不变性,以关键点的方向为基准方向,旋转坐标轴的方向使之与基准方向一致,这样就可以确保旋转不变性。 3.为了提取的特征向量不随光照、视角变化而变换,

29、则需要对特征向量进行归一化处理。 SIFT 算子提取的是车标的局部特征,局部特征不同于全局特征。局部特征表现的区域只会在一些特殊的地方才会出现,例如一些边缘线、角点、梯度极值点等等,这些都是典型的局部特征。物体没有被没完全遮挡,局部特征依然稳定的存在,如果整幅图像或者感兴趣的区域被这些局部点描述,这样就会大大的减少原有携带的信息量,减少计算量。 5.3 特征向量的匹配识别 在关键点被量化之后,需对向量进行相似判断。判断过程:在特征数据库中搜索特征点的匹配点,通过匹配建立目标图像与数据库中图像的转换关系,从而完成图像的匹配识别。 在目前识别研究这块领域,判断物体的相似性都是通过判断向量的相似程度

30、来计算目标和模板之间的相似度的。目前判断向量的相似性主要有曼哈顿距离、马氏距离、欧氏距离、夹角余弦、汉明距离、相关系数和信息熵等等。本文采用欧式距离判断特征向量的相似性。 本文通过欧氏距离判断待匹配的图像与数据库中图像特征向量的相似度,欧氏距离是最常见的一种向量相似性度量,距离越远,说明个体间的差异越大,越小说明相似度越高。匹配公式如下: (5-9) 但是仅仅通过单一的欧氏距离判断特征向量的相似性会存在很多的错误匹配对,错误匹配的特征点的存在会严重影响所取的仿射变换参数,从而影响最终图像的匹配精确性。因此,本文的匹配识别分别两个部分: 首先,利用邻域搜索算法搜索关键点的相似邻点,通过欧氏距离判

31、断计算距离关键点最近的两个邻点,通过阈值方法确定初始匹配对。 然后,利用 RANSAC 算法对初始匹配对进行提纯消杂,消除误匹配的特征对。整个特征点匹配的具体步骤如下: 1)利用 BBF 算法高效快速的搜索数据库中和关键点距离最近的两个特征点,最近点为 A,次近点为 B。 2)利用欧氏距离计算两个最近点到参考关键点的欧氏距离。假设从 1)得出最近点 A 和次近点 B,分别对应特征向量 X,Y。利用(5-9)欧氏距离公式计算 X,Y 到关键点的欧氏距离,分别记作 D1 和 D2,用最近点的欧氏距离除以次近点的欧氏距离得出一个比值,即D=D1/D2。当 D 小于阈值(本文取 0.5)时,则最近点

32、A 为特征点候选匹配点。当 D大于 0.5时,那么匹配不成功,舍弃最近点。 3)以不同的特征点为参考点,重复上述两个步骤,得到 N 组候选特征匹配对。 由于初始的匹配对有时候存在严重的错误,为了减少误匹配率,提高车标的匹配精确性,所以接下来用 RANSAC 算法对候选特征对进行再一步筛选,筛选出正确的匹配对,提高匹配精确性和准确性。 1)从得到的初始特征匹配对中随机抽取 3 对匹配对作为内点集合,计算出变换矩阵 H; 2)将集合外的 N-3 个特征点设为外点,依次计算出 N-3 个外点在线性变换矩阵后得到的匹配距离; 3)设定距离阈值,(本文取 0.5),将小于 0.5 的特征点归纳为内点集合

33、,将距离大于 0.5的特征点集合舍弃; 4)统计在变换矩阵 H 下的内点数量; 5)重复执行以上步骤多次,重新计算变换矩阵 H,统计新 H 下的内点数量; 6)选取内点数量最多的集合作为最佳集合,集合下的所有特征点都为精确的匹配点; 经过以上步骤,整个车标识别过程处理完毕,得出的特征点数量最多的车标类型为最终识别类型。匹配效果如图 5-4所示: 图 5-2车标特征点匹配 第五章 车标识别软件的实现 车标识别软件的硬件环境是在 Intel(R) Core(TM)2 CPU E7500 主频 2.93GHz 4G内存环境下进行的。软件环境为 windows7 系统,64 位操作系统。所用的图像数据

34、由公司提供,实际图片为摄像机抓怕的静态图片。 6.1 软件结构分析 本软件采用模块化的思想进行设计,这样做的目的主要有两个:第一便于以后维护;第二便于进一步改善和二次开发。车标识别软件的系统结构图如下图所示: 图 6-1 系统结构图 整个软件结构以模块的方式进行开发,总共为三个模块:车牌定位模块、车标定位模块和车标识别模块。模块介绍:1)车牌定位模块;车牌定位模块是整个软件架构中的首要处理模块;车牌的定位准确与否关系着后面的车标定位是否准确,所以车牌定位是模块中重要的一个部分。根据提供的图像数据以及性能要求,本文采用基于颜色特征定位车牌的位置,主要包括颜色空间的转换,颜色阈值的确定,以及对候选

35、车牌区域的处理三个部分。采取颜色特征定位车牌的算法简单,定位也很准确,能够满足实时和精确度的要求。2)车标定位模块;车标的定位是根据车牌的位置确定的,因为根据中国车牌悬挂的位置可以看出,车标与车牌是在同一中轴线上,在确定车牌的位置之后可以大概的估计出车标的位置。这样做可以为车标的边缘检测节省时间,不需要搜索整张图像了,也消除了不必要的干扰,提高车标位置的精确度。而车标的精确定位则利用算子进行垂直和水平的边缘检测,通过数学形态学可以得出车标的精确区域;3)车标识别模块;车标识别模块是三个模块之中最关键的部分,本文采用SIFT 算子对车标极值点检测,特征点筛选以及特征向量的生成,SIFT 算子能够

36、产生稳定的极值点,筛选出来的特征点不随外界条件的变化而变化,具备很强的鲁棒性和健壮性。特征向量的相似性判断则采取欧氏距离判断,通过欧氏距离的计算判断有可能产生误匹配特征对,为了减少误匹配率,在通过欧氏距离筛选出候选匹配对之后,利用 RANSAC 算法对候选匹配对进行再一次的筛选,这样可以提高车标的匹配准确性。以模块的形式部署软件的结构可以带来以下好处: 1)可以很清楚的看到每一个模块的效果,可以分别看到车牌定位、车标定位以及车标识别的定位准确率和识别率。 2)更加利于整个系统的分析。有时候最终的结果识别不准,也许并不是提取的特征向量不多或者匹配算法不准确,而是有可能是在车标定位的过程当中出现了

37、问题,例如截取的车标区域过小,包含的车标区域不能很好的反应整个车标的特征。而车标的定位不准确也有可能是由于车牌定位不准造成的。基于这种情况,所以采用模块化的结构进行软件部署,这样可以很好的发现每个模块的问题,便于以后的优化和改进。 3)采用模块的思想部署软件结构,可以根据以后的具体的实际应用需求,与其他的应用程序进行无缝拼接,实现多层次利用。 6.2 软件主要功能与用户界面 考虑到软件投入商业使用,车辆数据流大,为了方便工作人员查看,所以用户界面做的比较简单整洁。此软件目前是用于离散运行,即在没有连接互联网的本地服务器上就可以稳定运行。本软件采用的数据集以文件夹的形式存放在本地磁盘上。数据分为

38、白天的拍摄的图像和晚上拍摄的图像,存放在不同的文件夹内,方便统计测试结果数据的准确率。另外不同类型的车辆已人工分类好存储在不同的文件夹,方便分析那些未能成功识别的图像样本。 数据集中还包括手工切割的车标图像,已经分好类,用于车标特征向量的提取学习训练,获得车标特征向量总体特征,最终是为了得到车标特征向量相似系数的阈值。 软件界面主要分为两个大的部分。第一部分选择图像和图像文件夹,也就是待匹配的数据。打开图片选项一次只能选择一张测试图片,而打开文件夹选项一次可选择一个文件夹,一张图片测试完之后可以点击下一张进行测试,更加方便用户测试。另一部分为最后识别的部分。当选择好测试图像之后,点击识别,软件

39、进入到工作状态,识别的结果会在输出框中显示出来。当识别完所有的测试图像之后可以点击统计结果,查看车标的识别准确率和错误率,都可以在下面的输出框中很清楚的显示出来。功能界面初始化图 6-2所示: 图 6-2 界面初始图 选择数据文件夹;车辆类型已经人工分好类,每一种类型的车辆存储在不同的文件夹中,本文总共有 1142 张静态图片,分为起亚、比亚迪、雪佛兰、现代、别克等 9种品牌,可以根据每一类车标的测试结果的准确性高低选择要测试的车标类型,重新进行多次的测试,这样可以有针对性的对数据集进行测试,发现每一类车辆的匹配情况所存在的问题。 图 6-3 数据选择 点击确定之后,文件夹包含的马自达的所有车

40、辆就可以被测试识别了,整个文件夹的数据包含在内,测试完之后可以点击下一张,进行下一张的判断,这样可以很方便的判断一类车的类别。 下图为程序运行效果画面。 图 6-4 图像匹配 第六章 车标识别软件的实现 从上图 6-4可以看出,在输出框中可以看到识别结果为马自达,找到 4四处匹配特征向量,识别时间为 1872.48 毫秒。由于阈值的关系,找到的特征向量数过少,导致识别结果错误。出现这种情况可以通过人工再次确认识别结果是否正确,当点击“否”按钮之后,错误匹配的车辆数会增加,点击“是”按钮,正确匹配的车辆数会增加点击统计结果可以查看整个文件夹的匹配情况,正确匹配的车标多少张,错误匹配的车标多少张都

41、可以在输出框中显示出来。 根据识别的结果情况点击“是”按钮或者“否”按钮,统计车标的识别结果总体情况,将统计的结果保存在特定的文件夹中,方便结果查询和错误匹配的车辆进行分析。第六部分 总结通过这次做课程设计对图像与视频处理课程中所学习的知识有了进一步了解和认识。在整个课程设计整个过程中,我们遇到了不少的困难,但庆幸在老师同学的帮助下,同时也是小组成员不断努力的结果,我们小组终于完成了本次课程设计,虽然在课堂上老师也介绍了不少的知识,但是在实际应用的时候还是无从下手,感觉自己的知识水平不够,又查阅了不少的资料,给自己充电。后来在同学们的齐心协力下,终于完成了本次实验。在设计过程中,我们通过查阅大量有关资料,与同学交流经验和自学,并向老师请教等方式,使自己学到了不少知识,也经历了不少艰辛,但收获同样巨大。在整个设计中我懂得了许多东西,也培养了我独立工作的能力,树立了对自己工作能力的信心,相信会对今后的学习工作生活有非常重要的影响。而且大大提高了动手的能力,使我充分体会到了在创造过程中探索的艰难和成功时的喜悦。虽然这个设计做的也不太好,但是在设计过程中所学到的东西是这次课程设计的最大收获和财富,使我终身受益。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!