毕业设计论文基于聚类的智能图像分析算法

上传人:沈*** 文档编号:144301815 上传时间:2022-08-27 格式:DOC 页数:57 大小:1.45MB
收藏 版权申诉 举报 下载
毕业设计论文基于聚类的智能图像分析算法_第1页
第1页 / 共57页
毕业设计论文基于聚类的智能图像分析算法_第2页
第2页 / 共57页
毕业设计论文基于聚类的智能图像分析算法_第3页
第3页 / 共57页
资源描述:

《毕业设计论文基于聚类的智能图像分析算法》由会员分享,可在线阅读,更多相关《毕业设计论文基于聚类的智能图像分析算法(57页珍藏版)》请在装配图网上搜索。

1、基于聚类的智能图像分析算法摘要智能图像处理技术在众多领域得到了广泛应用。在具有监控、报警等功能的安防系统中,在自然基因显微系统中,在模式识别系统中等,智能图像处理技术都起到了不可小觑的作用。目前基于内容的智能图像识别与分类技术在准确性具体应用方面还面临着许多难题。本文通过介绍智能图像分析方法及相关算法理论,重点研究以SVM算法为代表的监督分类算法及以k-means聚类算法为代表的费监督分类算法,并结合Hu图像矩不变特征,对图像进行聚类分析及分类。在理论学习的基础上,运用MatLab实现算法并验证应用效果。有监督分类方面,本文采用了提取能够较好的保持图像的边缘、形状等特性的Hu矩不变特征作为训练

2、特征,分类方法采用了基于聚类的SVM算法。在提取出训练样本的特征值后,将其输入SVM的训练网络进行训练。最后将待分类图片输入即可得到分类结果。本文计算出了该非监督分类方式分类结果的准确性,并对其进行了分析与讨论。无监督分类方面,本文采用了k-means分类方法。预先设定好分类的类别数后,输入待分类图片,则系统通过调用分类函数,将自动分类的结果输出。在算法研究的基础上,设计并实现了水果图像智能分析应用系统,具有创建特征值数据库、创建训练网络、图像有监督分类和图像无监督分类等功能。当进行图像有监督分类,即SVM算发分类时,准确率可达到将近70%。关键词 SVM k-means图像分类Intelli

3、gentImage AnalysisBased on ClusteringAlgorithmABSTRACTIntelligent image processing technology has been widely applied in many fields. In monitoring and alarm security system, in natural gene microscope, and in the middle pattern recognition system, intelligent image processing technology has played

4、highly important role.Currently content-based image recognition and classification of intelligent technology are facing many problems in specific application for accuracy. This paper will describes intelligent image analysis method and algorithm theory, meanwhile combines with the same characteristi

5、cs of HU image moments, and focuses on the SVM algorithm for classification and supervision of representatives of the costs of supervised classification algorithms. In the theoretical study, verify the application of results based on the use of MatLab algorithm.In the phase of supervising classifica

6、tion, this paper used Hu moments invariant feature as a training feature that can keep the extracted image edge, shape and other characteristics using SVM-based clustering algorithm. After extracting samples characteristic value, put into SVMs training network to have training. Finally the input ima

7、ge can be classified by the classification results. This paper concludes the approach to the classification of non-supervised classification accuracy of the results meanwhile analyzes and discusses the accuracy.This paper used K-menas classification method in the field of unsupervised classification

8、. After pre-configuring data, put into classified image, and then by calling the classification function, the system will output the results of automatic classification.Based on algorithm, design and implementation of fruit intelligent image analysis application system with a characteristic value da

9、tabase, training network, image supervised classification and image unsupervised classification features. When the image has supervised classification, the SVM classification count classification, the accuracy rate can reach nearly 70%.KEY WORDS SVM k-means Image classification35目录第一章 绪论11.1智能图像分析概述

10、11.1.1课题背景11.1.2国内外研究现状21.2聚类分析31.3课题目标及本文研究内容31.3.1预期目标31.3.2主要研究内容31.3.3系统方案41.3.4本文的结构4第二章 技术基础52.1图像特征52.2图像分类方法52.2.1图像分类概念52.2.2图像分类原理62.2.3图像分类方法62.3MatLab及图像智能处理工具箱7第三章 图像矩不变特征提取93.1图像矩不变特征介绍113.2图像矩不变特征提取12第四章 分类算法144.1SVM分类算法144.2k-means分类算法16第五章 基于MatLab的图像分析软件实现195.1软件功能及系统流程195.2关键函数详述1

11、95.2.1图像灰度化195.2.2图像平滑与图像锐化205.2.2.1中值滤波205.2.2.2图像锐化215.2.3Hu矩不变特征值215.2.4SVM神经网络的建立和训练225.2.5k-means分类函数24第六章 系统测试266.1系统界面266.2功能测试及统计306.2.1训练样本306.2.2结果与分析30第七章 结论与展望337.1结果与结论337.2问题与展望337.3心得体会33参考文献35致 谢36北京邮电大学本科毕业设计(论文)第一章 绪论1.1 智能图像分析概述随着我国人民生活水平的提高,数码相机、DV机等摄影器材得到了极大范围的普及,数字图像的数量也在飞速增长,同

12、时,互联网的普及使得人们对于图像检索的需求大大增加。近年来,为了满足人们日益增长的生活、学习、工作、娱乐等各方面的需要,数字图书馆中储存了数以万计的图像。图像处理技术从一开始就是一个基于线性代数、统计理论和物理学之上,具有很强理论背景的研究领域,它需要广泛的基础知识,包括计算机科学、数字信号处理、随机过程和统计数学、矩阵分析、信息论、控制论和最优化理论等。同时,图像处理又是一门与应用紧密结合的学科,应用领域涉及计算机视觉、地理、气象、航空航天、医疗保健、刑事侦查等。1.1.1 课题背景在20世纪初,运用机器来处理图片是一件非常困难的事。但随着计算机硬件、图像获取设备、显示设备的不断改进和各种高

13、性能能工作站的出现,图像处理技术迅猛发展。而信息时代的到来,又无疑使图像处理技术进入了一个更加蓬勃发展的阶段,特别是以多媒体技术、通信技术、信息存储技术和以Internet为代表的计算机网络技术的加速发展以及高清晰度电视的深入应用研究,图像处理技术研究和应用前景更为广阔。数字图像处理所涉及的知识非常广泛,具体的研究方法种类繁多。传统的图像处理技术主要集中在图像的获取、变换、增强、恢复(还原)、压缩编码、分割与边缘提取等方面,并且随着新工具、新方法的不断出现,这些图像处理技术也一直在更新与发展。近十多年来,随着信息技术的发展,图像特征分析、图像配准、图像融合、图像分类、图像识别、基于内容的图像检

14、索与图像数字水印等领域取得长足的进展。这些图像处理技术反映了人类的智力活动,它在计算机上模仿、延伸和扩展了人的智能,具有智能化处理功能,因而称之为智能图像处理技术。其中最具代表性的是图像分类技术以及基于内容的图像检索。图像分类就是利用计算机对图像进行定量分析,把图像中的每个像元或区域划归为若干个类别中的一种,以代替人的视觉判读。图像分类的过程就是模式识别的过程,是目视判读的延伸和发展。图像分类主要用于遥感、医学与军事等领域。以遥感图像分析为例,遥感技术是通过对遥感传感器接收到的电磁波辐射信息特征的分析来识别地物类型的,这可以通过人工目视解释来实现,或是用计算机进行自动分类处理,也可以用人工目视

15、解释与计算机自动分类处理相结合来实现。用计算机对遥感图像进行地物类型识别是遥感图像数字处理的一个重要内容,也是模式识别技术在遥感技术领域中的具体应用。基于内容的图像检索就是根据图像的语义和感知特征进行检索,具体实现就是从图像数据中提取出特定的信息线索(或特征指标),然后根据这些线索从大量存储在图像数据库的图像中进行查找,检索出具有相似特征的图像数据。与传统的基于关键词的数据库检索相比,具有相似度检索、近似检索和要求给出检索结果的集合限制等特点。人们常说“物以类聚,人以群分”。面对数量庞大的图像信息,寻找一种方便快捷、直接有效的对图像进行分类方法已经成为进行图像处理工作的重要基础和必不可少的重要

16、环节,尤其是对于基于内容的图像检索具有极其重要的作用。聚类分析分类方法是先对图像按照某种相似性原则进行聚类,把相似的图像聚合为一类,检索过程在类内进行,从而大大的缩小图像检索范围,就能够达到快速、准确检索图像的目的。1.1.2 国内外研究现状人类从一出生,人眼就在不断地接受、分析和理解周围的景物,这是人类的一种本能活动。在计算机技术的不断发展中,人类更是将这一本能发挥的淋漓尽致。在20世纪70-80年代,图像处理的研究方向主要集中于用图像变换和数学模型来表征图像信号。20世纪80年代中期,各种高性能的工作站和个人电脑应用的普及使图像处理研究和应用不再仅仅是大机构和大型学术团体的“专利”。现在随

17、着Internet的广泛普及。图像处理技术和应用前景将更为广阔。从应用的角度来看,数字照相技术、电子影像、数字化电视机、图像数据库和多媒体技术的出现都在推动这一领域不断地向前发展。总的来说,图像处理技术将不再局限于电子工程研究领域,它已设计到其他学科,如计算机科学、地理、医疗保健、刑事侦查等领域。另外,除了处理位于可视频谱范围的图像信号外,在过去的20年里,对射电望远镜形成的图像、红外图像、合成孔径雷达(Synthetic Aperture Radar.SAR)图像的研究都非常活跃。特别是CT和核磁共振的利用都极大地丰富了这一领域研究的内容。除了上述这些研究领域外,图像处理技术研究人员还积极地

18、眷力于纹理和图形形状的分析与识别、运动检测与估计、图像处理并行系统、图像处理技术的软硬兼研究等工作。由于图像处理技术从一开始就具有很强的理论背景,因此一些具有高鲁棒性的图像处理算法已经应用到消费类型的产品中,一些较成熟的算法也已逐步形成公认的标准。如在20世纪80年代末逐步规划形成、20世纪90年代全面公布的H.263,JEPG,MPEG-2等图像压缩与传输标准使图像处理技术在产业化方面取得巨大的成功。最近的成果也将在JPEG2000标准中体现标准中将用近年来图像变换研究的新成果:小波变换来取代原来的DCT变换,这是因为小波变换克服了傅里叶变换不具有时频局部性质的缺陷,并且和DCT一样具有快速

19、算法。图像处理技术发展非常快,随着基础理论研究的不断推前、更新,各种新颖的图像处理技术层出不穷。就近年来产生了大量研究结果的图像分类算法来说,从有无监督的监督划分为有监督分类和无监督分类。无监督分类方法中K-means分类方法得到了广泛的研究,Paredes等利用K-means算法对训练图像块区生成的KD树进行类似类别搜索,得到了不错的分类效果。但传统K-means算法搜索匹配效率低,特别是对于高维的大型数据集,搜索分类非常费时。Stefan Berchtold 等提出了一种预先计算K-means不相似测度的动态解空间的方法,简化了计算,提高了搜索分类效率。Bin Zhang等采用基于聚类的树

20、算法加速K-means,而不用预先计算K-means不相似测度的特性和矩阵式,从而更大的加快了算法的速度,并减小了计算准确性的损失。另一类在图像分类中广泛使用的有监督分类方法是支持向量机(SVM)分类。何灵敏等采用基于径向基核函数的SVM方法对遥感图像分类,并证实采用一对多的SVM分类方法比BP神经网络方法更适合于对复杂小样本多原数据的分类,蒋芸等将粗糙集理论与SVM结合起来,利用粗糙集理论处理大数据量、消除冗余信息等方面的优势,减少训练数据,提高了SVM的分类能力。大部分SVM方法都采用单一的核函数的类型,当采用局部核函数则学习能力强、泛化性能较弱,采用全局性核函数则泛化性能强、学习能力较弱

21、。1.2 聚类分析聚类分析(cluster analysis)是一种将研究对象分为相对同质的群组(clusters)的统计分析技术。聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy),是用数学的方法来研究和处理给定对象的分类,即对同类型对象抽象出其共性,从而形成类。聚类分析是一种数值分类方法(即完全是根据数据关系)。要进行聚类分析就要首先建立一个由某些事物属性构成的指标体系,或者说是一个变量组合。入选的每个指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,它们互相配合可以共同刻画事物的特征。所谓完备的

22、指标体系,是说入选的指标是充分的,其它任何新增变量对辨别事物差异无显著性贡献。如果所选指标不完备,则导致分类偏差。简单地说,聚类分析的结果取决于变量的选择和变量值获取的两个方面。变量选择越准确、测量越可靠,得到的分类结果越是能描述事物各类间的本质区别。1.3 课题目标及本文研究内容1.3.1 预期目标本论文拟将智能分类技术应用于图像的自动识别,以水果图像分类为目标,研究其特征提取方法及智能分类算法,实现基于Matlab平台的水果图像智能分析软件。1.3.2 主要研究内容论文主要研究内容包括:图像特征提取方法研究:分析图像的典型特征,并研究Hu矩不变特征值的计算方法。分类算法研究:在理解算法原理

23、的基础上运用算法,实现算法功能并分析比较算法性能。智能图像分析软件实现: 系统以MatLab为平台,通过用户界面形式实现了基于聚类的智能图像分类软件,具有建立根据现有图库训练网络、对任一图像实现分类并以图文结合方式展现分类结果等功能。1.3.3 系统方案论文以水果图像的分类为目标,通过图像的预处理、特征提取与分类,基于MatLab实现图像的智能分析。在图像预处理阶段,系统将对输入图像进行灰度化、中值滤波以及锐化并提取图像边缘的操作。特征提取阶段,系统将计算出输入图像的圆度、拉伸度、周长等中间值,将这些必要的中间值带入Hu特征迭代计算公式,即可获得后续处理所需要的特征值向量。分类阶段,系统为用户

24、提供了选择界面。当使用者选择SVM分类方法时,系统将通过使用图库训练学习的方式得到分类结果。当使用者选择K-means分类时,系统将得到自主聚类的分类结果。1.3.4 本文的结构本文分为七个部分,各部分的内容依次如下:第一章,绪论。介绍要解决的主要问题问题。第二章,技术基础。介绍本文涉及到的知识以及使用的工具。第三章,图像矩不变特征提取。对本文采用的训练特征进行详细介绍。第四章,分类算法。对本文用到的两类不同的分类算法进行详细介绍。第五章,算法软件实现。对系统涉及的核心算法、关键函数以及系统界面进行详细的介绍。第六章,系统测试。第七章,结论与展望。论文的成果总结及不足展望。第二章 技术基础22

25、.1 图像特征图像特征指的是图像场中可用作图像标志的属性,通常可以分为统计特征与视觉特征两大类。统计特征包括直方图、频谱和矩等,是人为特征,需要经过变换才能得到。视觉特征指的是具有直观意义的图像的形状与颜色特征,如颜色、纹理、形状等。图像特征的提取和分析是智能图像分析的关键步骤。近年来,随着多媒体技术的发展,许多图像特征被研究人员发掘并利用,为进一步的图像处理提供了极大地便利。对于某幅特定图像,根据不同的需要,通常要提取其不同的特征,因而一幅图像又有了许多不同的表达方式。也就是说,图像的不同特征从各个角度反映了图像在这个特定维度中的特点。在图像统计特征中,直方图描述的是图片显示范围内的灰度分布

26、曲线,它的横轴从左到右代表照片从黑(暗部)到白(亮度)的像素数量。频谱是以横轴纵轴的波纹方式,记录画出图像中包含的各种信号频率的图形资料,是图像信号的频域表征。矩特征表征了图像区域的几何特征,又称为几何矩,其具有平移、旋转、尺度等特性的不变特征,又称其为不变矩。也是本文中应用到得特征。在视觉特征中,颜色特征是一种全局特征,表征了图像区域所对应的景物的表面性质,是基于像素点的特征。纹理特表征了图像区域所对应景物的表面性质征,也是一种全局特征,但是纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。形状特征由其集合属性(长短、距离、面积、凹凸)、统计属性(投影)、拓扑属性(欧

27、拉数、连通)表征,是图像最本质的特征反映。不变矩特征由于其在图像平移、伸缩、旋转时均保持不变,而且具有全局性,是图像识别的主要方法,广泛的应用于机器视觉、目标识别与分类、纹理分析等等。Hu首先提出了七个几何不变矩用于图像识别,利用不变矩进行形状识别获得了广泛的应用。后来人们进行了多方面的研究,发现不变矩还具有绝对的独立性,没有信息冗余现象,抽样性能好,抗噪能力强,更适合用于几何不变图像描述和识别。本文就将使用到Hu的不变矩特征。2.2 图像分类方法2.2.1 图像分类概念从人眼角度看,提高图像对比对、增加视觉维度、进行空间变换或滤波,其目的就是让人们能够凭借知识和经验,根据图像色调、亮度、位置

28、、纹理以及结构等特征,准确的对图像类型或者目标,做出正确的判断和解释,并根据当下的需求,对所需图像进行绘制处理。图像分类就是通过计算机对图像进行定量的分析的过程,把图像中的各个像素或者区域划归到若干类别中的一类去,以代替人眼的视觉判读。图像分类的过程其实是一个模式识别的过程,是人眼目视判读的延续以及发展。图像分类具有计算精度高、速度快、图像测量准确度高等特点。2.2.2 图像分类原理图像分类的理论依据是:图像中的同类景物在相同条件下,应具有相同或类似的光谱信息特征,从而体现出某种同类景物的某种内在相似性,即同类景物像素的特征向量将聚类于同一特征的空间区域,从而不同的景物的光谱信息特征和空间信息

29、特征不同,它们将聚类于不同特征的空间区域。从统计决策理论来看,图像分类在数学上就是对呈现统计可变的数据作出决策的过程。将一个像素归入任一类别的决策,可以说是统计上的一种明智的“猜测”。统计决策比较成熟,对模式不太复杂的应用已经相当的成功,但不能反映模式结构特性,概率表示形式使使用上也存在局限性。神经网络分类方法是只能信息处理的重要内容,它可以处理一些环境复杂、背景不清楚、推理规则不明确的问题。2.2.3 图像分类方法用统计方法进行图像分类时,首先从待分类对象中提取能够反映对象属性的特征向量,并将这些向量定义在一个特征空间之中。之后运用统计决策的方法对特征空间进行划分,用以区分不同特征对应的对象

30、,进而达到分类的目的。同时,在分类的过程中,按照有无样本学习可以分为非监督分类法和监督分类法。监督分类就是用已知的类别样本选择特征参数和建立判别函数,对各个像素进行分类。通常意义上的监督分类包含以下两个具体的分类方法。1. 最小距离分类法最小距离分类法是最简单的监督分类方法。这种方法的基本思想是:从训练样本中提取各个类别对应的均值向量并求出待测向量到各个均值向量的距离,比较后将待测类别归入距离最小的一类中。设待分类像素到类别的距离为 式(2-1)其中,为类别数,为类的中心。当则 2. 最大似然分类(多类分类)最大似然分类建立在贝叶斯准则上,其分类正确率最高,是风险最小的判决分析。在维特征空间中

31、,待测像素对于类的条件概率密度函数和类的先验概率均已知,则最大似然分类法建立的判别函数集为:()式(2-2)若则当服从高维正态分布时,有式(2-3)而非监督分类则需要在进行分类之前获得类别的先验属性,通过这个属性求出判别函数中的未知参数。在先验属性未知的情况下将所有样本就将所有样本划分为若干个类别的方法称为费监督分类,这种方法是根据像素间的相似度大小进行聚类。在聚类过程中,通常是按照某种相似性准则来对样本进行合并或分离。像素聚类有两种途径:迭代法与非迭代法。迭代法先给定一个初始分类,然后通过迭代算法找到能够使准则函数取极值的最优聚类结果,因此这是一个动态聚类分析过程。常用动态聚类法有K-mea

32、ns算法、LBG算法和分裂算法。2.3 MatLab及图像智能处理工具箱MatLab是MatrixLaboratory(矩阵实验室)的缩写,是一款由美国Math Works公司出品的商业数学软件。MatLab是一款用于数据可视化、算法开发、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功能外,MatLab还可以用来创建用户界面及与调用其它语言(包括C,C+和FORTRAN)编写的程序。尽管MatLab主要用于数值运算,但利用为数众多的附加工具箱(Toolbox)它也适合不同领域的应用,例如图像处理、控制系统设计与分析、信号处理与通讯、金融建模和分析等

33、。另外还有一个配套软件包Simulink,提供了一个可视化开发环境,常用于系统模拟、动态/嵌入式系统开发等方面。本系统的功能实现就是是借助MatLab的工具箱完成的。Vapnik经过多年研究,提出了统计学理论和一种新的经验建模工具:支持向量机(Support Vector Machine,SVM)。SVM的训练是依据统计学理论中的结构风险最小化原则,在最小化经验风险的同时最小化SVM的模型复杂度,提高了模型的泛化能力。尽管如此,SVM训练为一个有约束的二次规划问题,其约束条件数等于训练样本容量,因此在用于大训练样本容量的建模问题时,会导致训练时间过长。针对SVM这一缺点,Suykens提出了损

34、失函数为二次函数,约束条件为等式形式的支持向量机:最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)。LSSVM的训练问题为一个线性方程组求解问题,相对于SVM训练的二次规划问题求解,其计算量有了很大的降低。此次系统所用的工具包为由比利时鲁汶大学的K.Pelckmans以及J.A.K.Suykens等开发的LS-SVMlab Toolbox(Version 1.5)。此工具箱实现了基于SVM算法的多类分类。此外,在展现运行结果时用到了MatLab中的GUI用户界面设计。图形用户界面(Graphical User Interface,简称G

35、UI,又称图形用户接口)是指采用图形方式显示的计算机操作用户接口。第三章 图像矩不变特征提取常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。一 颜色特征(一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。(二)常用的特征提取与匹配方法颜色直方图。其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体

36、空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。(三)常用的颜色空间:RGB颜色空间、HSV颜色空间。颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。二 纹理特征(一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有

37、较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。(二)常用的特征提取与匹配方法纹理特征描述方法分类(1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计

38、方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数(2)几何法所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和结构法。(3)模型法模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法(4)信号处理法纹理特征的提取

39、与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneous auto-regressive, SAR)是马尔可夫随机场(MRF)模型的一种应用实例。三 形状特征(一)特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题,(二)常用的特征提取与匹配方法通常情况下,形状特征有两类表示方法,一类是

40、轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。几种典型的形状特征描述方法:(1)边界特征法该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。(2)傅里叶形状描述符法傅里叶形状描述符(Fourier shape descriptors)基本思想是用物体边

41、界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。由边界点导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。(3)几何参数法形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shape factor)。在 QBIC 系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。四空间关系特征特点:所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通常空间位置信息可以分为两类:相

42、对空间位置信息和绝对空间位置信息。前一种关系强调的是目标之间的相对情况,如上下左右关系等,后一种关系强调的是目标之间的距离大小以及方位。显而易见,由绝对空间位置可推出相对空间位置,但表达相对空间位置信息常比较简单。空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其它特征来配合。常用的特征提取与匹配方法:提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些

43、区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。33.1 图像矩不变特征介绍矩特征主要表示了图像区域内的几何特征,又称为几何矩,由于其具有平移、旋转、尺度等特性的不变特征,所以又称其为矩不变。在图像处理中,几何矩不变可以被用来当做一个重要的特征来表示物体,可以据此特征来对图像进行分类等操作。几何矩是在在1962年被Hu(Visual pattern recognition by moment invariants)提出的,矩不变的主要思想是通过使用对变换不敏感的基于区域的几个矩作为形状特征。矩是描述图像特征的算子,在图像分

44、析与模式识别领域中有重要的应用。迄今为止,常见的矩描述子可以分为以下几种:正交矩、几何矩、旋转矩和复数矩。其中几何矩最早被提出并且形式最简单,所以对它的研究最为充分。几何矩对简单图像有一定的描述能力,虽然在区分度上不如其他三种矩,但与其他算子比较起来,较为简单,一般通过一个数字就可表达。矩不变特征的优越性,特别是其具有的旋转不变形、图形的扭曲伸缩等不变形,对于本系统的分类训练具有极其重要的作用。比如,输入系统的待分类图片中的感兴趣区域很可能由于拍摄角度的问题扭曲、拉伸、变形等,但是矩不变特征的这一特性很好的避免了此类操作造成的误差,提高了系统的分类准确度。以下是两个矩不变特征的图像检索实例。图

45、3-1 旋转不变性图3-2 扭曲、伸缩性变不变性从图3-1中的图像检索结果可以看出,形状检索算法对于图像的旋转具有不变性。图3-2检索的结果证明形状检索算法对于图像的扭曲。伸缩形变具有不变性,并对图像的基本形状特性具有鲁棒性,在具有一定形变的干扰情况下,仍能得出较好的图像检索结果。3.2 图像矩不变特征提取数字图像是通过一个数字矩阵表征的。图像f(x,y)的(p+q)阶几何矩定义为:式中是图像的灰度。矩在统计学中通常被用来反映随机变量的分布情况,当被推广到力学中,它用作描述空间物体的质量分布。同理,如果我们将图像的灰度值看作是一个二维或三维的密度分布函数,则矩方法就可用于图像分析领域并且用作图

46、像特征的提取。最常用的,物体的零阶矩显示了图像的“质量”:式(3-1)一阶矩()用于确定图像质心():式(3-2)若将坐标原点移至和 处,就得到了对于图像位移不变的中心矩。如式(3-3)Hu在文中提出了7个几何矩的不变量,这些不变量满足于图像平移、伸缩和旋转不变。如果定义,Hu的7种矩为:在本系统中,使用SVM神经网络对图像进行分类时,需要提取图像的Hu矩不变特征。特征提取具体步骤如下:(1)对初始图库图像和待分类图像进行二图像滤波、直方图均衡、图像均衡、边缘检测、二值法锐化等预处理,将目标从背景中分割出来。经过以上步骤后,目标被突出,图像背景被弱化,从而使目标更容易辨识;图3-3 图像分割与

47、特征提取(2)通过MatLab中的自有函数对初始图库图像和待分类图像进行提取面积、矩形度、原型度、拉伸度以及周长等特征值,为之后的Hu矩不变特征做好准备;(3)通过带入步骤(2)的运算结果计算出初始图库图像和待分类图像的面积、矩形度和伸长度。并按照上文提到的算法计算出每幅图像的7个矩不变特征。这样一来每幅图像就包含了10个特征值,建立一个数组,将特征值存储进去即可。第四章 分类算法本系统在图像分类的功能上,既使用到了监督分类方法,又使用到了非监督分类方法。一下就将这两种分类方法对应的具体算法进行主要介绍。本文使用到了支持向量机分类算法(SVM)以及K-means分类算法。44.1 SVM分类算

48、法1. 算法简介支持向量机(SVM,Support Vector Machine)是在高维特征空间使用线性函数假设空间的学习系统。它将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。支持向量机由一个来自最优化理论的学习算法训练,该算法实现了一个由统计学习理论导出的学习偏置1 李玉景,李琳,李京.基于不变矩和支持向量机理论的船舰目标识别.科技信息.29.2007:2322 蒙秀梅. 智能图像技术研究及岩心图像自动识别系统. 北京邮电大

49、学.硕士学位论文.3 Cortes C, Vapink V. Support Vector NetworksJ.Machine Learning,1995,20:273-297.A Tutorial on Clustering Algorithms .4 陆系群,陈纯.图像处理原理、技术与算法5 罗维亮,冯文博,杨岗.图像处理中的技术、艺术思维.视觉杂谈6 张强,王正林.精通MatLab图像处理7 李沃松.典型图像分类算法分析.8 柳林霞,陈杰,窦丽华.不变矩理论及其在目标识别中的应用9 方辉,王倩.支持向量机的算法研究10 陶少辉.最小二乘支持向量机的改进及其在化学化工中的应用.浙江大学.博

50、士学位论文11 Nello Cristianini,John Shawe-Tayloy.李国正,王猛,曾华军译.支持向量机导论12 朱慕华,朱靖波,陈文亮.面向文本分类的所类别SVM组合方式的比较13 郭小荟,马小平.基于Matlab的支持向量机工具箱14 高联雄,梁虹,冯涛.基于支持向量机和不变矩的交通标志检测.计算机工程与应用.44(31).200815 V. N. Vapnik. Estimation of Dependences Based on Empirical Data, Addendum 1. New York: Springer-Verlag, 1982.。2. 算法详述(1

51、)二类分类SVM是从线性可分情况下的最优分类面发展而来的,主要思想可用图1的两维情况说明。图4-1 最优分类面图中,实心点和空心点代表两类样本,H为分类线,H1、H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。分类线方程为 。对于二类模式分类问题,设有训练样本,其中为模式向量,为类别标号,n为样本容量,则将SVM优化问题约束条件由不等式改为等式,并将经验风险函数改为二次函数,则可得如式(4-1)所示约束优化问题:式(4-1)式中,为高维特征空间中的分类超

52、平面,和为分类超平面的参数;为第i个样本点的训练误差,则为经验风险;衡量了学习机器的复杂性;为惩罚因子,作用是在训练中平衡学习的复杂性和经验风险。根据约束优化理论,式(e4-1)的解由其对应的如式(4-3)所示的Lagrange泛函数的鞍点给出: 式(4-3)式中为Lagrange乘子,取值为一切实数。根据式(4-3)的鞍点条件,可得下式:式(4-4)从式(4-4)的第三式可知,正比于其对应的样本上的训练误差。将上述式子合并,可通过如下式所示的线性方程组求解出和。式(4-5)式(4-5)中,为n维的单位矩阵,1为n维的元素全是1的列向量,为n维对称方阵,其元素为其中而为核函数,因此为的第i行j

53、列元素。求解(2.20)得到之后,则可以得到如下的分类函数:式(4-6)模式向量x的类别由判别函数决定,其中为符号函数。(2)多类分类显然上述分类只能应用于二类模式分类问题,当LSSVM应用于多类问题时,假设给定类分类问题的训练样本其中为维的由-1和+1组成的维向量,当为第j类时,的第j个元素为-1,其余皆为+1。将训练样本存储为两个数据矩阵X和Y,它们的第行分别为。根据SRM原则可得到式(4-7)所示的约束优化问题:式(4-7)而通过与二类支持向量机类似的变换,式(4-7)的解由下式给出: 式(4-8)式中,为Y的第i列,而由元素组成,为对应的Lagrange乘子向量,为对应的常数项。求解完

54、毕后,则可建立下述LSSVM函数:式(4-9)而模式向量的类别由判别函数输出组成的向量c决定。3. 算法流程输入:包含n个对象的训练库以及待测样本图像输出:待测图像的分类结果1.给定训练集2.求解二次规划问题3.计算参数和b4.构造判别辩解,求得判决函数5.对待测样本进行分类并输出分类结果4.2 k-means分类算法1. 算法简介k-means算法,也被称为k-平均或k-均值算法,是一种得到最广泛使用的聚类算法。 它是将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而使生成的每个聚类内紧凑,类

55、间独立。这一算法不适合处理离散型属性,但是对于连续型具有较好的聚类效果。2. 算法详述(1)选定某种距离作为数据样本间的相似性度量k-means聚类算法不适合处理离散型属性,对连续型属性比较适合。因此在计算数据样本之间的距离时,可以根据实际需要选择欧式距离、曼哈顿距离或者明考斯距离中的一种来作为算法的相似性度量,其中最常用的是欧式距离。欧氏距离的定义如下:假设给定的数据集 ,X中的样本用d个描述属性A1,A2Ad来表示,并且d个描述属性都是连续型属性。数据样本xi=(xi1,xi2,xid), xj=(xj1,xj2,xjd)其中,xi1,xi2,xid和xj1,xj2,xjd分别是样本xi和

56、xj对应d个描述属性A1,A2,Ad的具体取值。样本xi和xj之间的相似度通常用它们之间的距离d(xi,xj)来表示,距离越小,样本xi和xj越相似,差异度越小;距离越大,样本xi和xj越不相似,差异度越大。欧式距离公式如下:式(4-10)(2)选择评价聚类性能的准则函数k-means聚类算法使用误差平方和准则函数来评价聚类性能。给定数据集X,其中只包含描述属性,不包含类别属性。假设X包含k个聚类子集X1,X2,XK;各个聚类子集中的样本数量分别为n1,n2,nk;各个聚类子集的均值代表点(也称聚类中心)分别为m1,m2,mk。则误差平方和准则函数公式为:式(4-11)(3)相似度的计算根据一

57、个簇中对象的平均值来进行。将所有对象随机分配到k个非空的簇中。a.计算每个簇的平均值,并用该平均值代表相应的簇。b.根据每个对象与各个簇中心的距离,分配给最近的簇。c.然后转b,重新计算每个簇的平均值。这个过程不断重复直到满足某个准则函数才停止。3. 算法流程算法步骤: 1.为每个聚类确定一个初始聚类中心,这样就有K 个初始聚类中心。 2.将样本集中的样本按照最小距离原则分配到最邻近聚类 3.使用每个聚类中的样本均值作为新的聚类中心。4.重复步骤2.3步直到聚类中心不再变化。5.结束,得到K个聚类。第五章 基于MatLab的图像分析软件实现55.1 软件功能及系统流程本系统以MatLab为平台

58、,实现了基于聚类的智能图像分类。软件具有样本特征值数据库创建、训练网络创建、图像有监督分类(SVM分类)以及图像无监督分类(K-means分类)等功能。程序流程图如下:图5-1 系统流程图5.2 关键函数详述5.2.1 图像灰度化目前的图像样本大部分都是通过摄影机、数码相机等设备或取得,因而需要进行预处理的图像往往是彩色图像。真彩色图像又称RGB图像,它是利用R、G、B三维空间的三个分量表征一个像素的颜色。R、G、B分别代表着一幅图像中的红色分量、绿色分量以及蓝色分量,通过这三个基本颜色可以合成出任意颜色。所以一个尺寸为m*n的彩色图像,将被存储为一个m*n*3的多维数组。数字图像又分为彩色图

59、像和灰度图像。图像灰度化是将彩色图像转化为灰度图像。在彩色图像中包含着很大的信息量,而灰度图像较好的保留了彩色图像中的形状、边缘等信息,有利于后期进行特征提取和识别,所以有必要将彩色图像转化为灰度图像。在RGB模型空间中,若R=G=B,得到一种灰度颜色,其中R=G=B的值称之为灰度值。由彩色转换为灰度的过程叫做灰度化处理。灰度图像只包含强度信息,不包含颜色信息。彩色图像的像素值为RGB(R,G,B),灰度图像的像素值为RGB(r,r,r),R、G、B可由彩色图像的颜色分解获得。而R、G、B的取值范围是0-255,所以灰度的级别只有256级。现阶段主要有三种灰度化方法:(1)平均值法:使R、G、

60、B的值等于三个值的平均值,即式(5-1)(2) 最大值法:使R、G、B的值等于三个值中的最大值,即式(5-2)(3)加权平均值法:根据重要性或者其他约束条件给R、G、B赋予不同的权值,并使R、G、B的值等于它们的加权平均值,即式(5-3)其中,、分别为R、G、B的权值。由于人眼对绿色的敏感度最高,对红色的敏感度次之,对蓝色的敏感度最低,当=0.299,=0.587,=0.114时,即可得到最合理的灰度图像。MatLab中的灰度化函数就是这样操作的,在具体的调用中,将图像读入之后,便可进行灰度化处理,语句如下:image =rgb2gray(imread(image);5.2.2 图像平滑与图像

61、锐化5.2.2.1 中值滤波图像平滑是一种常用的图像增强方法。图像增强就是增强图像中用户感兴趣的信息,其目的主要有两个:一是改善图像的视觉效果,提高图像成分的清晰度;二是使图像变得更有利于计算机处理。图像增强的方法一般分为空间域和变换域两大类。空间域方法是直接对图像像素的灰度进行处理,变换域方法是对图像的某个变换域中的变换系数进行处理,然后进行逆变换获得增强图像。中值滤波是一种局部平均平滑技术,它是一种非线性滤波。由于它在实际运算过程中并不需要图像的统计特性,所以使用比较方便。在一定条件下,中值滤波可以克服线性滤波器所带来的图像细节模糊,而却对滤除脉冲干扰及颗粒噪声最为有效。在实际调用中,将图

62、片读入并进行灰度化处理后,便可以进行中值滤波。语句如下:image=medfilt2(image,3 3); 5.2.2.2 图像锐化在图像摄取、传输及处理过程中有许多因素会使图像变得模糊,图像模糊是常见的图像降质问题。大量的研究表明,图像模糊的实质是图像收到了求和、平均或积分运算。因此,可以根据各种图像模糊过程都有相加或积分运算这一共同点,运用相反的运算来减弱和消除模糊。这一类消减图像模糊的图像增强方法称为图像锐化。图像锐化的主要目的是加强图像中的目标边界和图像细节。锐化技术可以在空间域中进行,基本的方法是对图像进行微分处理:在频率域运用高通滤波技术。在空间域中,由于需要锐化的图像边界或线条可能是任意走向的,所以期望采用的算子应该是各向同性的。所谓各向同性,是指无论边界或线条走向如何,只要幅度相等,算子就给出相同的输出。图像锐化方法包括微分算子方法、拉普拉斯算子方法、空间高通滤波方法等。本系统中所使用的是Sobel微分算子方法。微分算子方法锐化图像时,图像中的噪声、条纹等同样得到加强,这在图像处理中会造成伪的边缘和轮廓。Sobel算子则在一定的程度上克服了这个问题。Sobel算子的基本思想是:以待增强图像的任意像素为中心,截取一个33的像素窗口,分别计算窗口中心像素在水平

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!