LPB图像识别毕业论文

上传人:陈** 文档编号:102206110 上传时间:2022-06-06 格式:DOC 页数:42 大小:5.46MB
收藏 版权申诉 举报 下载
LPB图像识别毕业论文_第1页
第1页 / 共42页
LPB图像识别毕业论文_第2页
第2页 / 共42页
LPB图像识别毕业论文_第3页
第3页 / 共42页
资源描述:

《LPB图像识别毕业论文》由会员分享,可在线阅读,更多相关《LPB图像识别毕业论文(42页珍藏版)》请在装配图网上搜索。

1、撰写人:_日 期:_题目:基于LBP纹理特征的图像检索系统 院(系) 计算机科学与技术学院 专 业 软件工程 届 别 2008届 学 号 0825121037 姓 名 林颖奇 指导老师 杜吉祥 指导老师职称 副教授 华侨大学教务处印制 2012年5 月摘 要随着计算机网络的飞速发展和多媒体编码技术的进步,网络上的资源日益丰富,尤其是直观的形象的多媒体信息备受人们的亲睐基于内容的图像检索,即(CBIR)。CBIR的核心是使用图像的可视特征对图像进行检索。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出

2、不穷。局部二元模式(LBP)是一种灰度范围内的纹理描述方式,它从一种纹理局部近邻定义中衍生出来。本文实现了恒定的基础局域二值模式和旋转不变的局域二值模式两种纹理特征提取方式。通过LBP纹理图生成灰度直方图,计算灰度直方图之间的欧式距离以完成图像检索比对。本文采用VC+6.0环境下MFC项目导入OpenCV图像处理函数库设计了检索系统实现基于LBP纹理特征的图像检索。在(加利福尼亚理工学院256类图像数据库)及(Queensland大学分类的brodatz自然纹理图像库)下进行测试并对结果进行分析与讨论。关键字: CBIR;LBP特征提取;图像识别ABSTRACTAlong with the r

3、apid development of the computer network and multimedia code technology progress, the network resources are increasingly rich, particularly intuitive image of the multimedia information is peoples pro-gaze content-based image retrieval, namely (CBIR). The core of the image is used CBIR the visual fe

4、atures to do image retrieval. Texture classification and segmentation image processing area is a hot research field of enduring, texture feature extraction and segmentation texture classification as a priority, and has been the focus of attention, all kinds of texture feature extraction method are e

5、ndless. Local Binary Patterns is a gray within the scope of the texture description way, it from a different texture Local neighbors in the definition of derivatives. This paper realized the constant based Local Binary Patterns and rotation invariant of Local Binary Patterns two texture feature extr

6、action method. Through the LBP texture map generating gray-level histogram, calculation of gray histogram Euclidean distance between to complete than image retrieval. This paper using vc + + 6.0 environment MFC project launch OpenCV image processing function library design the retrieval system based

7、 on texture feature LBP image retrieval. In (the California institute of technology 256 kinds of image database) and (Queensland university of classification brodatz natural texture images library) test and the results are analyzed and discussed.keyword: CBIR, LBP feature extraction, image recogniti

8、on目录摘 要IABSTRACTII1 绪论11.1 研究背景11.2 基于内容的图像检索11.2.1 基于内容的图像检索概述1 基于内容的图像检索体系结构2 基于内容的图像检索的特点4 基于内容的图像检索性能评价51.3 图像检索的国内外研究现状61.4 图像检索的优缺点级展望81.5 本论文结构92 基于纹理的图像检索92.1 基于纹理的图像检索9 发展与现状9 纹理的定义112.2 局域二值模式122.3 基本LBP132.4 旋转不变LBP142.5 本章小结163 基于LBP的纹理图像检索173.1 开发平台介绍193.2 系统流程图173.3 主要流程解释183.4 图像检索算法1

9、83.5 系统实现193.5.1 系统窗口93.5.2 系统主要算法114 实验结果及分析244.1 基于Brodatz纹理图测试194.2 基于Caltech 256类图像数据库纹理图测试174.3 图片旋转检索测试185 结论33参考文献:29致谢词:301 绪 论1.1 发展与现状随着互联网技术以及多媒体技术的迅速发展,多媒体数据(包括图像和视频)急剧增长,这为人们提供了一个取之不尽、用之不竭的信息源。而如何在浩如大海的多媒体信息世界中快速、准确得获得自己所需要的内容,己成为当前信息领域的重要课题。图像作为一种内容丰富、表现直观的多媒体信息,具有文字信息所无法替代的丰富内涵和强大的描述能

10、力,长久以来都受到人们的青睐,是日常生活中不可缺少的信息来源。随着科学技术的快速发展,计算机技术、通信技术、多媒体技术的迅速发展以及互联网的普及,多媒体信息源不断扩大,每天都会产生各式各样以千兆字节计数的图像信息。各行各业对图像的使用越来越广泛,研究也越来越深入,比如数字图书馆系统、遥感系统、医学图像管理、商标版权保护等。各种庞大的图像数据库的建立,使得人们对图像信息检索的需求与日俱增。图像信息资源的统筹管理与高效检索显得日益重要。自从上世纪70年代以来,随着计算机视觉和数据库两大研究领域技术的飞速发展,图像检索技术逐渐成为了一个重要而活跃的研究领域。但是,在这个领域仍然有许多技术不够完善或尚

11、待解决。因此,研究此课题既具有重大的意义,同时又面临严峻的挑战。1.2 基于内容的图像检索 基于内容的图像检索概述在传统的图像检索中,通常采用的是基于关键字的图像检索技术1。该技术通过提取图像的文件名或者周边文字,建立图像索引。当用户输入关键字进行检索时,系统将输入的关键字与图像索引进行匹配,返回相应的结果该技术也被称为“字找图”。目前,互联网上众多实用化的搜索引擎如百度、Google等采用的就是基于关键字的图像检索。但是,该技术需要大量的人力对图像进行人工标注,并且人工标注无法准确描述蕴藏在图像中的丰富内容,而且还具有一定的主观性。为了弥补传统的图像检索技术的不足,基于内容的图像检索(Con

12、tent Based ImageRetrieval,CBIR)应运而生2。该技术通过提取图像的低层视觉特征(如颜色、纹理、形状等),对图像建立索引。用户可通过提供示例图或构造草图、轮廓等多种方式提出查询要求。系统对示例图和图像库中的图像进行匹配,根据相似度的大小决定查询结果的排列顺序。该方法被形象的称为“图找图”。 基于内容的图像体系结构一个CBIR系统的基本组成如图11所示系统包括特征提取模块、索引模块、匹配模块以及相关反馈模块。图1.11. 特征提取模块所谓特征提取,就是对图像进行分析,提取出感兴趣的、可以反映图像内容的、并且适合于检索的特征,是CBIR系统的核心内容现有检索系统所提取的内

13、容特征大多包括颜色、纹理、形状、轮廓和空间位置关系等。2. 索引模块一幅图像可以用多种特征来描述,而每种特征又有可能由多个特征分量所组成,因此最终得到的图像特征的维数可能比较高。为了满足用户对检索系统实时性的需要,需要选择一种适合于多维检索的索引算法。目前,图像数据库索引技术主要包括:向量空间的索引(Spatial Access Methods,SAM)和度量空间的索引(Metric Access Methods,MAM)。3. 匹配模块基于关键字的图像检索一般基于精确的匹配,而基于内容的图像检索采用的是相似度匹配。图像的相似度实质上是图像对应的特征之间的相似度。合理的相似度度量方式也是实现高

14、效的图像检索的关键。不同的相似度度量方式有各自的优缺点,并非某一种度量方式适用于所有的图像检索系统。常用的相似度度量方式有Minkowski距离、二次式距离、直方图相交法、KL距离等,具体形式如下:设查询图像的特征向量为g,目标图像的特征向量为t,特征维数为M,D表示查询图像与目标图像之间的相似度。 (1)Minkowski距离 (1.1) 其中,取1、2时分别就是我们所熟知的绝对值距离和欧氏距离(Euclidean distance)。(2)马氏距离(Mahalanobis distance) (1.2)其中,为特征向量的协方差矩阵。(3)直方图相交法假设和为含有M个bin的直方图,则二者之

15、间的相交距离为: (1.3)(4)二次式距离对于基于颜色直方图的图像检索,二次式距离考虑到了不同颜色之间的相似度,因此比欧氏距离或直方图相交距离更有效。两个颜色直方图和含有M个bin,则二者之间的二次式距离为: (1.4)其中,A为颜色相似性矩阵。 (5)KL距离 (1.5)4相关反馈模块由于CBIR主要是针对图像的低层视觉特征进行提取和匹配,而低层视觉特征和高层语义之间存在较大的差距,即“语义鸿沟”,从而使得检索结果往往不尽如人意。为此,人们提出了相关反馈(Relevance Feedback,RF)技术来改善检索结果。相关反馈技术的核心内容是小样本学习问题尽管该技术可以有效的改善曙义鸿沟”

16、,但现实生活中的用户大多不愿对大量的图像进行标注,因此如何在样本个数较少的情况下,准确、迅速得捕捉用户需求己成为相关反馈技术的核心任务。1.2.3 基于内容的图像检索的特点基于内容的图像检索技术旨在通过对图像进行合理的描述,从而帮助用户更快捷、更准确地找到所需要的多媒体信息。该技术的研究涉及了诸多学科领域,比如人工智能、计算机视觉、模式识别、信号处理、数据库、认知心理学、人机交互等,具有重要的理论意义和广泛的应用前景。此外,CBIR系统还具有如下特点:1 直接从图像的内容中提取信息。它突破了传统的基于文本检索的局限,直接对图像进行分析和提取特征,利用这些特征对图像进行描述并建立相应的索引。2

17、基于内容的图像检索采用的是近似匹配。这一点与传统检索所采用的精确匹配有着明显的区别。3 提取特征和建立索引都是由计算机自动完成,不仅避免了人工描述的主观性,还大大减少了工作量。4 具有很强的交互性。系统采用相关反馈,通过用户的评价来修正检索方法,从而使得检索结果更加符合用户的需求。整个检索过程是一个用户有限次的反馈和检索结果逐渐逼近最优结果的过程。1.2.4 基于内容的图像检索的性能评价CBIR系统的性能评价标准是CBIR系统的一个重要研究内容,指导和推动该系统的研发。针对图像检索领域的不同问题,研究人员不断得提出新的特征提取方法、相似度度量方式以及索引机制等,期望可以提高系统性能。然而目前对

18、于不同的图像检索系统,还没有统一的评价标准来衡量系统性能的优劣。图像检索系统的性能评价主要考虑计算复杂度和检索效率两个方面。计算复杂度指的是提取特征的计算时间和特征匹配的时间,其中特征匹配的计算复杂度是决定一个系统是否快速的关键。检索效率主要取决于系统选取的特征的区分能力以及匹配算法的有效性。基于以上两方面的考虑,目前的评价方式大致可以分为两类:第一类充分考虑人的主观视觉感受,这类方法主要是显示一系列的检索结果图像,由人的感受来评价检索结果的好坏。这种评价方法具有一定的个性和主观性,说服力有限,并且不利于交流。第二类方法是基于量化的方式。这类方法是根据统计得到的结果,具有一定的通用性。常用的评

19、价标准有以下几种3:1查全率(Recall)查全率指返回的检索结果中有效图像占整个图像库中所有相似图像的数量的比率,用于检测系统检索相关图像的能力。 (1.6)其中,为检索出的相似图像的个数,为未检索出的相似图像的个数。2查准率(Precision)查准率指返回的检索结果中有效图像的比率,用于检测系统排除无关图像的能力。 (1.7)其中, 为检索出的相似图像的个数,为检索出的不相似图像的个数。3误匹配率(Fallout)误匹配率指返回的检索结果中无效图像占整个图像库中所有不相似图像的数量的比率,用于检测系统检索不相关图像的能力。 (1.8)其中,为检索出的不相似图像的个数,为剩余图像个数(,为

20、图像总数)。查全率的主要含义是在一次查询过程中,用户所查到的相关图像的数目和数据库中与目标图像相关的所有图像数目之比;而查准率主要指在一次查询过程中所查到的相关图像数目同该次查到的所有图像数目之比。用户在评价算法的时候,可以预先选定含有特有目标的图像作为一组相关的图像,然后根据返回的结果计算查全率和查准率。查全率和查准率越高,说明该检索算法的效果越好。用查全率R作为x 轴,查准率P 作为y 轴,绘制一条查准率-查全率曲线,简称为PVR曲线。设PVR曲线为,则与-轴围成的面积为: (1.9) 称为PVR指数。据研究,该指数越大,图像检索性能越好。由此可以看出,查全率反映检索的全面性,而查准率则反

21、映检索的准确性,因此可以用查全率和查准率来评价系统的有效性。该方法的局限性在于没有考虑检索结果中相似图像所处的位置,同时,高的准确率与查全率并不一定表明一个系统工作得好,这还要视具体的应用而定。1.3 图像检索的国内外研究现状图像检索系统可以提供一个友好的人机交互界面,以便于用户快速准确得查找所需图像。交互界面的设计综合了数据库、图像处理、计算机视觉、模式识别、人工智能等多种技术。目前,人们已经开发了一些供商用的或研究用的图像检索系统。其中比较有影响的系统有QBIC、Virage、Photobook、VisualSEEK、WebSeek、MARS等。QBIC(Query by Image Co

22、ntent) 4是由IBM公司20世纪90年代研究开发的著名的商用CBIR系统,该系统对后来的图像检索系统具有深远的影响。QBIC系统可以实现基于颜色、纹理和形状的检索。其中,颜色特征的提取主要采用的是颜色直方图,纹理特征的提取采用的是粗糙度、对比度和方向性的结合,而形状特征采用的是离心率、主轴方向和代矩等。此外,QBIC系统还支持基于文本的关键字的查询方式。Virage5是Virage公司开发研制的一种基于内容的图像检索搜索引擎。与QBIC系统相类似,该系统也支持基于颜色、颜色布局、纹理和形状等视觉特征的查询。此外,Virage系统还支持以上四种特征的任意组合,并且用户还可以根据需要对不同的

23、特征赋予不同的权值来改善检索结果。Virage弓I擎及其在图像对象层上的操作是Virage技术的核心,该引擎既可以应用到通用的图像查询系统中,还可以对其进行扩展并应用到特定的领域或场合。Photobook6是MIT媒体实验室研发的图像检索系统。该系统包括三个子部分,分别用于提取形状、纹理和人脸特征。用户可以在这三个部分分别按照特定的特征进行检索。Photobook系统的人脸识别技术也被成功应用到了美国的警察机关。为了便于用户的浏览和检索,该系统提供了一些交互式工具。比如提供了多种相似度度量方式,使得用户可以选择一种或几种算法的线性组合来计算图像的相似度。此外,用户还可以勾画兴趣区域,参与特征提

24、取过程。VisualSEEK7和WebSEEK都是美国哥伦比亚大学研发的检索系统。其中前者支持基于视觉特征及其空间关系的查询,而后者是面向Web的查询系统。系统利用图像区域的空间位置关系和从压缩域提取的视觉特征进行检索,而视觉特征是颜色特征和基于小波变换的纹理特征。为了提高检索的速度,系统采用了二叉树索引技术。MARS8是美国伊利诺斯大学Urbana Champaign分校研发的多媒体分析和检索系统。该系统引入了相关反馈机制,根据用户的反馈,优化查询结果,提高了检索效率。此外,还有斯坦福大学与滨州大学研发的SIMPLicity,加州大学Berkeley分校开发的基于区域的图像检索系统Blobw

25、orld,以及加州大学伯克利分校所研发的Chabot等。近年来我国的研究人员越来越重视基于内容的图像检索系统的研发,相关单位也开发了不少各具特色的检索系统。由中国科学院计算技术研究所和北京图书馆共同研发了基于特征的多媒体信息检索系统MIRES,该系统可以方便的接入Internet,对图像和中文全文进行检索对图像提取颜色、纹理、形状进行检索,对中文全文进行的检索具有布尔检索、截词模糊匹配检索、完全字符串匹配检索等多种检索方式。该系统现在已经在北京图书馆、科学数据库、计算机学报、测绘研究院等单位得到了初步应用。清华大学计算机系于1997年研究开发了一个以Internet浏览器为平台的基于内容图像检

26、索系统ImgRetr。该系统提取主颜色、颜色直方图、颜色分布、纹理特征、轮廓特征和主题词来对图像进行描述,在SS一树的基础之上提出了一种通用相似索引树,以此作为储存特征的底层相似索引结构。iFind9系统是微软亚洲院研发的一个结合语义和视觉特征的图像相关反馈检索系统,该系统通过图像的标注信息构造语义网络,并在相关反馈中与视觉特征进行结合,在基于内容的图像检索中取得了比较理想的效果,具有一定的应用价值。总之,CBIR技术是一个方兴未艾的研究领域,虽然已有不少的原型系统,然而随着科技的迅猛发展,许多问题仍需进一步的探索。CBIR技术依赖于数据库、图像处理、模式识别等多个研究领域的发展,同时也将对其

27、产生深远的影响,是一个很有发展前途的研究方向。1.4 基于图像检索的优缺点及展望网页搜索是基于文本的搜索,本身就是语义的一个直接表达,在文本中得到了直接的体现,所以搜索的技术相对比较简单,经过这几年的发展已经挺成熟了(至少在使用上是这样的感觉)。图片的搜索相对起步较晚些,且难度比较大。其中原因有很多:在早期的时候图片的数量远远少于文字(毕竟文字是信息的主要载体),但是随着社会进步,互联网的发展,多媒体在近几年得到了迅猛的发展,其中图片的量是爆炸式的增长。各类的视频分享网站的出现就是一个信号。基于人工标记的图片搜索已经远远跟不上人们的需求,而且如何有效的标记一张图片便于搜索也是一个问题(你的标记

28、是否是最贴近用户的想法)。举一个简单的应用例子,假如你看到一件衣服,很喜欢,但是不知道他叫什么,那么你去网络商城上搜索,根本无从下手。而如果基于内容的图像检索,这个问题就可以得到解决。他可以相对的准确的找出你想要的。当然这只是生活中的一个很小的事情。简单的说想对于传统的文本图像检索,基于内容的图像检索更为直观。个人觉得随着多媒体的迅猛发展,基于内容的图像检索必将有很大的发展空间和前景。1.5 本论文的结构安排第一章为绪论,介绍了图像检索的研究背景和意义,简要介绍了基于内容的图像检索的体系结构、特点、性能评价,以及图像检索的国内外研究现状,同时说明了本论文的内容结构安排。第二章主要介纹理图像检索

29、和局部二值模式的相关理论。第三章 对系统的主要模块及其算法进行分析。第四章对LBP纹理检索系统进行测试性能评价。2 基于纹理的图像检索2.1 基于纹理的图像检索 发展与现状纹理是图像的重要特征之一在图像分析,识别及图像检索中起到非常重要的作用20世纪70年代以前出现了自相关函数法10功率谱方法,和一些与各种灰度频率相关的方法等。这些方法取得一定成功,但是没有具体的定义、描述或纹理模型,仅仅是某种数学变换。另外还有一些提取纹理特征的方法,也仅限于提取特定的图像属性,如纹理粗糙度,纹理直线性等。1966年, Brodatz给出了很多纹理图像的例子,即所谓的Brodatz纹理库,成为后来人们研究纹理

30、的重要数据源。20世纪70年代,最有代表性的是Haralick对纹理的分析和理解以及提出的纹理特征提取方法,为后续的纹理研究提供了理论支持和技术积累。1973年, Haralick在利用陆地卫星图像研究美国加利福尼亚海岸带的土地利用问题时,开创性地提出著名的GLCM,它在纹理分析中是一个很好的方法,广泛用于将灰度值转化为纹理信息。此外,这个阶段出现的方法主要还有灰度行程长度法、灰度差分统计法 ,自回归模型法等,这些方法在纹理分类中有一定效果,但是这些方法的后继研究很少,在实际应用中也较少采用。从20世纪80年代以来,MRF理论在纹理分析中掀起一阵热潮,为纹理特征提取找到了一个新的方向,尔后相继

31、出现了MRF模型、Gibbs模型、高斯马尔可夫随机场( GMRF)模型、同步自回归模型( SAR) 、隐马尔可夫随机场模型(HMRF) 、广义MRF模型和多分辨率MRF等等。同时,分形理论也为提取纹理特征注入了新的活力。1984 年,Pentland等人在这方面做了开创性的工作,指出分形模型非常适用于描述纹理图像。后来更多学者将分形用于纹理分类,以分数维来描述图像区域的纹理特征。其中引人瞩目的是Chaudhuri 和Sarker提出了差分计盒算法,这是一种简单、快速、精度高的分形维数计算方法,也是目前用得较多的一种方法。随后, Kapan等人提出了非常吸引人的扩展分形特征。90年代以后,人们发

32、现传统的纹理分析方法的一个瓶颈在于不能从多尺度有效描述纹理特征。小波理论的出现为时频多尺度分析提供了一个更为精确而统一的框架。小波变换提供了一种在不同尺度上研究分析图像纹理细节的工具,为更精细地进行图像纹理分类和分析提供了新思路,在纹理分析中具有广阔的发展空间。1989年,Mallat首先将小波分析引入纹理分析中之后,随之基于小波的纹理分析方法如雨后春笋般涌现出来。随着小波理论的发展,小波在纹理特征提取中的应用也不断发展。小波理论发展的许多分支,如多进制小波、小波包以及小波框架等等,它们均在图像纹理分析中发挥了积极的作用。如Chang等人提出的基于树结构小波的纹理分类方法, Unser研究的基

33、于小波框架的纹理分类方法。近年来,较引人瞩目的是Tojala等人于1996年提出的局部二进制模式(LBP) ,该方法分析纹理的吸引人的地方在于其计算复杂度小,具有多尺度特性和旋转不变特性,在纹理检索领域得到应用。总的来讲,纹理特征提取在国际范围内呈现更加灿烂的局面,一方面,人们对已有经典的纹理特征提取方法进行深入研究与扩展;另一方面,新的纹理特征提取方法以及纹理特征提取方法的融合亦在蓬勃发展,主要集中在纹理多尺度特征、旋转不变特征的提取以及纹理特征的选择与融合,如GLCM与MRF的融合,小波方法与MRF的融合等等。2 图像纹理应用 纹理的定义纹理的定义一直为人们所关注,但是,图像纹理定义问题至

34、今没有得到圆满的解决,仍然不存在为众人所公认的定义,这正是由于图像纹理形式上的广泛性和多样性所造成的, 从而也使得研究者针对不同的应用提出了自己的概念与定义。下面是几个具有代表性的定义:定义111 纹理是一种反映像素的空间分布属性的图像特征,通常表现为局部不规则而宏观有规律的特性。定义210 如果图像内区域的局域统计特征或其他一些图像的局域属性变化缓慢或呈近似周期性变化,则可称为纹理。定义3 纹理就是指在图像中反复出现的局部模式和它们的排列规则。定义4 纹理被定义为一个区域属性,区域内的成分不能进行枚举,且成分之间的相互关系不十分明确。定义512 纹理是一种反映图像中同质现象的视觉特征,体现了

35、物体表面共有的内在属性,包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系。定义6 纹理具有三大标志:某种局部序列性不断重复、非随机排列和纹理区域内大致为均匀的统一体。定义1从物质的组成及人类对物体的视觉感知的角度审视纹理。定义2中,局部属性的集合可以理解为一些基元类型和它们的空间关系,这个定义的一个重要部分是属性必须在恒定的纹理区域内重复出现。定义3通过纹理基元的局部模式的数目和类型以及它们的空间关系来描述纹理。其余定义都强调了随机性、重复性、规律性等特征并存于纹理。总之,上述诸定义都是基于特定应用背景的,其中的共识是: 纹理不同于灰度和颜色等图像特征,它通过像素及其周围空间邻域的

36、灰度分布来表现,即局部纹理信息; 局部纹理信息不同程度的重复性,即全局纹理信息。对纹理的认识或定义决定了纹理特征提取采用的方法,由于难以对纹理给出一个精确和统一的定义,不能对纹理做出完整的表达,一方面使纹理分析中的问题更为错综复杂、更具有挑战性;另一方面,图像的研究者们不断引入各种模型从不同侧面来描述纹理的多种属性,使得对纹理的研究缤纷多彩。2.2 局域二值模式局部二值模式(Local Binary Pattern,LBP) 13-15是由Tojala等在1996年提出的,由于理论、计算简单,因此受至U-J许多研究者的青睐,被广泛应用于图像处理领域LBP可以刻画邻域内像素点的灰度相对于中心点的

37、变化情况,注重像素灰度的变化,符合人类视觉对图像纹理的感知特点,是一种有效的纹理图像描述子。LBP严格来讲是一种特征提取方式。就特征提取方式而言,目前最成熟最常用的是gabor特征。这两种特征,gabor效果更加鲁棒,lbp的特点是运算速度快,便于在嵌入式等平台运行。一般如果条件允许,二者会进行结合,包括定义结合特征(比如LGBP,LGXP等),特征级融合和决策级融合。而影响人脸识别算法最终效果的因素还包括:鉴别特征提取方式(主流是PCA+LDA),特征点定位精度(眼睛定位或脸部器官轮廓特征点定位),以及最终距离的计算方式(欧式,MQDF,以及各种融合,和阈值机制)。对于LBP本身,是一种纹理

38、描述方法,在纹理分类,特征表示,物体检测等领域都有应用。此外,lbp本身还有很多变种,包括block-based lbp(lab),volume lbp(在相邻帧时域进行编码)等,是一种使用简单,运算速度快的特征,有很多应用。2.3 基本LBP首先定义局部纹理模式为图像局部区域内个像素点的灰度值的联合分布: (2.1)其中,是局部区域的中心像素的灰度值,则代表中心周围的像素点灰度值,这些邻近像素距离中心像素为,等距离成环形对称分布,如图2.1所示。图2.1对于一个包括1个中心像素和8个邻域像素的33窗口,以中心像素的灰度值为闽值,将其邻域的8个灰度值与阈值进行比较,小于阈值的像素用0表示,反之

39、用1表示然后顺时针方向读出8个二进制数值,作为该中心像素的特征值。具体过程如图22所示,其中,pattern=10001111;LBP=1+16+32+64+128=241。图2.2这个点的像素的lbp算子就是241。为计算和表达方便,将局域纹理模式的二值编码转化为一个实数编码:(2.2)其中=8,=1。2.4 旋转不变LBP当图像旋转后,领域的像素仅仅围绕中心像素转过一定角度,排列顺序没有改变,相应的灰度差分也没有变化,但因为坐标系没有旋转,所以二值编码中的0和1就要环形移动,如图2.3所示。实际上,这些模式应该视为相同的模式,为消除图像旋转带来的影响,实现旋转不变性,调整式为: (2.3)

40、图2.3当P=1,R=8是原来的256个二值模式被压缩为36个具有旋转不变性的二值模式。这些模式不是等概率出现的,差异很大,有些模式出现的几率非常高。所以我们把有部分模式出现的几率非常高的模式独立出来,它们代表了纹理的一些基本属性,或基本特征。这些模式有一个共同的特点:具有很少的空间结构的阶跃,即在环形的二值编码中,从0变为1或从1变为0的次数很少。图像旋转后由于插值的原因会造成像素灰度值的改变,进而导致二值编码发生变位。由于结构的特点,这些恒定二值模式相对于其它的二值模式,发生变位的几率要小的多。因此这些恒定二值模式可以看作纹理的微结构。精品范文模板 可修改删除 图2.4局域纹理的恒定与非恒

41、定二值模式()为了再次调整LBP计算公式(2.2),首先定义一个“恒定”度量,即计算环形二值编码中的0/1阶跃次数:(2.4)然后选择“恒定”度量不大于的模式作为恒定二值模式。为保证灰度尺度与旋转不变性,调整式(2.2)为(2.5)通常,。这样,原始的个二值模式就压缩为个恒定二值模式和一个非恒定二值模式,而且具有灰度与旋转不变性。2.5 本章小结显而易见的是,上述提取的LBP算子在每个像素点都能够获得一个LBP“编码”,那么,对一幅图像提取其原始的LBP算子尔后,获得的原始LBP个性依旧是“一幅图片”。不过,这里我们曾经将物体从图片(图片能够会意为物体在原始测量空间获得的测量个性)转换为二次个

42、性,也即便获得了我们等闲说的“个性”。不过,这个所谓的“个性”并不能直接用于分辨分析。因为,从上面的分析我们能够看出,这个“个性”跟位相消息是紧凑相干的。所以在这里我们就提取原始LBP个性图片的灰度直方图。计算每个像素值所含的个数,用灰度直方图进行相似度比对。3 基于LBP纹理的图像检索系统3.1 开发平台介绍VC+6.0 Visual C+ 6.0,简称VC或者VC6.0,是微软推出的一款C+编译器,将“高级语言”翻译为“机器语言(低级语言)”的程序。Visual C+是一个功能强大的可视化软件开发工具。自1993年Microsoft公司推出Visual C+1.0后,随着其新版本的不断问世

43、,Visual C+已成为专业程序员进行软件开发的首选工具。虽然微软公司推出了 Visual C+.NET(Visual C+7.0),但它的应用有很大的局限性,只适用于Windows 2000、Windows XP和Windows NT4.0。所以实际中,更多的是以Visual C+6.0为平台。Visual C+6.0由Microsoft开发, 它不仅是一个C+ 编译器,而且是一个基于Windows操作系统的可视化集成开发环境(integrated development environment,IDE)。Visual C+6.0由许多组件组成,包括编辑器、调试器以及程序向导AppWiza

44、rd、类向导Class Wizard等开发工具。 这些组件通过一个名为Developer Studio的组件集成为和谐的开发环境。Microsoft的主力软件产品。Visual C+是一个功能强大的可视化软件开发工具。自1993年Microsoft公司推出Visual C+1.0后,随着其新版本的不断问世,Visual C+已成为专业程序员进行软件开发的首选工具。虽然微软公司推出了Visual C+.NET(Visual C+7.0),但它的应用的很大的局限性,只适用于Windows 2000,Windows XP和Windows NT4.0。所以实际中,更多的是以Visual C+6.0为平

45、台。 Visual C+6.0以拥有“语法高亮”,自动编译功能以及高级除错功能而著称。比如,它允许用户进行远程调试,单步执行等。还有允许用户在调试期间重新编译被修改的代码,而不必重新启动正在调试的程序。其编译及创建预编译头文件(stdafx.h)、最小重建功能及累加连结(link)著称。这些特征明显缩短程序编辑、编译及连结的时间花费,在大型软件计划上尤其显著。MFC,微软基础类(Microsoft Foundation Classes),同VCL类似,是一种应用程序框架,随微软Visual C+ 开发工具发布。目前最新版本为10.0(截止2011年3月),并且发布了中文版。该类库提供一组通用的

46、可重用的类库供开发人员使用。大部分类均从CObject 直接或间接派生,只有少部分类例外。 MFC 应用程序的总体结构通常由开发人员从MFC类派生的几个类和一个CWinApp类对象(应用程序对象)组成。MFC 提供了MFC AppWizard 自动生成框架。 此外MFC的部分类为MFC/ATL 通用,可以在Win32 应用程序中单独包含并使用这些类。 由于它的易用性,初学者常误认为VC+开发必须使用MFC。这种想法是错误的。作为Application Framework,MFC的使用只能提高某些情况下的开发效率,只起到辅助作用,而不能替代整个Win32 程序设计。OpenCV1.0OpenCV

47、的全称是:Open Source Computer Vision Library 。OpenCV于1999年由Intel建立,现在由Willow Garage提供支持。OpenCV是一个基于BSD许可证授权(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效由一系列 C 函数和少量 C+ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。3.2 系统流程图整个系统过程由读取图像,灰度化,计算LBP算子,生成LBP图,生成LBP灰度直方图,记录参数值,图像检索,图像预处理,

48、结果反馈等几部分组成,系统流程图如图3.1所示:图3.13.3 主要流程解释1. 灰度化由于输入的图片大多为彩色图片,如果直接输入的是菜色图片则不能够获得LBP算子。cvCvtColor(ColorImage, GrayImage, CV_BGR2GRAY);cvCvtColor是Opencv中自带的颜色空间转换函数,可以实现rgb颜色向HSV,HSI等颜色空间的转换,也可以转换为灰度图像。2. 计算LBP算子计算LBP算子时要读入图像像素点灰度值。cvGetReal2D(Image, row, col);cvGetReal2D是Opencv中自带返回单通道数组的指定元素的函数。读到一个点以及

49、它周围的八个点的灰度值以后,进行LBP编码,获得改点的LBP算子3. 生成LBP图调用cvSetReal2D函数将指定函数返回单通道数组。cvSetReal2D(Image, row, col, lbp);调用cvCreateImage函数创建头并分配数据。cvCreateImage(cvSize(m_cvImage-width, m_cvImage-height), 8, 1);4. 生成LBP灰度直方图调用Opencv自带的cvCalcHist(&image1,hist1,0,NULL);函数计算直方图。5. 记录参数值调用cvQueryHistValue_1D( hist1, h)将像素

50、分布数据调用出来,以便和库中图像的数据比对。6. 图像预处理图像土处理是将图像库中的图像依次提取LBP算子,生成LBP灰度直方图。将相应的数据存放到TXT文本中。为以后检索建立索引,提高检索速度。 3.4 图像检索算法灰度直方图(histogram)是灰度级的函数,它表示图象中具有每种灰度级的象素的个数,反映图象中每种灰度出现的频率。Opencv中自带有灰度直方图比较函数,但是由于先前将库中直方图数据存在了TXT文本中,所以采取直接计算两张图像欧式距离的办法比较简单。欧氏距离( Euclidean distance)也称欧几里得距离,它是一个通常采用的距离定义,它是在m维空间中两个点之间的真实

51、距离。 公式: (3.1)其中是欧式距离,是两个灰度直方图中点。然后按照两图像之间的欧式距离从小到达将图像输出。3.5 系统实现3.5.1 系统窗口本系统完成后的窗口如下图4.1 系统窗口3.5.2 系统主要算法(1) 通过选择文件读取的路径,选定一幅彩色图像,将图像读取进来用C+10实现的语句如下:str = filedialog-GetPathName(); CvSize src_cvsize;src_cvsize.width = rw;src_cvsize.height = rh;src = cvCreateImage( src_cvsize, Src-depth, Src-nChann

52、els);/构造目标图象cvResize(Src, src, CV_INTER_LINEAR);/缩放源图像到目标图像图4.1打开界面(2) 创建灰度图是作图像处理最基本的一部,因为很多图像的处理问题都要在灰度图或者是二值化图像上进行。由于摄像机抓拍到的图像均为24位真彩色图像,而大多数图像处理技术都是针对256级灰度图的,所以有必要将彩色图转化成灰度图。并且彩色图像是多光谱图像,而转换后的黑白图像是单色的灰度图像,其一个像素点用一个字节表示该点的灰度值,在图像处理时,灰度图像的处理速度比较快,所以一般处理图像先要把彩色图像灰度化。在程序中灰度化调用了Opencv的自带函数if (temp_i

53、mage-nChannels = 3)/对图像是不是灰色图像做了一个判断cvCvtColor(Image1, Image2, CV_BGR2GRAY);/转换彩色图像为灰度图像在这段代码中首先对图像是不是彩色图像进行了一个判断,如果是的,那么将图像灰度化。调用cvCvtColor函数的CV_BGR2GRAYK将Image1灰度化储存在Image2中。(3) 生成基本LBP算子主要代码如下所示:int center=0;int center_lbp=0;for (int row=1; rowheight-1; row+)for (int col=1; colwidth-1; col+)cente

54、r = cvGetReal2D(m_cvImage, row, col);center_lbp = 0;if (center = cvGetReal2D(m_cvImage, row-1, col-1)center_lbp += 1;if (center = cvGetReal2D(m_cvImage, row-1, col)center_lbp += 2; if (center = cvGetReal2D(m_cvImage, row-1, col-1)center_lbp += 1;value0=1;if (center = cvGetReal2D(m_cvImage, row-1, co

55、l)center_lbp += 1;value1=1;if (center = cvGetReal2D(m_cvImage, row+1, col+1)center_lbp += 1;value7=1;int i = 0; int j = 1;int count=0; while (j 3)center_lbp=9;/coutcenter_lbp3时,LBP算子=9,否则LBP算子等于前面累加所得。在这种算法下这个点的LBP算子=0,19。图4.5为像素点值放大25背后的结果。 图4.4原图 图4.5旋转不变LBP图(5)灰度直方图生成代码如下所示: int size=256; float r

56、ange=0,255;/直方图ranges取值 float* ranges=range; CvHistogram* hist1=cvCreateHist(1,&size,CV_HIST_ARRAY,ranges,1); cvCalcHist(&m_cvLBPImage,hist1,0,NULL); CvHistogram函数创建头并分配数据;cvCalcHist函数函数计算直方图。 图4.6基本LBP图灰度直方图 图4.7旋转LBP图灰度直方图(6)欧式距离计算string str2;double M,Sum=0;for(int h = 0; h 256; h+)/获得直方图中的统计次数dou

57、ble bin_val_a = cvQueryHistValue_1D( hist1, h );outbin_val_aendl;getline(in,str2);double bin_val_b=atof(str2.c_str ();Sum=Sum+pow(bin_val_a-bin_val_b,2);M=sqrt(Sum);if(MpN.m ) pN.m =M;pN.filename =str1;QuickSort(p,0,N);第4章实验结果及分析4.1基于Brodatz纹理图测试Brodatz纹理图像库是最常用的用来评价纹理特征性能的图像库之一。对Brodatz图像库中的111幅纹理图像,随机选出20副。每幅图像分割为16个不重叠的大小为160160的子图,构成一个包含320图像的图像库将该图像库中的任意一幅图像作为要检索的图像,那么来自同一幅的16幅图像(包括检索图像本身)理论上是检索结果中最相似的图像。设定检索反馈个数为24。采用平均查全率和查准率来评价检索性能。(中提到)系统开发完成后运行情况如

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!