基于Gabor小波的人脸特征提取算法研究及仿真本科毕业论文

上传人:痛*** 文档编号:146231170 上传时间:2022-08-30 格式:DOC 页数:50 大小:1.93MB
收藏 版权申诉 举报 下载
基于Gabor小波的人脸特征提取算法研究及仿真本科毕业论文_第1页
第1页 / 共50页
基于Gabor小波的人脸特征提取算法研究及仿真本科毕业论文_第2页
第2页 / 共50页
基于Gabor小波的人脸特征提取算法研究及仿真本科毕业论文_第3页
第3页 / 共50页
资源描述:

《基于Gabor小波的人脸特征提取算法研究及仿真本科毕业论文》由会员分享,可在线阅读,更多相关《基于Gabor小波的人脸特征提取算法研究及仿真本科毕业论文(50页珍藏版)》请在装配图网上搜索。

1、西南科技大学本科生毕业论文 Southwest university of science and technology 本科毕业设计(论文)题目名称:基于Gabor小波的人脸特征提取算法研究及仿真 50基于Gabor小波的人脸特征提取算法研究及仿真摘要:人脸识别技术是模式识别与人工智能的研究热点之一。在生物特征识别中,人脸识别占有极为重要的地位。它在访问控制、司法应用、电子商务和视频监控等领域都有广泛的应用。人脸特征提取是人脸识别过程的核心,特征提取的有效性直接影响到分类的速度和识别的性能。本论文的主要研究内容包括以下方面:(1)基于Gabor变换的人脸特征提取算法。通过对人脸傅里叶变换和G

2、abor变换的实验比较,证明了Gabor变换在提取人脸特征方面具有很大的优越性。接着,介绍了Gabor小波变换的快速算法。 (2)针对 Gabor小波的缺点,引进LBP算子,该算子的使用能有效的克服Gabor小波变换的缺点。另外还详细介绍了如何提取“特征脸”的原理和实现过程,对Gabor滤波器参数的选择问题也作了详细说明。(3) 针对Gabor和LBP提取的人脸特征向量维数过高问题,本文分别采用了LPP和PCA降维算法来进行降维。 (4)对最后提取的人脸特征通过计算特征向量的距离来量化查询图像和图像库中每幅图像间的相似程度。该部分主要是将提取出来的人脸特征向量进行验证,并对两种不同降维方法做比

3、较。本文最后是在orl和yale两个人脸图库做仿真实验。实验表明,采用用LPP降维得到的相似度要远高于使用PCA降维结果。关键词:人脸识别;Gabor小波变换;LBP;距离测度FacialfeatureextractionalgorithmresearchandsimulationbasedonGaborwaveletsAbstract:Face Recognition Technology(FRT)is emerging as an active research area in the field of pattern recognition and artificial intellig

4、ence.As a biometric technology,FRT has numerous applications such as access control,law enforcement,e-commerce,video surveillance and so on. Face feature extraction is the core of recognition task,which directly impact on classification velocity and face recognition ability.The main contributions of

5、 this work are listed as follows:(1)Face feature extraction algorithm based on Gabor transform is introduced.Compared with Fourier transform,Gabor transform is proved to be better in face feature extraction.And then,A fast algorithm of Gabor Transform is introduced. (2) According to the disadvantage

6、s of Gabor wavelet,This paper introduced LBP operator, the operator can overcome the f aults of Gabor wavelet transform effectively . Also it introduced the principle and realization process how to extract features face in detailed, and the selection of parameters of Gabor filter are detailed instru

7、ctions.(3) For the problem to the face feature vector high dimension in Gabor and LBP extraction ,this paper used the LPP and PCA dimension reduction algorithm reduced the dimension. (4) In the final face feature extraction ,By calculating the distance of the feature vector to look the similarity be

8、tween the image to inquire and each image in image database . This part is mainly to verify the extracted face feature vector , and to compare two different dimension reduction method .Finally, This paper do the simulation experiment in the orl and yale two face database . The experiment results sho

9、w that the LPP dimension reduction method is better than PCA dimension reduction method.Key words: Face recognition; Gabor wavelet transform; LBP; Distance measure 目 录第1章 绪 论51.1 课题的背景和意义51.2 当前人脸识别的国内外现状71.3 课题的总设计思路81.4 人脸特征提取的步骤及方法81.4.1 人脸图像的预处理91.4.2 基于Gabor小波算法进行人脸特征提取91.4.3 应用LBP算子10 1.4.4 采用

10、PCA和LPP对提取的特征向量降维,以提高识别时间101.4.5 用距离测度法度量相似度进行结果测试101.5 本章小结10第2章 Gabor小波变换112.1 引言112.2 Gabor小波变换的定义132.3 Gabor变换在人脸识别中的应用152.4 Gabor滤波器152.4.1 Gabor滤波器参数的选择192.4.2 Gabor滤波器的性质和计算方法192.4.3 Gabor变换的人脸特征提取202.5 Gabor快速算法图212.5.1 快速傅里叶变换(FFT)222.5.2 Gabor变换的快速算法242.6 本章小结25第3章 LBP算法、PCA和LPP降维算法263.1 引

11、言263.2 LBP基本算子26 3.2.1 改进的LBP算子273.3 PCA降维算法的实现原理283.3.1 PCA的基本概念293.3.2 PCA原理293.3.3 PCA算法303.4 LPP算子降维原理313.4.1 LPP算法降维实现原理313.5 本章小结32第四章 距离测度法度量相似度比较334.1 引言334.2 距离测量简介334.3 具体算法344.4 ORL人脸库实验分析354.4.1 算法的比较364.5 YALE人脸库实验374.6 本章小结38结 论39参考文献40致 谢42附录一43附录二46附录三47 第1章 绪 论1.1 课题的背景和意义在现在这个信息化的时

12、代中,身份识别技术的应用价值是非常重要的。随着网络技术的快速发展,信息安全也显示出前所未有的重要性。在电子商务、金融信息、司法安全、网络传输等各个应用领域,都需要精确而唯一的身份鉴定1。然而,如今的身份识别主要依靠身份证、工作证和密码手段来鉴定一个人的身份。这些手段具有诸多缺点:如不便携带、易丢失、易损坏最后导致不可识别;而密码手段的缺点更加凸显:不便记忆,易被破解等。近年来,由于电子商务的迅猛发展,伪造制假的手段也是越来越先进,传统的身份识别方法受到了严峻的挑战,对于科技的发展和社会的进步显得有点跟不上脚步。 生物特征识别技术(Biometrics)以其唯一性、高可靠性和稳定性成为了人们争相

13、研究的热门技术。所谓生物特征识别2,就是根据不同人之间的身体(physical)的或者行为(behavioral)的特征的独特性,来唯一地把未知身份识别出来。身体特征包括:指纹、视网膜、虹膜、人脸等;行为特征包括签名、声音、步态等。有的识别是几种特征的结合,如身份识别可以结合人脸和指纹两个特征。人脸识别是身份识别技术的一种,它在身份识别领域的发展和应用方面都有着重大意义:一是可以推进对人类视觉系统本身的认识;二是可以满足人工智能应用的需要。采用人脸识别技术,建立自动人脸识别系统,用计算机实现对人脸图像的自动识别有着广阔的应用领域和诱人的应用前景。而人脸特征提取又是人脸识别技术当中最重要的步骤,

14、可以这么说,人脸特征提取的优劣直接影响到人脸的识别率。人脸本身的采集方式多样,既可以是静态图像,也可以是动态图像。通常我们辨别一个人是通过我们的眼睛观察这个人的脸部特征,恰好人脸识别和人们通常的识别相符合,所以很容易被接受。因此,人脸识别及其相关技术的应用前景也是生物特征识别诸多技术中最被看好的。生物特征识别在国外起步早,也发展很快2 。而我国在这方面就起步稍晚,不过发展却是极为迅速。人脸识别是我们日常生活中必不可少的技能,是我们辨认一个人采用的最普遍的生物特征识别方法。人脸识别相对于其它的生物特征识别技术来说,具有以下独特优势:(1)友好、直观和方便。人脸识别由于十分符合人们的习惯,人们很容

15、易接受和不会让人感觉有障碍;(2)对用户不会造成不必要的干扰。因为人脸识别不需要与相关设备直接接触,也不需要被测试者需要特定的行为,在这一点上它是区别于其他任何生物特征技术的;(3)对拍摄设备无要求。只要能照相的设备,手机相机皆可,由于这些设备目前已普及,故为人脸识别的广泛应用提供了有力的基础和保障;1.2 当前人脸识别的国内外现状 在当今这个信息化的时代,人脸识别系统在很多领域都有举足轻重的作用,尤其是用在司法机关、网络信息安全、司机驾照验证和事业单位的考勤等。 前面有说道:虽然我国这方面起步比较晚,但是在这方面发展却是非常快的。截至目前,我过在这方面也取得了一定的成就,08年的北京奥运会就

16、正式启用了中国自主产权研发的人脸识别系统。另外,由中科院计算所高文教授主持的国家863项目“面像检测与识别核心技术”也通过成果鉴定,并初步应用,这也就标志着我国在人脸识别这一当今热点科研领域掌握了一定的核心技术。该系统会自动在人脸上选取103个点,然后通过分析面部皮肤反射属性、三维结构等特征进行识别,在静态场景下识别准确率会达到96.5。 其实在早前,北京科瑞奇技术开发股份有限公司在2002年开发了一种人脸鉴别系统,对人脸图像进行处理,排除外界因素,再对图像进行特征提取和识别。这对于人脸鉴别特别有价值,因为人脸鉴别通常使用正面照,要鉴别的人脸图像是不同时期拍摄的,使用的照相机不一样。系统可以接

17、受时间间隔较长的照片,并能达到较高的识别率,在计算机中库藏2300人的正面照片,每人一张照片,使用相距1-7年、差别比较大的照片去查询,首选率可以达到50%,前20张输出照片中包含有与输入照片为同一人的照片的概率可达70%。 在国外,人脸识别起步就比较早了。最早的自动人脸识别研究论文是 1965年 Chan&Bledsoe 在 Panoramic Research Inc 发表的技术报告,但是由于当时的技术条件有限,所以取得的成就并不是很显著。而70年代时,美、英等发达国家就已经开始重视人脸识别的研究了,并取得了一定的成绩。 从1990年代起,由于社会的发展,加上人们对人脸图像自动识别的迫切需

18、求,越来越多的外国科研单位开始着手研究,因此人脸模式识别方法有了较大的突破。1996年美国军方更是组织了人脸自动识别系统大赛,获得冠军的是勒克菲勒大学的Face1t系统。由此可见,外国的在这方面要比中国早很多,也成熟很多。最近,美国的LAU公司研制的人脸图像自动识别系统,是按照平常人们的生活习惯(即人眼辨别人脸)的原理,基于生物测量学、人像复原技术开发的装置。用人脸1242个特征点,对人群中寻找的人进行定量定性识别,已经用在机场、火车站等公共场所和重点控制地区。另外,国外的一些高校在这方面也取得了显著的成就,主要是以麻省理工大学(Massachusetts Institute of Techn

19、ology )、卡内基梅隆大学(Carnegie Mellon University)和英国的雷丁大学(University of Reading)等为首。而公司(Visionics 公司Facelt人脸识别系统、Viiage的FaceFINDER身份验证系统、Lau Tech 公司Hunter系统、德国的BioID系统等)他们的工程研究工作主要放在公安、刑事方面,在考试验证系统的实现方面深入研究并不多。1.3 课题的总设计思路 本设计是基于MATLAB平台实现的人脸特征提取。系统原理框图如图1所示: 图1 系统原理框图 从系统框图我们可以知道,人脸特征提取的步骤如下:1)、从图库中读取一张图

20、像,并且对选取图像进行预处理;2)、根据需要设计Gabor滤波器参数,并对处理后的图像进行多方向和多尺度的进行滤波;3)、先对得到的不同方向Gabor对得到的Gabor滤波图像分别进行LBP运算得到纹理图像特征;4)、然后分别用LPP和PCA对得到纹理图像特征向量进行降维;5)对降维得到的人脸特征向量用距离测度度量相似度进行测试。1.4 人脸特征提取的步骤及方法Chellappa给出的人脸识别定义是,给出静态或者视频图像,将其中的一个或多个人脸和存储于数据库中的人脸相比较,确定出图像或视频中各个脸的身份。一般要在输入之前对图像进行预处理,若有人脸存在,则将其从背景中分割出来。一般来说,一个完整

21、的人脸识别系统包括。图像输入、人脸检测/定位、预处理、特征提取、分类器5部分。1.4.1 人脸图像的预处理 在现实情况下,我们所提取的人脸图像可能绝大多数都不是标准格式的,不仅如此,可能还会受到各种各样的因素影响,进而导致最终的人脸识别准确率不是那么高,为了尽可能的减小甚至消除这些情况对人脸识别的影响,故而在人脸特征提取之前需要进行人脸图像的预处理。该步骤主要是对输入的人脸图像进行预处理,目的是消除其他因素的影响,改善图片质量,统一图像的灰度值及尺寸,为以后的特征提取和人脸分类识别打好基础。一般情况下人脸都处在一个复杂背景中,所以预处理的时候要先进行人脸检测,将人脸部分从复杂背景中检测提取出来

22、,由于本文的研究内容只是人脸特征提取部分,故而没有人脸图像预处理部分,而是直接采用已预处理好的ORL和YALE人脸图库。1.4.2 基于Gabor小波算法进行人脸特征提取 人脸特征提取就是采用某种方法来表示人脸局部特征,当然采用的方法不同,所提取的人脸信息也有所不同。 本文研究的基于Gabor小波变换的人脸特征提取的理论依据:任意可以用高斯函数调制的复正弦形式表示的信号都可以达到时域和频域联合不确定关系的下限。也就是说,可以再时域和频域获得最佳的分辨率。 Gabor滤波器对人脸图像的响应特性主要体现在边缘、亮度和位置3方面的特征。图像的局部灰度值的突变反映的是边缘特征,输入信号和滤波器信号叠加

23、的结果就是卷积计算的输出,当输入信号的变化与滤波器信号的变化相一致时,输出较强,反之亦然。而当图像的边缘特征方向与二维Gabor滤波器纹理特征方向一致的时候,二维Gabor小波变换有较强的响应,如眼睛,鼻子等部位Gabor响应输出较为强烈。通过修改Gabor函数的参数sigma,theta,可以获得不同中心频率,不同方向上的Gabor滤波器,从而提取到不同尺度和不同局部细节的纹理图像特征。最后考虑到Gabor小波变换不能旋转的缺点,故之后用LBP算法将Gabor滤波图像再分别进行特征提取,再将得到的图像分为互不重叠的区域,分别对各个区域建立LBP直方图信息,再将各个尺度下的LBP直方图特征进行

24、组合匹配连接起来,构成人脸图像的特征向量。其实在这里对于Gabor小波变换的人脸特征提取基本上已经结束,但是考虑到这样提取出来的特征向量维数会比较高,计算起来需要用到的时间会很长。所以在最后用到了PCA和LPP对提取的特征向量进行降维,以提高识别时间。1.4.3 应用LBP算子 在Gabor滤波后再分别进行LBP特征提取,是因为LBP作为一种纹理描述方法,能够有效地反映人脸图像的局部特性,也是为了更有效的解决旋转变化、光照变化和尺度变化等图像分类问题,这也是本设计的创新点。 1.4.4 采用PCA和LPP对提取的特征向量降维,以提高识别时间 PCA(Principal Component An

25、alysis,主成分分析)是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。 LPP(Locality Preserving Projection,局部保局投影)作为拉普拉斯特征映射的一种线性逼近可以较好的反映样本的流形结构,已经被广泛的应用到图像检索和图像修复中。局部保持投影(LPP)是比较经典的线性方法,着重关注于数据的局部关系。 1.4.5 用距离测度法度量相似度进行结果测试在完成人脸特征的提取后,本设计还没有最终完成,因为我们还需要检测我们提取的人脸特征是否准确完善。在这里我使用距离

26、测度法来度量相似度进行结果检测。现有比较成熟的距离测度方法主要有以下几种,如Minkowsky 距离(明氏距离)、Euclidean 距离(欧氏距离)、Mahalanobis 距离(马氏距离)和Hausdorf距离等。本设计将选用欧式距离测度法来度量人脸相似度进行结果检测,原因在于欧式距离在一定程度上放大了较大元素误差在距离,应用广泛。1.5 本章小结 本章主要介绍了此次课题研究的背景和意义、国内外在这方面的研究现状,针对目前面对的技术难题,提出了本课题的研究内容和技术思路,在概述本文主要工作的同时给出了文章的结构。 第2章 Gabor小波变换2.1 引言Gabor展开是一种同时用时间和频率表

27、示一个时间函数的方法,而求解Gabor展开系数的公式被称为Gabor变换。传统的Gabor变换的缺点是窗口尺寸一经确定就无法更改,因此不具有变焦特性,无法对信号进行多分辨率分析。为解决这一问题人们将Gabor理论同小波理论相结合,提出了Gabor小波。Gabor小波具有小波变换的多分辨率特性,同时具有Gabor函数本身所具有的局域性和方向性。 标准傅立叶变换是数字信号处理的有利工具,然而它只能反映信号在整个实轴的整体性质,而不能反映信号在局部时间范围中的特征。对于图像,我们关心的往往是局部的特征,如图像边缘,由于标准傅立叶变换不能同时在时域和频域具有对信号的局部分析能力,Dennis Gabo

28、r于1946年在他的论文中,为了提取信号傅立叶变换的局部信息,引入了一个时间局部化“窗函数”,其中参数用于平移动窗以便覆盖整个时域。实际上,Gabor使用了一个Gaussian函数作为窗函数。因为一个Gaussian函数的傅立叶变换还是一个Gaussian函数,所以傅立叶逆变换也是局部的。Gabor变换是唯一能够达到时频测不准的下界的函数,是图像表示中一种较好的模式,它的最大优点在于它能够达到交叉熵的最低边缘,能够最好地兼顾信号在时域和频域的分辨率,而且人类的视觉系统对于这种函数有非常好的匹配特性。Gabor函数的这些特性,使得它在信号处理中获得广泛的应用,特别应用于低级视觉如纹理分割、光流估

29、计、数据压缩和边缘检测等。Gabor变换虽然在一定程度上克服了标准傅立叶变换不具有局部分析能力的缺陷,且能最好地兼顾信号在时城和频域地分辨率,但它同时也存在着自身不可克服的局限,即当窗函数确定后,窗口的形状就确定了,因此Gabor变换是一种单一分辨率的分析。 目前Gabor变换和Gabor展开已被公认是信号与图像表示的最好的方法之一。Gabor变换中要解决的最基本问题是:在给定综合窗下如何求解分析窗及Gabor变换系数。Gabor变换广泛应用的困难也就是在于找不到一种简单的计算变换系数的方法,因为Gabor基本函数彼此之间互不正交。近十几年来,围绕这一问题国内外相继提出了很多解决方法,最主要的

30、有以Bastiaans、Wexler和Qian等人为代表的解析法,Daugman等人提出的神经网络方法以及Ibrahim等人提出的自适应学习算法等等。但不论上述哪一种方法,均为复数形式的Gabor变换。Gabor基本函数、Gabor展开系数、双正分析窗函数求解的约束条件式及Gabor展开式都是复数形式,计算量很大。为了简化Gabor变换的计算,提出了一种实数形式的离散Gabor变换(RDGT)方法,这种方法类似于复数形式的离散Gabor变换的解析理论体系,并可采用快速的离散Hartley变换算法计算Gabor变换系数,尤其是实数形式的离散Gabor变换系数与复数形式的离散Gabor变换系数的实

31、部和虚部有着非常简单的加减关系,因此前者的计算完全可以替代后者的计算,从而达到大大减小Gabor复变换系数计算量的目的;同样,在信号的重建方面,实数形式的离散Gabor逆变换也比复数形式的离散Gabor逆变换快得多,并且在实际应用中,实值Gabor变换更方便于软件和硬件的实现。2.2 Gabor小波变换的定义 由于Fourier变换存在着不能同时进行时间和频率局部分析的缺点,1946年Gabor提出了一种加窗的Fourier变换方法,它在非平稳信号分析中起到了很好的作用。在Fourier变换中,把非平稳信号过程看作是一系列短时平稳信号的叠加,而短时性是通过时间上加窗来实现的。整个时域的覆盖是由

32、参数的平移达到的。换句话说,该变换是用一个窗函数与信号相乘实现在附近开窗和平移,然后施以Fourier变换,这就是Gabor变换也称短时Fourier变换或加窗Fourier变换。Gabor变换的定义由下式给出:对于, (2-1) 其中是积分核。该变换在点附近局部测量了频率为的正弦分量的幅度。通常选择能量集中在低频处的实偶函数;Gabor采用高斯(Gauss)函数作窗的函数,相应的Fourier变换以后仍旧是Gauss函数,从而保证窗口Fourier变换在时域和频域内均有局部化功能。令窗口函数为,则有 (2-2) 式中a决定了窗口的宽度,的Fourier变换用表示,则有 (2-3) 由以上可以

33、得到 (2-4) 显然,信号经过Gabor变换按窗口宽度分解了的频谱,提取出它的局部信息。当在整个时间轴上平移时,就给出了Fourier的完整变换。相应的重构公式为: (2-5) 窗口Fourier变换是能量守恒变换,即 (2-6) 这里应注意,积分核对所有和都有相同的支撑区,但周期数随而变化。支撑区是指一个函数或信号的自变量的定义域,当在定义域内取值时的值域不为零,在支撑区之外信号或过程下降为零。 为了研究窗口Fourier变换的时频局部化特性就要研究和的特性。这里是的Fourier变换。由于Fourier变换是能量守恒的,所以有Parseval定理存在。即: (2-7) 这里的和分别是和的

34、复共轭函数,当为实数时,两种表示是相等的。如果把上述函数乘积的积分运算用内积符号表示,则有 (2-8) 其中和都是在实数域的平方可积函数。由此: (2-9) 当时有: 其中叫做的范数。这一表达式的物理意义是Fourier变换的时域和频域的一对共扼变量具有对易关系,从而使Fourier变换与加窗口的Fourier变换具有对称性。如果用角频率变量代替时间变量,用频域窗口函数代替时域窗口函数则可得到: (2-10) 这里是时域窗口函数的Fourier变换。该式的意义在于频域中的信号通过窗口函数的加窗作用获得了在频域附近的局部信息即: (2-11) 如果选用窗口函数在时域和频域均有良好的局部性质,那么

35、可以说Fourier变换给出了信号的局部时一频分析。这样就有利于同时在频域和时域提取信号的精确信息。2.3 Gabor变换在人脸识别中的应用 Campben和Robson提出并在心理学实验中证实,人类的视觉具有多通道和多分辨率的特征,因此,近年来基于多通道、多分辨率分析的算法受到广泛重视11。在诸如信号检测、图象压缩、纹理分析、图象分割和识别等领域,Gabor小波得到了非常广泛的应用。大量基于简单细胞接受场的实验表明,图像在视觉皮层的表示存在空域和空频域分量,并且可以将一幅图像分解为局部对称和反对称的基函数表示,Gabor函数正是这种基信号的良好近似。Lee.T.S用ZD一Gabor小波来表征

36、图像,将Daubeehies的一维框架理论拓展到二维,并证明在一定条件下,ZD一Gabor小波是紧框架,原图像能从小波系数重建,因此用小波变换的系数幅值作为特征来匹配有着良好的视觉特性和生物学背景,Gabor小波的这些特性使得其对于亮度和人脸表情的变化不敏感,在人脸识别和图像处理中有着广泛的应用。Lades等首先提出用基于Gabor变换的弹性图匹配算法进行人脸识别。节点上的Gabor滤波响应作为人脸特征,通过特征匹配和节点几何位置的匹配实现人脸识别。2.4 Gabor滤波器 在实验室中我们用的最多的是Gabor滤波器。根据Gabor变换的原理和实际需要,可构造不同的Gabor滤波器。Gabor

37、滤波器在图像处理中的特征提取、纹理分析和立体视差估计等方面有许多应用。有研究表明神经细胞的感受也可以用Gabor函数来表示。Gabor滤波能够体现出不同的方向性和尺度性。Gabor函数从实质上来说是一个Gauss函数窗所限制的滤波函数。通过定义不同的Gabor函数核,就可以得到一组Gabor滤波器。Gabor核函数的定义: (2-12) Gabor滤波可以定义为: (2-13)下面我们对式(2-12)中的各项参数作一个说明:是一个振荡函数,实部为余弦函数,虚部为正弦函数。是Gauss函数,这实际上是通过加窗限制了函数的范围,使其在局部有效。由Gauss函数的局部性可知,这个滤波器实际上抽取x附

38、近的特征,因此可以看作是一种Gabor小波。是直流分量,这样滤波器就可以不受直流分量大小的影响。向量描述了滤波器对不同方向和不同尺度的响应,通过选取一系列的,就得到了一族Gabor滤波器,是一个常量,和一起刻画了Gauss窗的波长。这里取=/2,可以表示为: 这里 (2-14)选取不同的下标可以描述不同的Gauss窗波长,从而控制采样的尺度。选取不同的下标可以描述振荡函数不同的振荡方向,从而控制采样的方向。我们这里选取=0 ,1,2这样可以在3个不同的尺度上采样。选取=0 ,.,3这样就可以在4个不同的方向上采样13。各个滤波器窗口的大小为3232,确定滤波器的所有参数(可自己决定)后,当采取

39、上述的参数后,可得如下图2.1的12个滤波器(图片源代码详见附录一)。 图2.1 Gabor 3个尺度4个方向的滤波器 另外,Gabor函数是唯一能够达到空域和频域联合测不准关系下界的函数,用Gabor函数形成的二维Gabor滤波器具有在空间域和频率域同时取得最优局部化的特性,因此能够很好地描述对应于空间频率(尺度)、空间位置及方向选择性的局部结构信息,下面图2.2、2.3、2.4是Gabor滤波器的原图特性、空域特性和频域特性(源代码详见附录二): 图2.2 Gabor滤波器原图特性 图2.3 Gabor滤波器原图的空域特性 图2.3 Gabor滤波器原图的频域特性2.4.1 Gabor滤波

40、器参数的选择由于不同,u代表了不同的采样方式,因此需要保证在不同的尺度和不同方向上的采样尽量均匀。一些研究表明0, 区间可以描述所有的方向,因此只需对区间0, 进行采样。也就是说:+方向上的滤波完全可以由方向的结果确定。由于的变化是连续的,不可能取无穷多个,必须对其进行离散均匀采样。因此这里我们选取作为采样间隔,反映了空间尺度上采样。由于尺度的大小实际上决定于Gauss窗的大小,而其窗长正比于,由于是在二维上的采样,因此其面积正比于。为了反映尺度上的合理采样,实验表明每次采样的面积成倍的方式递减比较合理,是一个常量,这就要求。Gabor滤波器利用公式定义的卷积,就可以在图像每个不同的处得到个不

41、同复值的滤波结果12。2.4.2 Gabor滤波器的性质和计算方法(1)Gabor滤波器的性质 Gabor滤波器具有生物学的意义。Gabor核函数与脊椎动物大脑视觉区域皮层细胞的感受行状十分类似。 Gabor滤波器能充分描述图像的纹理信息。Gabor滤波特性说明了Gabor滤波结果是描述图像局部灰度分布的有力工具。因此,图像的纹理信息可以用Gabor滤波作为特征抽取的方法。 对二维Gabor滤波的研究表明,通过恰当选择若干个Gabor核函数可以重构出原图像。 Gabor核函数由于去掉了直流分量,对局部光照影响不敏感。这和直接将图像的灰度特征作为模板相比,优势是很明显的。 Gabor滤波结果可以

42、描述不同方向上灰度的分布信息。 Gabor滤波结果可以描述不同尺度上灰度的分布信息。一般来说,大尺度滤波可以描述全局性较强的信息,同时可以掩盖掉图像中噪声的影响,而小尺度滤波可以描述比较精细的局部结构,受噪声影响也大。 核函数有良好的频域特性。Gabor核函数在频域内的形状和空域内的形状完全相同。 Gabor滤波可以容忍图像有一定的平移、旋转、深度上的转动、尺度变化等情况。 (2)Gabor核函数的计算方法由于输入的图像为灰度图像,这就是直接的离散化表示。从Gabor核函数的定义公式可以看出,由于Gauss窗函数的限制,Gabor核函数只在一个局部非零,因此我们只需要对其局部进行离散抽样即可。

43、抽样范围的大小由Gauss窗的大小所确定,这里我们取作为抽样半径。2.4.3 Gabor变换的人脸特征提取 根据以上分析,我们知道Gabor变换在人脸特征提取方面具有很多优点,前面定义的Gabor小波是一组带通滤波器,通过参数的选择,每一组滤波器具有各自的频率选择性和方向选择性,这样不同方向和尺度的滤波器覆盖整个频域,从而一幅人脸图像的Gabor特征表示就是该图像和一族Gabor小波卷积的结果。 假设表示一幅图像的灰度分布,则其Gabor特征表示为: (2-15) 其中,是Gabor核函数,是尺度,方向的Gabor小波卷积结果。在这里,我们选用3个尺度4个方向的Gabor小波,即0 ,.,2,

44、0,.,3,其于参数设为以及为了包含不同的空间尺度和方向的Gabor滤波特征,一般将一幅图像的所有尺度方向Gabor滤波变换表示成一个级联的特征矢量。由于一般图像的维数比较高,直接将所有尺度、方向的Gabor小波变换特征级联会导致维数大而难于处理,因此有必要对图像的各个Gabor小波表示进行下采样处理,假设下采样因子为,则一幅图像的特征矢量为: (2-16) 从特征提取的角度出发,对人脸图像的不同尺度不同方向的Gabor滤波可以认为是提取了人脸图像具有不同性质的特征,因此对于本文所采用的3尺度4方向的Gabor小波,可以认为其对人脸图像的滤波得到了12组具有不同性质的特征矢量,一般都将这12组

45、特征矢量简单级联成一个长特征矢量,然后在对该特征矢量进行学习和识别分类,而不考虑各组特征矢量的有效性问题,即哪些尺度和方向的Gabor滤波特征更能反应人脸之间互相区别的本质特征。以下是Gabor变换人脸提取特征的流程图: 图2-2 Gabor变换人脸提取特征流程图 根据以上流程图编写的程序可以得出一幅经过Gabor小波变换后的人脸特征图像,如图2-3: 图2-3 ORL人脸原图和经Gabor提后的图片2.5 Gabor快速算法图 前面我们通过实验分析了Gabor变换在人脸特征提取中的重要作用,在这一章中,我们就着重介绍Gabor的快速算法。由于我们所说的Gabor变换的快速算法是基于傅里叶快速

46、算法而来的,所以我们先介绍傅里叶快速算法。离散傅里叶变换(DFT)在信号的频谱析、系统的分析、设计和实现中得到了广泛的应用,原因之一就是计算DFT有很多的快速算法,快速傅里叶变换(FFT)算法就是其中之一。在使用数字信号处理技术的各种各样的应用领域里,FFT算法都起着极为重要的作用。设为N点的有限长序列,则其正变换DFT为: (2-17) 逆变换OFT为: (2-18) 通常我们用算法所需的乘法和加法运算次数,来衡量各种算法的复杂性和效率。这里的通常都是复数,于是整个DFT运算就需要N2次复数乘法和N(N-1)次复数加法。因此,直接计算DFT,乘法和加法的次数都与N2成正比。 当N较大时,计算

47、量太大,无法得到实际的应用。2.5.1 快速傅里叶变换(FFT) 自从1965年图基(J.W.Tuky)和库利(T.W.Coody)在计算机数学(Math.Computer,Vol.19,1965)杂志上发表了著名的机器计算傅里叶级数的一种算法论文之后桑德(G.Sand)、图基等快速算法相继出现,又经人们进行改进,很快的形成一套高效运算方法,这就是现在的快速傅立叶变换,简称FFT,这种算法使DFT运算效率提高1-2个数量级,为数字信号处理技术应用于各种信号的实时处理创造了良好的条件,大大推动了数字信号处理技术的发展。 快速傅里叶变换的算法有很多,主要的算法有: 时间抽取(DIT)基-2FFT算

48、法。这种算法是将输入序列在时域上的次序按偶数和奇数来抽取,对于任意一个N =2M点长序列的DFT运算,可以采用M次分解,最后分解成2点的DFT运算的组合,从而降低了运算量。DIT的运算量为: 复数乘法次数:Mp=(N/2)M=(N/2)log2N 复数加法次数:ap=Nlog2N (1)频域抽取(DIF)基2FFT算法。与DIT算法相对应,DIF算法是把频域输出X(k)按k是偶数或是奇数,逐级分解成2点的DFT运算,其原理与DIT算法相对偶,运算量也与DIT算法的相同,这里不再赘述。 (2)N为复合数的FFT算法。这是统一的FFT算法,而前面的DIT算法、DIF算法不过是在输入序列的列长为N=

49、2的统一FFT算法的特例而已。这种算法是把DFT的运算通过分解成很多短长度的DFT来完成的.如果能分解成4点或2点的DFT,因不需要乘法,可减少旋转因子的数量,运算量更少。N为复合数时的FFT算法,采用下标映射是个关键,然后再分别对列(或行)和行(或列)求小点数长度的DFT,并用旋转因子做各小点数DFT间运算的媒介,但这同时也带来了运算量的增加。 若复合数N=LM,则其FFT的运算量大致为: 复数乘法次数:N(M+L+1) 复数加法次数:N(M+L-2) 分裂基FFT算法(SRFFT)。这是一种利用将基-2和基-4于变换的不同部位,进一步改善固定一基和混合一基的算法,其基本思路是对偶序号输出使

50、用基-2算法,对奇序列输出使用基-4算法,将大点数的DFT逐级分解成小点数的DFT运算。由于分解的不对称性,算法结构比固定-基算法稍微复杂一些,是目前针对N =2M的算法中具有最少乘法和加法次数的,又允许以同址计算和蝶形方式实现,所以被认为是最好的快速傅里叶变换算法。其运算量为: 实数乘法次数:Nlog2N-3N+4 实数加法次数:Nlog2N-3N+4(3)素因子算法(PFA)。当复合数N可以按照Good映射分解为几个互素因子的乘积时,其FFT变换就可以避免旋转因子的影响。PFA算法就是采用了Good映射,将长度为N=N1*N2的一维DFT转换成尺寸为N=N1N2的二维DFT,然后以行列方式

51、沿每一维采用最有效的算法计算这个二维的DFT。该算法的运算量为:乘法次数:m(N)=N2m(N1)+N+N1*m(N2)其中m(N)表示计算N点DFT需要的总乘法次数。 (4)Winograd傅里叶变换算法(WFTA)。该算法利用了Good映射将长度为“大N”因子的DFT分解成若干“小N”因子的连乘,再利用“小N”因子的DFT,就可以得到“大N”因子的DFT。“小N”因子的DFT是指2,3,4,5,7,8,9和16点的DFT。WFTA算法结构比FFT复杂的多,程序编译的时间也长,但运算速度比较快。WFTA算法被证实为具有最少的乘法和加法次数的算法,该算法除了用到下标映射外,还涉及到数论和近代数

52、的知识。 (5)实序列的FFT。对于输入为实数序列的FFT没有必要专门编写实数据的FFT,而是直接利用复数据FFT进行计算。利用DFT奇偶对称性质,可以用一个N点的FFT同时运算两个N点实序列,或者是用一个N点的FFT运算一个2N点的实序列。前者是把一个实序列作为实部,同时另一个实序列作为虚部,计算FFT后再把输出按奇、偶、虚、实特性加以分离,后者是将2N长的实序列的偶序号置为实部,奇序号置为奇部,同样在计算FFT后再加以分离。用一个N点的FFT运算一个2N点的实序列的运算量为: 乘法次数:m2f=N/2(4+log2N) 加法次数:a2f=N(4+log2N)主要有4类计算二维FFT的方法。

53、即行一列算法、矢量一基算法(VR)、嵌套算法、多项式变换算法。行一列算法实现最容易,仅要求有效的一维FFT算法即可。而多项式变换因为具有最低的算术复杂性,同址计算的可能性和实现工作量不大的优点,受到人们的普遍重视。二维FFT的一个重要参数是考虑存储器的存取次数。更高维的FFT变换可以类似得到,但在实际应用中采用的不多。2.5.2 Gabor变换的快速算法 我们只要把Gabor变换转换成傅立叶形式,根据FFT快速算法将乘法转换成加法就可以了。下面我们对其做具体的介绍。DFT的卷积公式定义如下: 若,DFT=X(),DFT=H(),则 =IDFTX()H(),但是,我们需要注意的是:进行的是循环卷

54、积,循环卷积的定义如下:其中: 表示的圆周移位序列, 其实质上与的含义类似。从直观上说,就是对两个卷积的函数重叠部分以外都用周期延拓的方式填充。 线性卷积的定义如下:从直观上说,就是当两个卷积的函数重叠部分以外都用零填充。在实际中我们提取特征需要的是线卷积的结果。如果将序列和都适当的补零,设长度为I,长度为M,则当我们将和都补零到长度为时,圆卷积和线卷积结果相同。在实际实验中,我们将滤波器组和图像都补零到256,这样可以满足上面的补零要求。在这种情况下,对于一幅图像,如果我们的滤波器组是事先计算好的,则只需要进行1个FFT(对图像),40个乘法(图像FFT的结果与滤波器相乘),40个工FFT(

55、对相乘结果进行)。同时256是2的8次幂,2D-FFT的计算复杂度为N2log2N。由此,复杂度大大减少。2.6 本章小结本章主要介绍了Gabor小波变换的具体原理和实际应用,及用于人脸识别的具体算法。事实上,Gabor小波变换最主要就是一个滤波器设计的问题,通过采取不同的方向和尺度,不同的波长和频率,就可以得到不同的滤波器,本文为了减少程序的运行时间,暂时采用了3尺度,4方向的Gabor小波,同时取,可以认为其对人脸图像的滤波得到了12组具有不同性质的特征矢量,一般都将这12组特征矢量简单级联成一个长特征矢量X,然后在对该特征矢量X进行学习和识别分类,由于一般图像的维数比较高,直接将所有尺度

56、、方向的Gabor小波变换特征级联会导致维数大而难于处理,因此有必要对提取的出来的Gabor人脸特向量进行降维,以减少它的运算量。 第3章 LBP算法、PCA和LPP降维算法3.1 引言 Ma和Manjunath对提取图像纹理特征的不同小波变换方法进行了比较分析 ,得到结论是Gabor小波变换方法的分类效果较好,但这个结论是在假设纹理图像具有相同或大致相同方向的前提下得到的,这种假设在实际应用中往往是很不现实的因为纹理特征对图像尺度、方向的变化具有敏感性,会对图像分类效果产生很大的影响。在实际应用中,方向的选择总是离散的,而图像目标的旋转是比较随意的,传统的二维Gabor小波变换具有方向选择性

57、,不具备旋转不变性。为了解决旋转不变性问题,本文引用了LBP算法,LBP算子是一种有效的纹理图像描述算子,由于它具有旋转不变性和灰度不变性等显著优点, 已经广泛地应用于纹理分类、纹理分割、人脸图像分析等领域。而经过Gabor和LBP运算后,我们发现提取出来的特征向量维数非常高,不便于最终的人脸识别,故而我们在后面又分别加入了PCA和LPP算法。PCA和LPP都是当前时期人们常用的降维算法。PCA的核心思想是利用较少数量的特征对样本进行描述以达到降低特征空间维数的目的。而LPP的思想是通过一定的性能目标函数来寻找线性变换矩阵,以实现对高维数据的降维。3.2 LBP基本算子 局部二元模式(LBP)

58、算子能够有效地描述图像的纹理信息,最早由Ojala 等提出,它通过比较灰度图像中任意一点的灰度值与其邻近点的灰度值之间的大小关系来进行纹理特征的提取。该算法原理简单并且对光照变化和局部变换有一定的鲁棒性,能够与全局特征相整合从而提高识别分类的精度,同时具有一定的抗旋转、抗亮度变化等优点【44】。在近10年来,LBP 算子已经被广泛地应用于图像检索、人脸图像分析、图像内容识别和纹理识别等领域,都取得了不错的效果47,48。 最初的 LBP算子是将33矩阵中的中心灰度值与其邻域中的8个灰度值进行比较判决46-49,对于一幅图像中的某区域内的任意像素点f(xc, yc),以其为中心点gc,对和其邻近

59、的8 个点g0, g1,., g7的纹理T 定义为: T (g0 gc, g1 gc,., g7 gc) (3.1)以区域中心点的灰度值为阈值对区域内其它邻近的像素作二值化处理,邻域中的灰度值大于或等于中心点灰度值的子块为1,反之为0。 T t(s(g0 gc), s(g1 gc),., s(g7 gc) (3.2)其中, (3.3)33的矩阵区域经过LBP运算后按照一定的次序排列,形成了一个8 位的二进制数,再按照式(3.1)对像素的不同位置进行加权求和,即可得到该窗口的LBP 值,明显地可看出每个窗口的LBP 值范围在0-255 之间。 (3.4)一个基本的LBP 算子如图3-1 所示: 图3.1 基本的LBP算子3.2.1 改进的LBP算子 基本的 LBP算子的窗口大小为33,无法提取尺度较大结构的纹理特征,为了改善这一局限性,Oja

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!