人脸识别技术研究(毕业论文)

上传人:沈*** 文档编号:99785926 上传时间:2022-06-01 格式:DOC 页数:55 大小:552KB
收藏 版权申诉 举报 下载
人脸识别技术研究(毕业论文)_第1页
第1页 / 共55页
人脸识别技术研究(毕业论文)_第2页
第2页 / 共55页
人脸识别技术研究(毕业论文)_第3页
第3页 / 共55页
资源描述:

《人脸识别技术研究(毕业论文)》由会员分享,可在线阅读,更多相关《人脸识别技术研究(毕业论文)(55页珍藏版)》请在装配图网上搜索。

1、49 / 55摘 要 人脸识别是一个具有很高理论和应用价值的研究课题.人脸是人类视觉中最为普遍的模式,它所反映的视觉信息在人与人的交流和交往中有着与其重要的作用意义.人脸的特殊性,使得人脸识别技术成为最具潜力的身份识别方式.人脸识别技术应用广泛,并且日益受到人们的广泛关注并成为模式识别领域研究的热点.同时人脸识别又是一个复杂和困难的课题,其原因有:人脸是由复杂的三维曲面构成的可变形体,难以用数学描述;所有的人脸结构高度相似,而人脸图像又易受年龄和成像条件的影响.人脸识别涉与的技术很多,其中关键的是特征提取和分类方法,本文就以此为重点进行了相关研究. 主要工作包括以下几个方面:1在人脸图像特征提

2、取方面,提出了一利有效的基于ICA的人脸整体特征提取方法;2在优化ICA算法方面,提出了一种改进的FastICA算法,该算法通过减少耗时的雅可比矩阵求逆的次数,进一步加快了收敛速度;3建立了SVM/HMM的混合人脸模型.关键词:人脸识别主分量分析;独立分量分析;隐马尔可夫模型;支持向量机AbstractFace recognition has very lagre academic and praetieal values. In daily lief,people kowing each other uses at most of persons face.Face is the most

3、familiar model in human vision.The visual inofmration refleeted by face has important meaning and impact between peoples intermunion and intercourse. Because of its extensive and applied realm,face recognition technique has got the extensive concern with study in near three decades and bee the most

4、potential method of identity recognition. At the same time,it is difficult to implement face recognition using puters. First,human face is a deformable object posed of plex 3D curve surfaces,Which is hard to be represented in form of mathematics. Secondly faces of different persons have the similar

5、strueture,and the face images are greatly dependent on ages and photography conditions.This paper mainly study face extraction and class method,which concept can be summarized as ofllows.Because face image is liable to impact of varieties and face is nonrigid and similar Accurate face recognition is

6、 stilldifficult.There is still lone distance between face recognition and praetieality.The progress of puter technology,pattern recognition,human intelligent and biologic psyehology,vision mechanism surely promote face recognition develop.Keywords:face reeognition,Principle ponent Analysis,Independe

7、nt ponent Analysis,Hidden Markov Models,Support Vector Maehines目 录第1章引言61.1人脸识别技术的应用与难点6人脸识别技术的广泛应用6人脸识别技术的难点81.2人脸识别技术的发展与现状8人脸识别技术发展的三个阶段9国内外发展现状91.3人脸识别的研究内容与主要方法10人脸识别的研究内容10人脸识别的视觉机理11人脸识别系统的组成11主要的人脸识别方法121.4人脸识别测试数据库161.5本文的主要内容17第2章基于主分量分析的人脸识别方法182.1引言182.2主分量分析的理论基础18多维统计数据的线性变换19主分量分析方法20

8、2.3基于主分量分析的人脸识别方法21基于主分量分析的人脸特征提取21基于主分量分析的人脸分类识别222.4实验结果与分析242.5本章小结27第3章基于独立分量分析的人脸识别方法283.1引言283.2独立分量分析的理论基础28独立分量分析与盲源分离28独立分量分析的线性模型293.3基于独立分量分析的人脸识别方法30人脸图像的预处理31基于独立分量分析的人脸特征提取32独立分量的排序与选择34基于ICA系数的人脸分类识别353.4独立分量分析的算法研究353.4.1 Informax算法36Fast ICA算法与其改进373.5实验结果与分析393.6 本章小结41第4章基于隐马尔可夫模型

9、的人脸识别方法444.1 引言444.2 隐马尔可夫模型的理论基础44马尔可夫链44隐马尔可夫模型464.2.3 隐马尔可夫模型中的三大问题47隐马尔可夫模型的类型484.3 基于隐马尔可夫模型的人脸识别方法概述484.3.1 基于HMM人脸识别的基本原理484.3.2 基于HMM人脸识别的系统概述494.4基于一维隐马尔可夫模型的人脸识别方法49特征提取50模型训练50分类识别524.5 基于伪二维隐马尔可夫模型的人脸识别方法524.6 基于I以特征和SMV/1翎以的人脸识别方法534.7 实验结果与分析544.8 本章小结56第5章结束语575.1人脸识别方法评估575.1.1 人脸识别方

10、法评估的性能指标575.1.2 本文中人脸识别方法的评估结果585.2本文工作的总结与进一步研究方向的展望59本文的主要工作59进一步研究方向的展望60参考文献62第1章 引 言1.1人脸识别技术的应用与难点人脸是自然界存在的一种特殊的、复杂的视觉模式,它包含着极其丰富的信息.首先,人脸具有一定的不变性和唯一性,人脸识别是人类在进行身份确认时使用的最为普遍的一种方式,其次,人脸图像还能提供一个人的性别、年龄、种族等有关信息.人类在人脸识别中所表现出来的能力是令人惊异的,但是让计算机能够识别人脸,却是非常困难的问题.迄今为止,人脸识别的认知过程和内在机理仍然是一个未解之谜,如何实现一个自动的人脸

11、识别系统仍然是一个悬而未决的难题. 从上个世纪六十年代以来,随着计算机和电子技术的迅猛发展,人们开始利用计算机视觉和模式识别等技术对人脸识别进行研究.近年来,随着相关技术的不断发展和实际需求的日益增加,人脸识别已经引起了越来越多的关注,成为了信息处理和人工智能等领域研究的热点之一,新的研究成果和实用系统也不断涌现.1.1.1 人脸识别技术的广泛应用一项技术的问世和发展与人类的迫切需求是密切相关的,飞速发展的社会经济和科学技术使得人类对安全的认识越来越重视.人脸识别的一个重要应用就是人类的身份识别.一般来说,人类的身份识别方式分为三类:a.特殊物品,包括各种证件和凭证,如#、驾驶执照、房门钥匙、

12、印章等;b.特殊知识,包括各种密码、口令和暗号等;c.人类生物特征,包括各种人类的生理和行为特征,如人脸、指纹、手形、掌纹、虹膜、DNA、签名、语音等.前两类识别方式属于传统的身份识别技术,其特点是方便、快捷,但致命的缺点是安全性差、易伪造、易窃取.特殊物品可能被丢失、偷盗和复制,特殊知识容易被遗忘、混淆和泄露.相比较而言,由于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此生物特征是身份识别的最理想依据.基于以上相对独特的生物特征,结合计算机技术,发展了众多的基于人类生物特征的身份识别技术,如NDA识别技术、指纹识别技术、虹膜识别技术、语音识别技术和人脸识别技术等.表1-1为各

13、种生物识别技术的综合比较.表1-1各种生物特征识别技术的综合比较生物识别技术在上个世纪己经有了一定的发展,其中指纹识别技术己经趋近成熟,但人脸识别技术的研究目前还处于起步阶段.指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备.人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低.并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义.由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一.本文将人脸识别技术的各种应用与其特点总结在表1-2

14、中.表1-2 人脸识别技术的应用 人脸识别最初的应用源于公安部门关于罪犯照片的存档管理和刑侦破案.现在该技术在安全系统、商业领域和日常生活中都有很多应用,主要有以下几类应用: 1.刑侦破案.当公安部门获得罪犯的照片后,可以利用人脸识别技术,在存储罪 犯照片的数据库中找出最相像的人作为嫌疑犯,极大的节省了破案的时间和人力物力.还有一种应用就是根据目击证人的描述,先由专业人员画出草图,然后用此图到库里去找嫌疑犯.罪犯数据库往往很大,由几千幅图像组成.如果这项搜索工作由人工完成,不仅效率低,而且容易出错,因为人在看了上百幅人脸图像后,记忆力会下降,而由计算机来完成则不会出现此问题.2.证件验证.#、

15、驾驶执照以与其他很多证件上都有照片;现在这些证件多由人工验证完成.如果应用人脸识别技术,这项工作就可以交给机计算机完成,从而实现自动化与智能管理.当前普遍使用的另一类证件是用符号或者条形码标记的,比如信用卡.这类卡的安全性比较低,可能遗失、被窃取,使用场合的安全性也比较差.如果在这类卡上加上人脸的特征信息,则会大大改善其安全性能. 3.入口控制.需要入口控制的范围很广,它可以是重要人物居住的住所、保存重要信息的单位,只要人类觉得安全性比较重要的地点都可以进行入口控制,比较常用的检查手段是核查证件.人员出入频繁时,保安人员再三检查证件是很麻烦的,而且证件安全性也不高.在一些#要求非常严格的部门,

16、除了证件外,已经使用了生物特征识别手段,如指纹识别、掌纹识别、虹膜识别和语音识别等.人脸识别与这些技术相比,具有直接、方便和友好的特点.当前计算机系统的安全管理也备受重视,通常使用由字符和数字组成的口令进行使用者的身份验证,但口令可能被遗忘,或被破解,如果将人脸作为口令,则既方便又安全. 4.视频监控.在银行、公司、公共场所等处设有24小时的视频监控,如何对视频图像进行筛选分析,就需要用到人脸检测、跟踪和识别技术. 除了以上应用外,人脸识别技术还可以用于视频会议、机器人的智能化研究等方面.尤其从美国9.11事件后,人的身份识别问题更是提升到了国家安全的角度,如何利用人脸信息迅速确定一个人的身份

17、成了各个国家重点研究的技术.1.1.2人脸识别技术的难点 虽然人类可以毫不困难地根据人脸来辨别一个人,但是利用计算机进行完全自动的人脸识别,仍存在许多困难.人脸模式的差异性使得人脸识别成为一个非常困难的问题,表现在以下方面: 1.人脸表情复杂,人脸具有多样的变化能力,人的脸上分布着五十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变; 2.人脸随年龄而改变,随着年龄的增长,皱纹的出现和面部肌肉的松弛使得人脸的结构和纹理都将发生改变; 3.人脸有易变化的附加物,例如改变发型,蓄留胡须或者佩戴帽子和眼镜等饰物; 4.人脸特征遮掩,人脸全部、部分遮掩将会造成错误识别;5.

18、人脸图像的畸变,由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像质量,增大了识别难度. 所以很难从有限张人脸图像中提取出反映人脸内在的、本质的特征.另外人脸识别还涉与模式识别、图像处理、计算机视觉、生理学和心理学等学科领域.这诸多因素使得人脸识别至今仍是一个有待深入研究,极富挑战性的课题.同时一个成功的、具有商用价值的快速的人脸识别系统将会给社会带来极大的影响.1.2人脸识别技术的发展与现状人脸识别的研究可以追溯到20世纪60年代末,最早的研究见于文献1.Bledsoe以人脸特征点的间距、比率等参数为特征,建成了一个半自动的人脸识别系统.人脸识别的发展大致经过了三

19、个阶段,其中伴随发展了多样的人脸识别技术.1.2.1人脸识别技术发展的三个阶段 第一阶段一非自动识别阶段:主要研究如何提取人脸识别所需的特征.通过简单的语句描述人脸数据库成为待识别人脸设计逼真的摹写来提高面部识别率.这是需要手工干预的阶段.此阶段以Bertillon、Allen和Parke为代表.在Bertillon系统中,用了一个简单的语句与数据库中的某一张脸相联系,同时与指纹识别相结合,提供了一个较强的识别系统.为了提高面部识别率,Allen为待识别人脸设计了一种有效逼真的摹写2,Parke则用计算机实现了这一想法3,并且产生了较高质量的人脸灰度图模型.在此阶段,识别过程全部依赖于操作人员

20、,所以不是一种自动识别的系统. 第二阶段一人机交互阶段:这一阶段虽然实现了一定的自动化,但还需要操作员的某些先验知识,仍然不是一个完全自动的识别系统.此阶段的代表性工作有:Goldstion、Harmon和Lesk等人用几何特征参数来表示人脸正面图像4.他们采用21维特征矢量表示人脸面部特征,并设计了基于这一表示法的识别系统.Kaya和Kobayashi则采用了统计识别的方法,用欧氏距离来表示人脸特征5,例如嘴和鼻子之间的距离,嘴唇的高度,两眼之间的距离等.更进一步的,T.Kanad设计了快速且有一定知识引导的半自动回溯识别系统6,创造性的运用积分投影法从单幅图像上计算出一组脸部特征参数,再利

21、用模式分类技术与标准人脸相匹配.Kanad的系统实现了快速、实时的处理,是一个很大的进步.总的来说,上述方法都需要利用操作员的某些先验知识,始终摆脱不了人的干预. 第三阶段一自动识别阶段:这一阶段真正实现了机器自动识别,产生了众多人脸识别方法,出现了多种机器全自动识别系统.近十余年来,随着高速度、高性能计算机的发展,人脸识别方法有了较大的突破,提出了多种机器全自动识别系统7.近年来,人脸识别技术研究也非常活跃,除了基于K一L变换的特征脸方法与奇异值特征为代表的代数特征方法取得了发展外89,人工神经网络1011、隐马尔可夫模型小波变换等也在人脸识别研究中得到了广泛的应用1213,而且出现了不少人

22、脸识别的新方法141516.本文将在1.3节介绍人脸识别的主要内容与方法.1.2.2国内外发展现状目前,国外对人脸识别问题的研究比较多,其中比较著名的有MTI、CMU、Cornell和Rockfeller等,MPEG标准组织也已经建立了专门的人脸识别草案小组.国际上发表的相关论文数量也大幅度增长,EIEE的著名国际会议,如EIEE International Conference on Automatic Face and Gesture Recognition、 International Conference on Image Processing、Conference on puter

23、Vision and Pattern Recognition等,每年都有大量关于人脸识别的论文.截至2005年3月,EIEE/IEE全文数据库中收录的关于face的文章8916篇,其中有关face recognition的3280篇,约占36.8%,并且每年的文献呈急剧上升趋势.同样在工程索引El中,至2005年3月,共有81657篇有关face的文献,数目是惊人的,并且2000年后快速增长.国内对人脸识别领域的研究起步较国外晚,但近十年来呈现飞速发展,据中国期刊网统计,1996年至2005年3月,有关人脸的文献1467篇,其中人脸识别领域的文章494篇,并且再近几年获得快速增长,也预示人脸识

24、别领域得到快速发展.目前国内大部分高校有人从事人脸识别相关的研究,其中技术比较先进的有中科院自动化所、清华大学、#大学等.1.3人脸识别的研究内容与主要方法自动人脸识别技术就是利用计算机技术,根据数据库的人脸图像,分析提取出有效的识别信息,用来辨认身份的技术.人脸识别技术的研究始于六十年代末七十年代初,其研究领域涉与图像处理、计算机视觉、模式识别、计算机智能等领域,是伴随着现代化计算机技术、数据库技术发展起来的综合交叉学科.1.3.1人脸识别的研究内容人脸识别的研究范围广义上来讲大致包括以下五个方面的内容.1.人脸定位和检测:即从在动态的场景与复杂的背景中检测出人脸的存在并且确定其位置,最后分

25、离出来.这一任务主要受到光照、噪声、面部倾斜以与各种各样遮挡的影响.2.人脸表征:即采用某种表示方法表示检测出人脸与数据库中的己知人脸.通常的表示方法包括几何特征、代数特征、固定特征模板等.3.人脸识别:即将待识别的人脸与数据库中已知人脸比较,得出相关信息.这一过程的核心是选择适当的人脸表征方式与匹配策略.4.表情姿态分析:即对待识别人脸的表情或姿态信息进行分析,并对其加以归类.5.生理分类:即对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息,或者从几幅相关的图像推导出希望得到的人脸图像,如从父母图像推导出孩子的脸部图像和基于年龄增长的人脸图像估算等.人脸识别的研究内容,从生物特征技

26、术的应用前景来分类,包括以下两个方面:人脸验证与人脸识别.1.人脸验证:即是回答是不是某人?的问题.它是给定一幅待识别人脸图像,判别它是否是某人的问题,属于一对一的两类模式分类问题,主要用于安全系统的身份验证.2.人脸识别:即是回答是谁?的问题.它是给定一幅待识别人脸图像,在已有的人脸数据库中,判别它的身份的问题.它是个一对多的多类模式分类问题,通常所说的人脸识别即指此类问题,这也是本文的主要研究内容.1.3.2人脸识别的视觉机理近几年的研究表明17,人类视觉数据处理是多层次的过程,其中最低层的视觉过程起到信息转储作用,即将大量图像数据转换为较为抽象的信息,这一任务由视网膜中的两类细胞完成:低

27、层次的细胞对空间的响应与小波变换作用类似,高层次的细胞则依据低层次细胞的响应,而作出具体的线、面乃至物体模式的响应.这表明在视觉处理过程中,神经元并不是随便的、不可靠的把视觉图像的光照强度投射到感觉中枢,它们可以检测模式单元,区分物体的深度,排除无关的变化因素,并组成一个令人感兴趣的层次结构.人脸识别不仅有着以上普通视觉过程的特点,而且具有以下独特之处18-2223. 1.人脸识别是大脑中一个特有的过程.针对人脸识别,大脑中存在一个专门的处理过程; 2.在人脸感知与识别过程中,局部特征与整体特征均起作用.若存在明显的局部特征,整体特征将不起作用; 3.不同的局部特征作用对识别的贡献也不同.在正

28、面人脸图像中,头发、人脸轮廓、眼睛以与嘴巴对识别和记忆有着重要影响,鼻子的作用则不是很重要.但在侧面人脸识别中,鼻子对特征点的匹配很有作用.通常来讲人脸的上部比下部对识别作用更大些; 4.不同空间频率上信息的作用不同.低频信息代表了整体的描述,高频信息包含了局部的细节.对于性别的判断,仅利用低频信息就足够了,对于身份识别没有高频信息就无法完成; 5.光照对视觉有影响.有实验表明,从人脸底部打光会导致识别困难; 6.动态信息比静态信息更利于识别.研究还发现,对熟悉的人脸,人类的识别能力在动态场景中要高于静态场景; 7.十岁以下的儿童识别人脸较多的采用显著特征,而较少的使用整体分析;8.不同的种族

29、.性别的人脸识别的难易程度不同,这可能因为不同类型的人脸图像具有不同的特征; 9.面部表情的分析与人脸识别并行处理.通过对脑部受损的病人研究表明,表情的分析与识别虽有联系,但总体来说是分开处理的. 人脸识别是一种复杂的信息处理任务,它的研究涉与计算机技术、心理学和神经生理学.视觉机理、心理学和神经生理学的研究结果无疑将非常有益于人脸识别技术的发展,这些结论对于设计有效的识别方法起到了一定启发作用.但除少数文献外24,机器识别人脸的研究还是独立于心理学和神经生理学的研究的.1.3.3人脸识别系统的组成 在人脸识别技术发展的几十年中,研究者们提出了多种多样的人脸识别方法,但大部分的人脸识别系统主要

30、由三部分组成:图像预处理、特征提取和人脸的分类识别.一个完整的自动人脸识别系统还包括人脸检测定位和数据库的组织等模块,如图1-1.其中人脸检测和人脸识别是整个自动人脸识别系统中非常重要的两个技术环节,并且相对独立.下面分别介绍这两个环节.图1-1人脸识别系统框图人脸检测与定位检测图像中是否有人脸,若有,将其从背景中分割出来,并确定其在图像中的位置.在某些可以控制拍摄条件的场合,如警察拍罪犯照片时将人脸限定在标尺内,此时人脸的定位很简单.证件照背景简单,定位也比较容易.在另一些情况下,人脸在图像中的位置预先是未知的,比如在复杂背景下拍摄的照片,这时人脸的检测与定位将受以下因素的影响: 1.人脸在

31、图像中的位置、角度、不固定尺寸以与光照的影响; 2.发型、眼镜、胡须以与人脸的表情变化等;3.图像中的噪声等.特征提取与人脸识别 特征提取之前一般需要做几何归一化和灰度归一化的工作.前者是指根据人脸定位结果将图像中的人脸变化到同一位置和大小;后者是指对图像进行光照补偿等处理,以克服光照变化的影响,光照补偿能够一定程度的克服光照变化的影响而提高识别率.提取出待识别的人脸特征之后,即可进行特征匹配.这个过程是一对多或者一对一的匹配过程,前者是确定输入图像为图像库中的哪一个人,后者是验证输入图像的人的身份是否属实. 以上两个环节的独立性很强.在许多特定场合下人脸的检测与定位相对比较容易,因此特征提取

32、与人脸识别环节得到了更广泛和深入的研究.近几年随着人们越来越关心各种复杂的情形下的人脸自动识别系统以与多功能感知研究的兴起,人脸检测与定位才作为一个独立的模式识别问题得到了较多的重视.本文主要研究人脸的特征提取与分类识别的问题.1.3.4主要的人脸识别方法 人脸识别技术作为模式识别领域的一个研究热点,每年都有许多相应的研究成果发表,并且涌现出各种各样的识别方法,可以说信息处理领域的各种新方法的研究和算法的改进都尝试在人脸识别中得到应用.文献2526对近十年来人脸识别领域取得的成果进行了总结.人脸识别方法的分类,根据研究角度的不同,可以有不同的分类方法,这是研究人脸识别方法首先遇到的问题.本文在

33、深入研究国内外人脸识别技术的发展和研究成果的同时,将已有的不同的分类方法做一个比较,目的是希望能从不同角度认识人脸识别问题,在较全面的了解各种方法优缺点的基础上,给本文的人脸识别方法提供研究方向. 根据输入图像中人脸的角度,人脸识别技术可分为基于正面、侧面、倾斜人脸图像的人脸识别.由于实际情况的要求,对人脸正面模式的研究最多,这也是本文的研究内容. 根据图像来源的不同,人脸识别技术可分为两大类:静态人脸识别和动态人脸识别.静态人脸识别,即人脸来源为稳定的二维图像如照片.如果人脸的来源是一段视频图像,则人脸识别就属于动态人脸识别.在头部运动和表情变化状态下的人脸识别都可以看作动态人脸识别,如视频

34、监视中的人脸识别.动态人脸识别具有更大的难度:首先,视频输出的图像质量较差:其次,背景较复杂,目前对动态人脸识别的研究还局限于简单背景,较少人物的情况,对静态人脸识别的研究比较多.本文的研究也是基于静止图像的. 根据人脸识别技术的发展历史,人脸识别方法大致可分为基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法和基于模型的人脸识别方法.a.基于几何特征的人脸识别方法这是人脸识别技术发展中,应用最早的方法.该方法是通过提取人脸的几何特征,包括人脸部件的归一化的点间距离、比率以与人脸的一些特征点,如眼角、嘴角、鼻尖等部位所构成的二维拓扑结构进行识别的方法.所构造的几何特征既要清晰区分不同对象人

35、脸的差异,又要对光照背景条件不敏感,常规的几何特征量很难满足这些要求.因此该方法识别效果不理想.b.基于模板匹配的人脸识别方法基于模板匹配的方法,主要是利用计算模板和图像灰度的自相关性来实现识别功能.一般基于人脸的全局特征,利用人脸模板和相关参数如灰度的相关性来进行检测和识别的.Berto在27中将基于几何模型的人脸识别方法和模板匹配进行了全面比较后,得出结论:前者具有识别速度快和内存要求小的优点,但在识别率上后者要优于前者.增加几何特征对于基于几何特征的人脸识别方法只能轻微的提高识别率,因为要提高几何特征的提取质量本身就十分困难,而且随着图像质量的下降和人脸遮挡的引入,基于几何特征的人脸识别

36、效果会大幅下降.总之,认为模板匹配法要优于几何特征法.c.基于模型的人脸识别方法通过统计分析和匹配学习找出人脸和非人脸,以与不同人脸之间的联系.该方法包括特征脸法、神经网络方法、隐马尔可夫模型方法和支持向量机等方法.和模板匹配的方法相比,基于模型方法的模板是通过样本学习获得,而非人为设定.所以该方法,从原理上更为先进合理,实验中也表现出更好的识别效果.根据人脸表征方式的不同,还可以将人脸识别技术分为三大类:基于几何特征的识别方法、基于代数特征的识别方法和基于连接机制的识别方法.a.基于几何特征的人脸识别方法该方法在上文中已有阐述,它将人脸用一个几何特征矢量表示,用模式识别中层次聚类的思想设计分

37、类器达到识别目的.该方法的困难在于没有形成一个统一的、优秀的特征提取标准.由于人面部的模式千变万化,即使是同一个人的面部图像,由于时间、光照、摄影机角度等不同,也很难用一个统一的模式来表达,造成了特征提取的困难.不过,由于现在各种优秀特征提取算法的提出,使得人脸的几何特征描述越来越充分.而且在表情分析方面,人脸的几何特征仍然是最有力的判据.b.基于代数特征的人脸识别方法这类识别法仍然是将人脸用特征矢量表示,只不过用的是代数特征矢量.该方法在实际应用中取得了一定的成功28.由于代数特征矢量具有一定的稳定性,识别系统对不同的倾斜角度,乃至不同的表情均有一定的鲁棒性.所以,也说明了这种方法对表情的描

38、述不够充分,难以用于表情分析.c.基于连接机制的人脸识别方法这类识别法将人脸直接用灰度图表征,利用了神经网络的学习能力与分类能力2930.这种方法的优势在于保存了人脸图像中的纹理信息与细微的形状信息,同时避免了较为复杂的特征提取工作.而且,由于图像被整体输入,符合格氏塔心理学中对人类识别能力的解释.与前两种识别方法相比,基于连接机制的识别法具有以下明显不同:信息处理方式是并行而非串行;编码存储方式是分布式.但由于原始灰度图像数据量十分庞大,因此神经元数目通常很多,训练时间很长.另外,完全基于神经网络的识别法在现有的计算机系统上也有其内在的局限性.神经网络虽然有较强的归纳能力,但当样本数目大量增

39、加时,其性能可能会严重下降. 本文根据人脸表征方法与特征综合方式的不同,认为将人脸识别方法分为基于几何特征的方法、基于模板匹配的方法和基于统计学习的方法,比较合适.此分类方法即符合人脸识别技术发展的历史,又将人脸特征提取与分类识别有机的结合在一起.识别人脸主要依据那些在不同个体之间存在较大差异,而对于同一个人比较稳定的特征,具体的特征形式和综合方式的不同决定了识别方法的不同.图1-2列出了主要的人脸特征与综合方法.早期静态人脸识别方法研究较多的是基于几何特征的方法和基于模板匹配方法.目前,静止图像的人脸识别方法主要是基于样本通过统计学习识别人脸的方法,主要研究方向有:基于代数特征的识别方法,包

40、括特征脸方法8和隐马尔可夫模型方法31;基于连接机制的识别方法,包括一般的神经网络方法和弹性图匹配方法32,以与以上方法的一些综合方法.基于统计学习的方法属于基于整体的研究方法,它主要考虑了模式的整体属性.因为基于整体的人脸识别不仅保留了人脸部件的拓扑关系,而且也保留了各部件本身的信息.文献27认为基于整个人脸的分析要优于基于部件的分析,理由是前者保留了更多信息.对于基于整个人脸的识别而言,由于把整个人脸图像作为模式,那么光照、视角以与人脸尺寸会对人脸识别有很大的影响,因此如何能够有效的去掉这些干扰就尤为关键.神经网络的方法在人脸识别上有其独到的优势,即它避免了复杂的特征提取工作,可以通过学习

41、的过程获得其它方法难以实现的关于人脸识别的规律和规则的隐性表达.但是NN方法通常需要将人脸作为一个一维向量输入,因此输入节点庞大,降维就显得尤为重要.根据文献32对于自组织神经网络方法的分析,认为可采用自组织神经网络的P个节点来表达原始的N个输入P,但由于将P个节点进行分类,其识别的效果仅相当于提取人脸空间特征向量后进行的识别分类,因此采用此类神经网络进行识别的效果只能是特征脸的水平.除此之外,由于人脸处在高维空间,如一幅不大的100x100的图像为10000维,这样神经网络的输入节点将很庞大,因此实际训练网络的参数繁多,实现起来很困难.神经网络方法的优点是可以针对特定的问题进行子空间设计,比

42、如用于人脸检测、性别识别、种族识别等.鉴于以上考虑,本文未对此方法进行重点研究.图1-2 可以提取的各种人脸特征,图下方为各种特征的综合方式通过对不同的人脸识别分类方法的总结,多视角的、全面的介绍了主要的人脸识别方法.从对人脸识别方法的分析中可以看出,每种方法各有其优缺点,因此一些学者倾向于将多种方法综合起来,或同时利用不同种类的特征,图1-2为人脸图像可以提取的特征以与可能的特征综合方法.在对各种人脸识别方法进行理论分析后,本文主要研究基于统计学习的、整体的人脸识别方法,包括特征脸法、基于独立分量分析的人脸识别方法和基于隐马尔可夫模型的人脸识别方法,并尝试新的特征提取和分类方法.1.4人脸识

43、别测试数据库 人脸识别是近年来研究的热点,各国研究人员提出了各种新的识别算法,为测试和比较各种识别技术的优缺点与其识别率的高低,世界各研究机构都建立了各自的人脸测试和测评数据库,下面介绍一些著名的标准数据库.1. 英国ORL人脸数据库 ORL人脸图像库是由英国剑桥011vetti实验室从1992年4月到1994年4月期间拍摄的一系列人脸图像组成,共有40个不同年龄、不同性别和不同种族的对象.每个对象10幅图像共计400幅灰度图像组成,图像尺寸为92xlZl,图像背景为黑色.其中人脸部分表情和细节均有变化,例如笑与不笑,眼睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,其深度旋转和平面旋转可达2

44、0度,人脸的尺寸也有最多10%的变化.该库是目前使用最广泛的标准数据库,它含有大量的比较结果.2. 英国Manchester人脸数据库 该数据库由30人的690幅图像组成,图像有不同的光照和背景特征,而且对于每个人而言,前后两张照片之间的时间间隔至少为3周.训练集对光源有一定的约束.虽然Manchester人脸数据库远比ORL数据库全面,但因发表的比较结果不够多,从而远不如ORL数据库使用广泛.3. Yale耶鲁人脸库 该数据库包括15人每个人11幅正视图,每幅图像具有不同的面部表情、有或者无眼镜,这些图像在不同光照条件下拍摄.该库的特点就是光照变化显著,且有面部部分遮掩.4. 欧洲M2VTS

45、多模型数据库 该库是用来作为多模型输入的通路控制实验,它包括37个人的序列人脸图像.每人的5幅图像间隔一个星期,每个图像序列包括从右侧轮廓到左侧轮廓之间的图像,而且拍摄时每个人用他们的母语从一到九数数.该库主要用于测试多模式身份识别.5. 美国FERET人脸数据库 FERET人脸数据库是目前最大的人脸数据库,由美国军方研究实验室提供,其中每人的图像数目不等,有些人提供了更多不同视点和不同表情的照片.该数据库中不包含戴眼镜的照片,拍摄条件也有一定的限制.人脸大小约束在规定范围内.1996年6月,该数据库己存储了1199个人的14126幅图像,而且逐年增加.但到目前为止,该数据库并未提供运动图像系

46、列或包含语言信息.FERTE数据库的最大缺点是非美研究机构的获取不便.其他数据库还有CMU正面人脸数据库,MIT单人脸数据库等.不同的人脸数据库,图像的质量和内容也是不同的,为了客观的、全面的测试人脸识别方法的性能,考虑不同因素对识别方法的影响,本文的人脸识别方法主要应用了ORL、Manchester、Yale和部分FERET人脸数据库进行测试.1.5本文的主要内容 本文主要研究基于静止图像的正面人脸识别技术,方法包括基于主分量分析的人脸识别方法、基于独立分量分析的人脸识别方法和基于隐马尔可夫模型的人脸识别方法.在分析人脸识别方法理论基础的同时,针对其中的特征提取与分类识别的关键环节进行了改进

47、,提高了识别性能.第2章 基于主分量分析的人脸识别方法2.1引言 早期的人脸识别方法主要是基于几何特征的方法和基于模板匹配的方法.基于主分量分析的人脸识别方法是首次将人脸看作一个整体,特征提取由手工定义到利用统计学习自动获取特征,是人脸识别方法上的一个重要转变.在该方法的发展过程中,sirovich和Kirby首先将K一L变换用于人脸图像的最优表示33,Turk和Pentland进一步提出了特征脸这个概念,该方法又被称为特征脸法34.特征脸法是将整个人脸的图像区域看作一随机向量,通过CPA获取正交向量基的方法.其中对应较大特征值的向量基具有与人脸相似的形状,所以被称为特征脸,如图2-1.图2-

48、1 FERET人脸库中提取的特征脸示例利用这些向量基的线性组合可以描述、表达和逼近人脸图像,因此可以进行人脸的识别与合成.识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较其与己知人脸在特征脸空间中的位置,完成分类识别的.PAC至今仍是传统的人脸特征提取方法. 本章首先以多维数据的统计变换的概念引出主分量分析的基本理论和主要特点;其次介绍基于CPA的人脸特征提取方法和人脸识别方法:最后从理论分析结合实验结果论述基于PCA的人脸识别方法存在不足.2.2主分量分析的理论基础人脸图像原始特征的数量很大,或者说样本处于一个高维空间中,通过映射的方法可以用低维空间来表示样本,这个过程称为特征提取.

49、如果不对特征进行选择而直接进行分类器设计,无论从计算的复杂程度还是分类器性能来看都是不适宜的.因此研究如何将高维数据空间压缩到低维特征空间以便有效的识别分类便成为一个重要的课题.特征的选择和提取的基本任务是从样本的许多特征中找出那些最有效的特征,所以它满足以下两条原则:a.尽可能的去除人脸图像中的相关性,降低人脸表示的维数,减少数据计算量;b.抽取人脸最本质的,最能表现不同人脸间差异的特征,以提高识别率.映射后的特征称为二次特征,它们是原始特征的某种组合.所谓特征提取在广义上就是一种变换.2.2.1多维统计数据的线性变换在科学研究的众多研究领域,一个普遍存在的问题是如何从采集的数据中获取信息.

50、随着科技的高速发展,大量数据的测量与存储已经不再成为问题,但是获取数据本身所含的信息是不够的,提取产生这些数据的系统的固有的信息才是根本目的所在.在诸如数据分析、信号处理、神经网络等应用领域,找到多维数据的一个恰当的描述是经常会遇到的问题.为了使问题尽可能的简单化以与考虑到计算的复杂性,最好使得这种描述是一个对原始数据的线性变换,因为这会对各种形式的后继分类带来极大的方便,如数据压缩、特征提取、模式识别等.在多维信号处理中,为了便于研究,通常把采集得到的数据看作多维随机信号的一系列样本值,以便于将随机矢量的数值统计方法3637应用到原数据.这样做虽然忽略了信号的时间特性,但是可以尽可能的利用其

51、统计特性.假设所有分量都是零均值的,即有Ex=0,如果不满足此条件,通过减去其均值可以很容易获得.对多维信号x=T的某一观测样本矢量,其中x1,i=l,2,n为各个分量,按照某种规则对其做线性变换,记为T:RnRm,Y=Tx y=T为变换后的结果.假设这里T是一个线性变换,于是y中的每个分量都是原数据所有分量的线性组合: 对应每个yi的一组系数wij,j=1,2,n称为一个基向量,式写出矩阵形式为:Y=Wx 所以多维数据的线性变换就是按照一定的准则寻找一系列的加权系数玛组成线性变换矩阵砰中的各个基向量,而这m个基向量构成一个新的坐标系.将原数据在这样一个坐标系上展开,得到各个分量便是变换的结果

52、.要求变换后的数据夕在最大程度上体现原数据间隐含的实质结构,并且y的各个分量尽可能的代表产生原数据的系统本身的物理机制.基于多维随机变量统计分析的框架,变换矩阵砰的寻找方法通常是建立在一个体现输出结果y的统计特性的目标函数g的基础上.而这种统计特性因算法中的基本准则不同而不同,可能是一阶、二阶的,如相关系数、协方差等;也可能是高阶的,如互信息、非高斯性等,这样随之产生了不同的线性变换技术,如主分量分析、奇异值分解、投影法等38.简而言之,所有的线性变换都是寻找这样的砰矩阵,只是因输出y的目标函数的不同,使得不同方法得到不同的变换矩阵.2.2.2主分量分析方法主分量分析的目的是在数据空间中找到一

53、组向量以尽可能的解释数据的方差,最终将数据从原来的n维空间降到m维m,降维后仍保存了数据中的主要信息.主分量分析是一种正交变换,在多维数据统计分析中是一个应用广泛的工具.假设原始向量特征维数为n,即xi=T,i=1,2,N,要求构造N个新的特征yl,y2,yn,并使它们满足以下的条件:a.每个新特征是原有特征的线性组合,即 b.各个新变量之间是不相关的,即相关系数为零: c.wi使yi的能量达到极大,i=1,2,N 可以证明满足条件的城为样本的协方差矩阵Sx=E#T,对应于i特征值的正交规范化的特征向量ui,满足以上条件的新特征y1,y2,yn分别称为样本点的第1,2,N个主分量.令W=T,且

54、满足正交归一化,即 经过Y=WTX的变换之后,因为X的协方差矩阵SX为实对称阵必然与一个对角阵相似,所以对应于Y的协方差矩阵如下式: 这就是说,新特征y1,y2,yn两两之间的协方差为零,即它们是不相关的.由于yi也是零均值,每个特征的方差数值Eyi2在一定意义下反映了它所包含的能量即信息量.由前面叙述可知,所有这些映射矢量作为基向量,便构成主分量分析对应的变换矩阵W=w1,w2,wm,wn,T其中前几个基向量wl,w2,wm,对应能量占主导地位的几个主分量的映射方向,现将余下的基向量置零,得到W=wl,w2,wm,0,0,0T.利用W对信号进行近似恢复,得到x=WWTx.其中WTx为所选择的

55、前m个主分量.重构信号的均方误差为E|x-x|2.当选择m个主分量去重构原信号时,由于原信号的维数nm,所以从信号维数的角度来讲PCA起到了对信号降维的作用.在很多情况下,有效的降维会使得在最大程度保持原信号中所蕴涵的信息的情况下,大大降低运算复杂度.譬如在进行人脸识别应用中,输入的人脸图像的维数往往很高,采用P以方法对其进行特征提取可以降低样本的维数,从而降低计算复杂度,提高了计算速度. 主分量分析是是一种基于统计特征的最佳正交变换,称其为最佳变换是因为它具有优良的性质,使变换后产生的新的分量正交或不相关.主分量分析也是一种最小均方误差意义下的最优变换39.也就是说,变换后的信号能量主要集中

56、在前几个主分量中,而由这少数几个主分量张成的子空间去重构原信号,逼近效果从最小均方误差意义下是最优的.主分量分析使变换矢量更趋确定,能量更趋集中等,这使得它在特征提取、数据压缩等方面都有着与其重要的作用.2.3基于主分量分析的人脸识别方法2.3.1基于主分量分析的人脸特征提取任何基于统计学习的模式识别系统都包括两个过程,一个是训练阶段,二是测试阶段,且两个阶段都需要特征提取,应用CAP的人脸识别系统也不例外.假定在训练阶段,数据库中有K个人,每个人有M幅人脸灰度图像,其中每一幅图像都用NxN的二维数组I来表示,数组元素表示象素点的灰度值.同样,每一幅图像都可以视为一个N2xI的向量.因此,它等

57、同于N2维的人脸象素域空间中的一个点.设xij表示一个N2xI的向量来表示数据库中第i个人的第j幅图像然后,定义平均人脸如下: 表示了每一幅人脸与平均人脸的差值,它是零均值的.它们组成了一个N2xMK的矩阵,=,PCA方法就是要找到对应于矩阵T 的前m个较大特征i 的正交规范化的特征向量i :因为T 是N2xN2 的矩阵,求它的N2个特征值的计算量非常大.一般而言,训练过程中人脸数据库里的图像数目MxK比人脸空间的维度N2要小,所以我们可以先求得T 见的正交规范化的特征向量城i: 在式两边左乘,然后与式比较,我们可以得到: 这些特征向量,称为特征脸,构成了人脸空间的一个子空间的正交基,这个子空

58、间就是通常所说的特征空间.特征空间有训练图像的协方差的特征向量构成,将数据库中的每一幅人脸x从人脸空间转化到特征空间: 既然每一幅人脸都可以用特征空间里的向量y=T,利用最近邻法就可以在特征空间里进行人脸识别.在训练阶段,数据库中的所有人脸xij到特征空间为,那么,第i个人在特征空间里的平均向量为: 在测试阶段,给出测试人脸,首先,将按照同样的步骤式转化到特征空间,得到在特征空间各坐标上的系数向量.然后,利用最近邻法则将判定为求得dj最小的一类: 综上所述,基于主分量分析的人脸识别方法的具体步骤如下:a.初始化,获得人脸图像的训练集并计算特征脸,定义为人脸空间;b. 输入新的人脸图像,将其映射

59、到特征脸空间,得到一组坐标系数;c. 通过检查图像与人脸空间的距离判断它是否为人脸;d. 若为人脸,根据坐标系数判断它是否为数据库中的某个人.2.3.2基于主分量分析的人脸分类识别人脸图像被投影到特征空间中后,剩下的任务就是如何利用待识别人脸图像在此特征子空间的投影系数,实现分类识别了.此任务由两部分构成:一是相似性测量;二是分类器设计.传统的分类识别是基于欧氏距离的最近邻分类方法,实验证明效果并不理想.因为欧氏距离容易受到图像光线、噪声等整体干扰因素的影响.分类器选取与特征提取一样也是模式分类中的一个重要环节,不同的分类器对不同特征空间的分类效果优劣相差很大.本文采用两个坐标向量夹角的余弦值作为相似测度以与采用SVM分类器.实验证明比传统的基于欧氏距离的最近邻法效果好.具体方法如下.相似性测量 假设为待测试人脸图像的PCA系数向量,即PCA特征,为训练人脸库中的样本特征,二者欧氏距离计算公式如下: 其中n为特征向量的维数. 相应的的角度距离如下式: 分类器设计 分类器的功能是先计算出c判别函数gjx

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!