人脸识别的认知思考

上传人:z****2 文档编号:111085716 上传时间:2022-06-20 格式:DOC 页数:8 大小:34KB
收藏 版权申诉 举报 下载
人脸识别的认知思考_第1页
第1页 / 共8页
人脸识别的认知思考_第2页
第2页 / 共8页
人脸识别的认知思考_第3页
第3页 / 共8页
资源描述:

《人脸识别的认知思考》由会员分享,可在线阅读,更多相关《人脸识别的认知思考(8页珍藏版)》请在装配图网上搜索。

1、人脸识别的认知思考胡伟平1,2, 邓辉文 1 (1西南大学逻辑与智能研究中心,重庆400715; 2西南大学育才学院, 重庆 401524) 摘要:本文首先对人脸识别和人脸认知这两个领域的研究现状进行了简单的介绍,之后针对 如何在人脸识别中应用人脸认知中的结论给出了两点思考,最后结合学界关于机器智能的争 论重点讨论了人脸识别算法的研究方向问题。关键字: 人脸识别 人脸认知 机器智能On Face Cognition and Face RecognitionHu Weiping1,2Deng Huiwen1(1. Institute of Logic and Intelligence, Sout

2、hwest University, Chongqing 400715;2. Southwest University Yucai College, Chongqing 401524)Abstract: In this paper, current research on face cognition and face recognition is briefly summarized. firstly. Then two thoughts on how to apply achievements in face cognition research to face recognition re

3、search is proposed. Finally, dispute on machine intelligence and the research direction of face recognition algorithm are discussed as an important aspect. Key words: face cognition, face recognition, machine intelligence一、引言人脸识别一直是生物识别领域的研究热点,在计算机、数学、电子、自动化、虚拟现实、 图像处理和模式识别等学科都有广泛的研究,同时在公安刑侦、门禁系统、摄像

4、监视系统及 网络应用等方面有着十分光明的应用前景,但是同时人脸识别也被认为是生物特征识别领域 甚至人工智能领域最困难的研究课题之一。人脸识别的困难主要是由人脸本身的特征造成 的,首先,人脸的结构都基本相似,个体之间的区别不大;其次,人脸的非刚性特点使得在 不同表情下人脸的变化很大,另外,人脸识别还受光照条件、遮盖物、年龄等多方面因素的 影响。人脸识别最重要也是最核心的部分在于人脸特征的提取,目前人脸特征的提取主要有以 作者简介:胡伟平,男,1979年5 月出生,湖北省仙桃市人,讲师,西南大学逻辑与智能研究中心逻辑学 专业在读博士,西南大学育才学院理工学院副院长。下三类:基于人脸几何特征、基于人

5、脸统计特征、基于人脸频率域特征。基于几何特征的方 法通常情况下需要进行手工标点,不符合实时识别的要求,同时使用有限的特征点来代表人 脸图像,会丢失掉细节数据;基于人脸统计特征研究最为广泛,比如著名的PCA方法1就属 于这类,但是这类方法都是基于图像整体特征,很容易受到光照、角度等的影响,同时计算 量偏大;基于人脸频率域特征的研究是目前研究较为集中的领域,其中最出名的就是Gabor 小波方法,这类方法的计算量也偏大。如何把人脸识别成功应用于生产生活取决于两点,一个是计算量的降低,满足现场检 测实时性的要求,另一个是识别率的提高。而要想达到这两点,笔者认为光从技术层面是不 够的,有必要从认知科学的

6、角度来考虑人脸识别的问题。二、人脸认知的研究现状人脸的认知研究目前主要包括人脸认知中特征和结构信息的作用规律、跨种族效应以及 儿童人脸认知发展规律等三个方面研究。大多数理论认为人脸的信息分为结构信息和特征信息2-6。结构信息指的是人脸主要器 官之间的空间关系。特征信息指的是人脸主要器官的结构和形状7-8。结构信息和特征信息 在人脸认知中的作用是这些理论争议的重点。关于结构信息和特征信息的理论主要有三种: 人脸整体加工的理论9、人脸认知的多维空间理论10以及人脸认知两种模式理论11。目前对 人脸反转效应的研究多数支持人脸认知两种模式理论,但是也有少部分支持人脸整体加工理 论12-15。人脸认知中

7、的跨种族效应(cross一race effect)是指人们对本种族人脸的辨认绩效往 往高于对其他种族人脸辨认的绩效。比如Brigham在1986年的实验表明:无论黑人被试还 是白人被试均表现出对本种族人脸的辨认绩效要高于对其他种族人脸的辨认16。国外对跨种 族效应机制的解释主要有以下观点11: (1)人们对本种族人脸的加工程度较深导致了跨种族 效应; (2)由于人们对本种族人脸的判断标准比对其他种族的严格,从而比判断其他种族人 脸的相似性程度高; (3)由于实际生活中,对本种族人脸的接触较多,从而习得了精确区别 本种族人脸的各个维度,这导致对本种族人脸的辨认较为容易。虽然上述这些观点的提出都

8、有一定的理论和实验基础,但对人脸认知中跨种族效应的机制至今还没有确定的解释。在许多人脸认知的研究中发现,儿童和成人对人脸的识别存在显著差异,但儿童对人 脸再认的能力会随着年龄的增长而加强,其原因之一可能是儿童的人脸加工方式不同于成 人。Yin(1969), Goldstein(1975)等人发现当人脸反转呈现时,成人比儿童在辨认过程中更 容易发生错误。利用人脸结构信息和特征信息加工不同的观点,1977 年 Diamond 和 Gareey 通过实验发现:儿童在人脸加工中主要侧重特征信息,而成人则主要侧重结构信息。三、人脸认知研究成果的应用思考人脸认知属于认知科学和认知心理学的范畴,如果能将其中

9、的研究成果用于人脸识别, 对于现有人脸识别方法的改进或者是新的人脸识别方法的设计,都是很有意义的事情。下面 提出几点如何将人脸认知的研究成果用于人脸识别的思考。1、人脸认知中整体信息和局部信息并存,整体信息起主导。人脸的结构信息即是整体信息,而特征信息则是局部信息,这两种信息在人脸认知中 都起着十分重要的作用。通常我们个人记忆或者识别某个人,使用的是这个人的整体形象,而不是具体的某个 人脸器官,比如把我们熟知的某个亲人的照片给我们看,我们会一眼认出,但是如果仅仅把 照片上的眼睛或者鼻子单独拿出来让我们辨认的话,我们通常情况下是识别不出哪是谁的眼 睛或者鼻子的。结构信息可以用于识别人的另一个有力

10、证据就是漫画或者肖像画。通过一幅 简单勾勒出来的肖像画,我们可以识别出那是谁,肖像画与真实的图像差异很大,其中基本 不存在人脸器官的局部信息,主要是人脸器官的位置关系等结构信息,由肖像画可以识别出 人,这有力地说明了结构信息在识别中起到了主导作用。现在已经有人专门针对肖像画的识 别开张了相关研究工作17。18但是局部信息在人脸识别中也起到了很好的辅助作用。生活中拥有某些特殊特征的人, 比如脸上有刀疤或者痣,再或者是鹰勾鼻子的人,则很容易被人记住并再次辨认出来,这说 明特征信息起到了帮助人快速检索的作用。根据以上分析,人脸的结构信息即人脸器官的相对位置关系应该作为辨识的主要依据, 而人脸的特殊特

11、征信息则可以作为快速排除的依据。在设计人脸识别算法的时候可以设计成 两级分类器,第一级使用人脸的特殊结构信息进行快速的粗筛选,第二级使用人脸的结构信 息进行进行精筛选。2 、人脸的识别有别于其他物体的识别,有专门的识别方法,而且人脸认知能力是一个 逐渐学习、逐渐强化的过程。面孔失认现象一般情况下解释为是面孔识别涉及一些其他对象识别不需要的特殊加工 机制,在 1997 年 Kanwisher、McDermott 和 Chun 对面孔、拼凑的面孔、房子和手的大脑激 活区域进行比较时,获得了非常清楚的关于面孔识别机制的证据,他们在右侧梭状回 (Fusiform Gyrus)的某些部分发现了与面孔识别

12、有关的特异性激活,而且其他研究者已重 复了这一现象。对于跨种族效应和儿童认知人脸的研究在认知科学届有不少不同的解释,但这两者其实 都说明了一个问题:人脸认知的能力是一个逐渐学习、逐渐强化的过程。对于跨种族效应的 三种解释,第三种解释较为合理一些,因为每个种族的人从出生到成长,所见到的大部分是 本种族的人,所以平常无意识中所做的本种族人脸的区分练习是相当多的,自然形成了一套 区分的标准和方法,他对于本种族的人脸的区分显然要比非本种族的人脸的区分要容易。而 儿童的人脸识别能力的变化以及与成人识别能力的区别,正是说明了每个人的人脸识别能力 是一个渐进的逐渐完善的过程。关于跨种族效应和儿童认知人脸的问

13、题,现在还没有给出统一的令人满意的解释,但 是这一发现却可以为人脸识别方法的设计提供一些思路。首先,人的人脸识别能力并非与生 俱来,而是通过训练得来的,而且在训练中将逐渐强化,这是一个动态的学习过程。在人脸识别算法的设计中可以采用同样的思路,使得识别算法随样本的添加而逐渐变 得更“聪明”。最初的识别器可能非常粗糙,识别率比较差,但随着样本的逐渐添加,识别 率越来越高,这种识别器可以使用神经网络或者其他的一些可以自学习的算犯来实现,或者 是采用遗传算法或模拟退火等方法对人脸识别器进行优化。四、需要弄清楚的一个问题人脸认知研究的是人对于人脸的认知的问题,而人脸识别研究的是计算机识别人脸的问 题,这

14、两者有联系,但是也有区别。在将人脸认知的结论用于人脸识别的过程中,有必要弄 清楚一个问题研究人脸识别方法的目的是什么?是设计出使得计算机可以按照人认知 人脸的方式运作,最大程度上再现人认知人脸过程的算法,还是设计出使得计算机按照它自 己的方式运行,对人的识别进行辅助的算法。这个问题的不同回答将影响到人脸识别问题的 研究方向。在回答这个问题之前,先弄清楚人如何进行识别以及人的识别能力强弱的问题。人的识 别能力到底强不强?从某种意义上来说人的识别能力应该算比较强的,但是,人的识别并非 仅仅依靠人脸图像,而是一个多种识别机制同时起作用的过程,比如声音、步态、衣着、发 型等等,综合考虑这些因素的情况下

15、,人可以很容易识别出某一个人。如果仅仅靠人脸图像, 人的识别能力到底有多强,这是一个未知数。现在来回答刚才提出的问题,我们研究人脸识别方法的目的是什么? 如果是第一种选择,那么设计的算法应该是尽可能与人的思维方式相接近,并且给出 模糊的结论。人的识别通常情况下是综合考虑多种情况之后,快速地给出模糊的结论,比如 对于一张照片,通常情况下识别人给出的都是类似于“比较像某人”或者“不太像某人”之 类的模糊的结论。采取这种思路的话,识别算法将不再局限于人脸信息,应该综合考虑人的 其他特征信息,把精力放在各种不同特征信息的融合上。设计算法中还需要注意研究人是如 何进行快速的模糊推理的。人进行推理的最大特

16、点是给出的结论不一定十分准确,但是推理 过程很快,正如卡斯帕罗夫计算国际象棋的后续棋路计算不过“深蓝”,但是可以依据他的 模糊计算给出大致准确的方向而赢下它。如果是第二种选择,那么我们设计的算法应该是不同于人的识别,而是利用计算机速 度快的特点,进行精确的计算,然后给出人一些辅助性的结论,帮助人进行识别。在这种思 路中,人脸的识别算法应该是交互式的,结合计算机的快速和人的智能来共同完成识别。利 用操作者提供的一些资料,计算机进行快速的搜索和辨别,最后给出操作者一些辅助性的建 议,比如列出满足当前条件的人脸,供操作者来做最后决策。在这种思路中,精力应该主要 放在交互上面。这个问题的核心问题其实仍

17、然归结到计算机是否具有智能的问题上,如果计算机有智 能,那么第一种思路就是可以实现的,而如何否认计算机的智能,那么就干脆让计算机做一 些不需要智能的辅助工作。就目前的冯.诺伊曼体系结构的计算机来说,因为其先存储后顺序运行的思想决定了当 前的计算机不管结构如何,其本质上都是线性的。而从算法的复杂度方面来考虑,对于人脸 识别这种复杂的问题,线性计算是不可解的。因此,在目前这种结构体系下,计算机的智能 是不可实现的,采取第二种思路更实际一些。但是随着对计算机体系以及新兴计算机量子计算机和生物计算机等的研究,可以 预见在未来冯.诺伊曼体系将逐渐被取代,并行运算的计算机将逐渐成为主体,而计算机的 智能或

18、许不再成为一个不可实现的问题,那个时候第一种思路也将成为可能。四、结论本文在研究了人脸识别和人脸认知的现状之后,提出了将人脸认知中的成果应用于人脸 识别需要考虑的两个问题,给出了人脸识别算法设计中可以借鉴的一些思路,同时也提出了 一些值得思考的问题,希望能给人脸识别算法的设计者和研究者一些启示。参考文献1 Turk M,Pentland A. Eigenfaces for Recognition J.Jounral of Cognitive Neuroscience,1991,3(1):71-862 Garner,W R. Aspects of a stimulus:Features,dime

19、nsions,and configurations.In : Rosch H, Lloyd B.B (Eds.).Cognition and categorization. Hillsdale, NJ: Erlbaum.1978:991333 Carey S,Diamond R. From piecemeal to configurational representation of faces. Science,1977,195:312-3144 Tanaka J W , Farah M J. Parts and wholes in face recognition.Quarterly Jou

20、rnal of Experimental Psychology,1993,46A:225-2455 Valentine T. Upside-down faces:A review of the effect of inversion on face recognition. British Journal of Psychology,1988,79:471-4916 Rakover S. Featural vsconfigurational information in faces:A conceptual and empirical analysis. British Journal of

21、Psychology,2002,93:1-307 Diamond R, Carey S. Developmental changes in the representation of faces. Journal of Experimental Child Psychology,1977,23:1-228 Tanaka J W ,Scngco J A. Features and their configuration in face recognition. Memory and Cognition,1997,25:583-5929 Farah M J,Tanaka J W, Drain H

22、M. What cause the face in-Version effect? J. Journal of Experimental Psychology: Human Perception and Performance,1995,21(3):628-63210 Valentine T. A unified account of the effects of distinctiveness,inversion,and raceinface recognitionJ. Quarterly Journal of Experimental Psychology, 1991,43A:161-20

23、411 Diamond R,C arey S. Why faces are and are not special:An effect of expertise J. Journal of Experimental Psychology:General,1986,l15(2):107-l1712 Yin R K. Looking at upside-down faces. Journal of Experimental Psychology,1969,81:141-14513 Friere A, Lee K, Symom L. The face inversion effect as a de

24、ficit in the encoding of configural information: Direct evidence. Perception,2000,29:159-17014 Searcy J H, Bartlett J C. Inversion and processing of component and spatial-relational information in faces. Journal of Experimental Psychology: Human Perception andPerformanee,1996,22:904-91515 Rhodes G,

25、Brake S, Atkinson A P.Whats lost in inverted faces? Cognition,1993,47:25-5716 Bruce V, Young A. In the eye of the beholder:the science of face perceptionM. Oxford University,1998. 111-l1317 陈洪, 郑南宁, 梁林, 徐迎庆, 沈向洋. 基于样本学习的肖像画自动生成算法 . 计算机 学报. 2003,26(2): 147-152.18 闵锋, 桑农 . 一种基于与或图表示的多风格肖像画自动生成方法 . 计算机学报 . 2009,32(8): 1595-1602.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!