人类步态的支持向量机识别

上传人:QQ-1****6396 文档编号:16076995 上传时间:2020-09-17 格式:DOCX 页数:51 大小:267.59KB
收藏 版权申诉 举报 下载
人类步态的支持向量机识别_第1页
第1页 / 共51页
人类步态的支持向量机识别_第2页
第2页 / 共51页
人类步态的支持向量机识别_第3页
第3页 / 共51页
资源描述:

《人类步态的支持向量机识别》由会员分享,可在线阅读,更多相关《人类步态的支持向量机识别(51页珍藏版)》请在装配图网上搜索。

1、人类步态的支持向量机识别摘要步态作为一种适用于非接触式远距离身份识别的生物特征近年来倍受关注。步态识别主要由三部分构成:步态序列图像预处理、特征提取和分类识别。步态特征可根据是否对人体结构进行建模分为两类:基于模型的特征和非基于模型的特征。提出了三种步态特征提取方法,分别是人体结构模型、肢体角度模型和人体轮廓模型。其中,前两种是基于模型的特征,后一种是非基于模型的特征。使用 VC+6.0 作为开发工具,编写了步态特征生成程序。常用的步态识别算法有动态时间规整、隐马尔可夫模型和神经网络等,这些方法主要适用于大样本的情形,现实中的样本数目往往有限,为解决小样本问题,采用了支持向量机来进行步态识别。

2、支持向量机与传统方法相比,具有泛化能力强、能保证全局最优等优点。选用 CASIA 数据库,利用支持向量机软件 LIBSVM 对提取的步态特征进行了训练与识别,并对不同的核函数的识别效果进行了比较。实验结果表明,基于支持向量机的步态识别算法能够有效地对步态进行分类,具有良好的识别性能,不同核函数对分类结果影响不大。关键字:生物特征,步态识别,特征提取,支持向量机IIAbstractGait has recently drawn greater attention as a long-distance non-contact biometric identification.Generally,

3、gait recognition consists of three parts: preprocessing of gait sequences, feature extraction and classification.Depending on whether the structure of the human body is modeled, Gait characteristics fall into two categories: model-based and model-free characteristics. Three gait feature extraction m

4、ethods, namely, the human body structure model, the body angle model and the human body contour model. Two of these are model-based characteristics and another is model-free characteristics. As a development tool, VC +6.0 was used to develop a procedure to extract gait feature.The usual gait recogni

5、tion algorithms include Dynamic Time Warping, Hidden Markov Models and Neural Networks. These methods are mainly applicable to the large samples. Due to the number of samples are limited in reality, the method based on Support Vector Machine which can clssify small samples is proposed. Compared with

6、 traditional methods, this method can clssify effectly with strong generalization performance and good global optimum.CASIA gait database and LIBSVM software are used to classify the characteristics of gait with different kernel function . The result indicate that the algorithm based on SVM can clas

7、sified effectively with good identification performance on which the different kernel function has a slight impact.Key words: biometrics characteristics, gait recognition, feature extraction, support vector machine人类步态的支持向量机识别目录第一章前言11.1 生物识别技术11.2 步态识别研究现状11.3 论文主要内容4第二章步态识别概述62.1 人体检测与跟踪.62.2 步态特征

8、提取.92.3 识别算法.10第三章步态特征提取123.1 基于模型的方法.123.1.1 人体结构模型.123.1.2 肢体角度模型.163.2 非基于模型的方法.173.2.1 人体轮廓模型.173.3 特征提取程序.19第四章步态识别算法214.1 支持向量机原理.214.2 支持向量机的数学模型.244.2.1 线性模型.244.2.2 非线性模型.244.3 SVM 的具体实现25第五章步态识别实验275.1 实验工具.275.2 步态常用数据库.275.3 实验过程.28第六章技术经济分析346.1 技术可行性.346.2 经济效益和前景.34第七章结论与展望357.1 结论.35

9、7.2 展望.35参 考 文 献.37致谢39附录40第一章 前言1.1 生物识别技术生物识别技术是依据人类自身所固有的生理或行为特征而进行识别的一种技术1。生理特征与生俱来,多为先天性的,如指纹、眼睛虹膜、脸像等;行为特征则是习惯使然,多为后天形成,如笔迹、步态等。常用的生物特征包括:脸像、虹膜、指纹、掌纹、声音、笔迹、步态等。与传统的身份鉴定手段相比,基于生物特征识别的身份鉴定技术具有以下优点:1、 不易遗忘或丢失;2、 防伪性能好,不易伪造或被盗;3、“随身携带”,随时随地可用。在国外,生物特征认证技术的软硬件相对比较成熟,已经产生了比较有规模的技术成熟、有实力的厂商。生物识别技术的产品

10、在主流社会中开始了比较大规模的应用,在很多国家,政府采用法律规定的方式来保证生物识别技术的应用。如在美国,9.11事件以后,三个相关的法案(爱国者法案、边境签证法案、航空安全法案)都要求必须采用生物识别技术作为法律实施保证。总体上来说,应用已经进入了以政府级应用为主的阶段,其他主要的应用领域包括: 机场、政府部门、门禁、考勤、金融管理服务系统、计算机登录管理、医疗保健系统等等。在国内,经过多年的发展,生物识别核心算法有了比较大的发展,但是距离国外优秀的算法仍有一定差距。在智能房间的门禁系统、军事安全基地的视觉监控系统、高级人机交互等应用中,人的运动分析与生物特征识别相结合的研究日益显得重要。在

11、人机交互中不仅需要机器能知道人是否存在、人的位置和行为,而且还需要利用特征识别技术来识别与其交流的人是谁。远距离的身份识别已经越来越重要,目前的研究主要集中在人的脸像识别、步态识别或特定行为的识别。近距离时一般可以通过跟踪人脸来加以身份识别;如果是远距离的监控, 脸的特征可能被隐藏,或者分辨率太低不易识别, 然而进入监控领域的人的运动步态是可见的,这激活了步态作为一个独特的生物行为特征应用于人的身份鉴别。1.2 步态识别研究现状步态识别是近年来为越来越多的研究者所关注的一种较新的生物认证技术, 它通过人的走路方式来识别人的身份。38早期的医学研究表明:人的步态中有24种不同的成分,如果把这24

12、种成分都考虑到,则步态是为个体所特有的16。在Johansson早期的物理心理学实验中, 受试者能够仅仅通过观察附着在运动中人的几个关节上的灯泡的运动轨迹(MLD,moving light disp lays)来识别运动的类型15。后来的实验表明:熟人的身份、人的性别都能够通过这种MLD实验识别出来。近年来,步态分析这一跨学科领域的研究成果进一步说明了在步态视频序列中含有人的身份信息15。从生 物力学的角度来看,人的步态包含身体上百种肌肉和关节的综合运动。这些运动对所有人来说都遵着基本的双足模式,然而对于不同的人其运动又有差异,例如相对时序和幅度的不同。这些差异是整个肌肉和骨架(身体的重量、肢

13、体的长度、骨骼的结构)的函数。因为结构难以复制,所以步态被认为是个体特有的,且完全决定于几百个运动学参数。这些运动学参数包括特定关节点的角速度、加速度以及肢体的边界等。以上研究是步态识别作为一种生物认证技术的科学依据。在应用领域,类似于人脸识别,它要解决识别和校验两类问题25。在识别问题中,给出未知身份人的步态,在数据库中搜寻与之匹配的人的步态,从而确认人的身份;在校验问题中,需要步态识别算法对已假定的某人的身份作出判定, 即接受或拒绝所假定的身份。步态识别作为一种生物认证技术,具有其他生物认证技术所不具有的独特优势,即在远距离或低视频质量情况下的识别潜力,且步态难以隐藏或伪装等。例如,目前人

14、脸识别技术受限于视频质量和拍摄角度;指纹、虹膜等生物认证技术要求近距离或接触性的感知(如指纹需要接触指纹扫描仪等)。在黑夜中,步态识别能更大地发挥其作用。如果步态数据库非常大,步态信息并不足以鉴别每一个个体,即使如此,步态仍能作为一种索引工具去缩小搜索范围,如对嫌疑犯的排除。在计算机视觉领域,步态识别是指在视频序列中自动提取表征人步行特征的视觉线索以达到鉴别人的身份的目的8。然而,医学研究所确定的特征,或者因为特征本身没有可重复性,或者由于观察角度的限制和自遮挡问题,并不适于基于计算机视觉的系统去提取。从医学的角度来看,这些模式决定了个体之内的一致性和个体之间的变化性。从计算的角度来看,从低质

15、量和没有标记的视频序列中对运动物体进行跟踪和分割的算法的不精确性引入了所提取特征的不可靠性, 而由摄像机深度和角度的不同引入的透视的影响使特征提取过程变得十分繁重。在人体模型所表达的特征不足以表现人的步态的情况下,产生了另外一大类基于整体的方法,即用统计方法从步行者的图像序列中表征这种时空模式。它们或者是提取未经任何转化的表达这种时空模式的数据(即二进制或彩色的剪影时间序列或者光流图像序列),或将这些数据映射为一个更为简洁的1维或2维信号。基于整体的方法对视角及外形的变化没有鲁棒性,且不能处理遮挡问题(人行走时有自遮挡现象,并且人的走路姿态会被提箱、伞、背包挡住)。对步态识别方法的探索涉及计算

16、机视觉领域里的许多难题,例如人的运动的动力学建模和描述、自动背景减除、时域信号的匹配等。步态识别问题是人的运动分析的一个子问题, 因而步态识别问题的研究成果有可能扩展应用于解决计算机视觉领域里的其他 问题,如区分不同的运动(区分走路、跑步、打网球的击球动作) ,手语的解释等。而相关领域的研究成果也有可能应用于步态识别,如周期性运动分析的研究成果有可能应用于步态识别。另外统计形状分析的成果也在步态识别问题中得到了很好的应用。因此步态识别问题是可以吸收其他相关研究领域研究成果的一个开放的问题。如同在文献中所指出的:影响人脸识别快速发展的因素为众多的研究者和研究团体的参与研究、可得到的大型人脸图像数

17、据库以及有用于评价人脸识别算法性能评价标准。步态识别问题同样受以上因素影响22。通过上面的概述,我们可以了解到基于步态识别的远距离身份认证系统所涉及到的几项关键技术包括:视频处理、图像处理、模式识别。步态识别主要是针对含有人的运动图像序列进行分析处理,通常包括:人体检测、步态特征提取以及身份识别。首先对进入视频的目标进行检测和跟踪,提取其步态特征,然后与先前存储的特征样本数据库进行比对,从而实现步态的分类与识别。其中步态识别的关键是如何寻找合适的特征及识别算法。目前,在寻找合适的步态特征方面已做了很多工作,大致可以分为两类9: 基于模型的方法:对人的身体结构或运动进行建模,通过提取图像特征并且

18、映射它们到模型的结构分量或导出体元的运动时间轨迹来识别个体。目前所使用的主要模型有: Lee等建的椭圆模型:对人体侧面投影所构成轮廓图像进行二值化处理,依据质心比例关系将人体分成7个部分,用椭圆对每一部分建模,以椭圆的质心、离心率等参数作为反映人体步态的特征参数17。Cunado等人建立的钟摆模型:将大腿建模为链接的钟摆,并从其倾斜角度信号的频率分量中获取步态特征11。三维模型:为克服二维模型中遮挡、运动方向变化带来的问题,Urtasun等人将Cunado等人的方法扩展到三维空间,提出了基于主元分析(PCA)的三维人体运动模型。非基于模型的方法:不考虑潜在的结构,而是特征化人体整个运动模式以得

19、到简洁的运动特征表达。其中,最常用的就是步态轮廓特征。这类算法和身体的结构、步行的动态特性没有直接关系。如Kale从每一个对象的图像序列中选择、建立一组样本,使用这些样本生成一个维数较低的样本距离框架矢量,然后使用连续隐马尔可夫模型进行训练,对各模型输入待测样本,根据输出结果即可达到识别目的19。步态的识别方法主要分为以下两种:模板匹配方法:将图像序列转换为一组静态形状模式,然后在识别过程中和预先存储的行为标本比较。把相似度作为分类的标准,常采用最近邻算法进行识别。模板匹配中其中一种有效的方法是动态时间规整(DTW) 24。动态时间规整具有概念简单、算法鲁棒的优点,早期被广泛的应用于语音识别领

20、域。利用DTW 可以在测试序列与参考序列的时间尺度不一致的情况下较好地完成测试序列与参考序列之间的模式匹配10。统计方法:模板匹配实际是一种基于距离度量的方法,在步态识别中使用这种方法就忽略了隐含在步态序列中的姿态之间的联接关系,而隐马尔可夫模型(HMM)可以很好地融合这些信息。HMM的使用涉及到训练和分类两个阶段,训练阶段包括指定一个隐马尔可夫模型的隐藏状态数,并且优化相应的状态转换和输出概率;分类阶段涉及到一个特定的HMM可能产生相应于所观察图像特征的测试符号序列的概率的计算。步态周期可以看作一个双重随机过程,其中隐过程用姿态之间的转移来描述,而显过程则用特定姿态下的图像特征刻画。在基于隐

21、马尔可夫模型的步态识别中,步态序列被看作是人体行走姿态在给定约束下的一种遍历关系24。此外,还有神经网络法、支持向量机(SVM)方法。其中,SVM是近年来在模式识别与机器学习领域中出现的新工具,它以统计学习理论为基础,有效地避免经典学习方法中过学习、维数灾难、局部极小等传统分类存在的问题。在小样本条件下仍然具有良好的范化能力,因此受到了广泛的关注,而且成功应用到了人脸识别、文本分类、基因分析、手写体识别、语音识别等多种领域,在步态识别中也成功运用了SVM方法。在支持向量机应用过程中,可以采用不同的核函数, 核函数的类型及其参数的选择对支持向量机的性能有重要影响,但如何选择合适的核函数及其参数,

22、目前还没有统一的标准。总之,利用步态作为一种生物识别特征在计算机视觉领域中还是一种新的研究领域。在国内还没有展开广泛的研究,国外也只是处于研究阶段,还没有成型的产品出现。随着对监控技术发展的需求,会越来越引起人们对步态识别研究的兴趣。1.3 论文主要内容本文探讨了步态识别在生物识别技术中的优越性,分析步态图像序列的检 测、特征提取、分类识别的各种方法,总结了国内外步态识别常用的研究方法。步态识别就是要对包含人体运动的图像序列进行分析处理,通常包含人体检测、人体跟踪、特征提取、识别算法4个过程,本文的侧重点是步态特征的提取与识别。步态特征提取方法主要分为两类:基于模型的方法和非基于模型的方法,

23、本文运用三种步态特征提取的方法,分别是人体结构模型、肢体角度模型和人体轮廓模型,其中前两种是基于模型的方法,后一种是非基于模型的方法。提出了基于支持向量机的步态识别算法,以CASIA数据库为资料,以VC+6.0为开发工具,编写步态特征提取程序,将提取的步态特征向量通过支持向量机进行分类识别,并更改其核函数、参数,总结不同方法的优缺点,并分析核函数的优越性,作出统计。第二章 步态识别概述步态识别就是要对包含人体运动的图像序列进行分析处理,通常包含人体检测与跟踪、特征提取、识别算法3个过程,其一般处理框架如图2.1所示34。图2.1步态识别流程图2.1 人体检测与跟踪检测的目的是从图像序列中将运动

24、人体区域从背景中提取出来,这是步态识别的前提。当前用于人体检测的方法有背景减除法、光流法、统计法、帧间差分法等3。1、背景减除法34是最常用的方法,通常用于简单的均匀或静止背景中, 利用当前图像与背景图像的差分来检测运动物体。Wren等人用高斯分布来表示每个像素的颜色强度,研究了室内人体的运动检测与跟踪;Friedman和Russell将像素的灰度值看作是背景、前景和阴影3个高斯分布的加权,同时采用EM(期望最大化)算法获得模型参数;Stauffer和Grimson 采用K个高斯分布的混合模型建模背景像素的分布规律;Magee建立了多个前景模型与之前的方法相结合,实现了更为有效的运动检测;Ja

25、ved等人利用颜色和边缘信息进行背景相减,算法包括像素级、区域级、帧级处理;Elgammal等人提出一种无参数的核密度估计算法,提高了运动检测的灵敏性;Kruger等人使用了基于概率模型的背景减除方法。对于任意的视频,我们通过三个步骤进行图像的预处理,包括:背景建模、差分后二值化和步态轮廓处理。(1)、背景建模背景建模采用中间值的方法从图像序列中恢复背景图像,具体方法如下:f(k,x,y), k=1,2,.,n是一序列步态彩色图像,令g(k,x,y)表示由f (k,x,y) 灰度变换后的灰度图像,Bg(x,y) 表示建立的灰度背景,即:Bg (x,y) =medg(k,x,y)背景差分得:Di

26、stance(Bg(x,y),g(k,x,y)=|Bg(x,y)g(k,x,y)|背景差分值取当前帧f(k,x,y)与背景B(x,y)的各分量作差的绝对值最大的一个12。(2)、差分后二值化经过当前图像与背景图像的差分获得的前景目标灰度图像要提取清晰的步态轮廓,就必须进行二值化。然而,二值化的阈值的选择却是非常困难的,尤其对于那些低对比度的图像,由于亮度变化太低,因此难以从噪声中将运动目标完全地提取出来。有的脚下还存在阴影,可以使用迭代的方法获得图像的阈值。设图像中灰度值为i(i=0,255)的像素点个数为pi,那么迭代公式可表示为:i Pi it = ( t n-1+ t n-1) / 2n

27、i Pit n-1运用此方法可自动获取二值化的阙值,阙值为T0。(3)步态轮廓处理经过上述处理后,得到的二值图中的前景区域不一定都是真正的运动目标。一方面需要将属于目标的离散点组合起来,另一方面又要去除噪声和阴影。需要使用形态学算子进一步滤除噪声和填充小的空洞,并且执行连通分量分析来提取一个单连通的运动目标。为了减小分割误差,可以执行一种基于轮廓边缘相关的配准方法以进一步跟踪前景区域。一个步态轮廓检测过程如图2.2所示。 |原始图像-背景图像|=前景目标 二值化 轮廓提取图2.2 步态轮廓检测过程人体区域检测:经过处理后的图像中,前景只包含人体,根据像素值可以找出前景中包含人体的最小矩形区域。

28、一个右脚向前迈的步态周期图像样本如图2.3 所示。图2.3一个步态周期图像样本这类方法一般能够提供完全的特征数据,但对由于光照及其他外界扰动引起的场景变化特别敏感,主要应用于静止背景的情况。2、光流法利用运动目标随着时间变化的特性,通过计算帧间像素的位移来提取人的运动34。Sidenbladh利用浓度光流特征来训练SVM(支持向量机),从而检测人的运动;Ishiyama等人使用线形光流算法实现了高速、高精度的光流检测。光流反映了序列图像中的速度场,光流法善于在运动场景中捕捉运动对象的运动特性,但是大多数光流法的计算比较复杂并且抗噪性比较差,这就阻止了它在实时智能监控系统中的应用。3、统计法是基

29、于像素的统计特性而从背景中提取运动信息。它首先计算背景像素的统计信息(颜色、灰度、边界等) ,再将现有像素与之比较,然后归类。该方法比背景减除法更强壮,但涉及大量计算和变换3。4、帧间差分法帧间差分法利用视频序列中连续2帧或3帧图像亮度变化来提取运动目标4。Lipton等人使用连续两帧图像的差分检测运动目标;Collins等人提出了一种3帧时间差分方法,改善了对噪声的敏感性;Chang等人改进了传统的帧间差分方法,结合连通分量标记、形态学运算和人体结构分析来滤除噪声和阴影的影响提取运动目标;Guo等人利用帧间差分和统计方法相结合的方法有效地检测运动目标。帧间差分法方法简单,运算速度快,易于实现

30、,能较快适应动态场景的变化; 其不足之处在于对噪声敏感,运动物体内部亮度较均匀时只能检测到目标的边 缘,无法检出整个物体。2.2 步态特征提取步态特征提取是步态识别的关键,总的说来,可以划分为基于模型和非基于模型两类方法3。1、基于模型的方法基于模型的方法对人体结构或人体运动建模后,将2维图像序列数据与模型数据进行相关匹配来获取特征或模型相关参数37。对于基于人体结构模型的方法,通过将序列图像的每帧与模型匹配获取可变形模板的参数(如角度,轨迹信息);而基于人体运动模型的方法则通过学习个体的运动参数来识别个体。下面介绍几种主要的模型:(1)、椭圆模型在椭圆模型中,Lee等人用7个椭圆来建模人体的

31、各个部分,提取椭圆参数(长短轴之比、质心坐标、主轴夹角)以及人体结构参数(质心坐标)共29个参数作为步态识别的特征17。(2)、钟摆模型Cunado等人将大腿建模为连接的钟摆,并从其倾斜角度信号的频率分量中获取步态特征11;Yoo等人采用类似的线状人体模型,通过线性回归分析,获取身体各部分的角度信号18;Yam等人采用耦合钟摆模型刻画大腿和小腿的运动, 通过对其摆动的周期分析获得相位加权的傅里叶描述的步态信号。(3)、3维模型为克服2维模型中遮挡、运动方向变化带来的问题,Urtasun等人将Cunado等人的方法扩展到3维空间,提出了基于PCA (主元分析)的3维人体运动模型11 ; Dock

32、stader等人则采用分层结构模型对人体运动进行分析;Han等人根据2维人体形状数据采用最小二乘法拟合3维人体运动模型,从而获得运动参数的估计。基于模型的方法优点在于步态特征能够直接从模型中获得,步态特征可以很方便地用低维的数据空间表示,便于理解,另外,基于模型的方法对外界的干扰和噪声影响不大;缺点是匹配和搜索过程比较复杂,计算代价高,不利于进行实时检测。2、非基于模型的方法非基于模型的特征提取方法不需要建立模型,而是直接从人体轮廓或运动中提取步态特征参数,再进行步态识别3。Kale等人利用人的二值化图像的侧面外轮廓作为图像的特征,对于每一个人在一个步态周期内利用均值算法选择一个标本集,在识别

33、的过程中计算一个步态序列的每一帧与标本集合之间的所谓的FED矢量,采用HMM进行步态识别19; J.Little和J.Boyd利用步态序列图像的光流的频率和相位信息进行步态识别20; Chiraz Ben和Abdelkader分别提供了一种基于步态图像自相似性的非参数化方法和一种基于步态的周期和跨距的参数化方法进行基于步态识别的身份认证21; Johnson与Bobick在步态识别中使用了静态身体参数,假设人体的高度基本不变, 从上到下的人体轮廓左右两边的距离构成一个宽度矢量,作为步态识别的特征; 王亮25提取运动人体的外轮廓,计算人体质心,然后计算运动过程中轮廓上每 个点与质心的欧氏距离作为

34、人的步态特征。非基于模型的方法的优点是算法的适应性好,不仅适用于人也可以适用于其它运动物体,另外,计算量较小,可以符合实时性要求;缺点是对外界干扰(如遮挡、光照)比较敏感。2.3 识别算法目前已有几种信息检测与分析算法用于步态识别,但多为常用的模式分类器, 且未形成完整的实用系统。常见的方法有动态时间规整DTW(Dynamic Time Warping)、神经网络NN(Neural Network)分类、及隐马尔可夫模型(hidden Markov model,HMM)和支持向量机分类SVM(support vector machine)等2。1、动态时间规整DTW(Dynamic Time

35、Warping):DTW具有概念简单、算法鲁棒的优点,早期被广泛地应用于语音识别中,并且最近才被用于匹配人的运动模式13。Kale采用动态时间规划对待测序列和样本序列进行匹配对比,对步行中可能出现的速率变化进行非线性调整,并且获得了满意的结果5。对DTW而言,既使测试序列模式与参考序列模式的时间尺度不能完全一致, 只要时间次序约束存在,它仍能较好地完成测试序列和参考序列之间的模式匹 配。2、隐马尔可夫模型HMM (Hidden Markov Models):HMM是更加成熟的匹配时变数据的技术,它是随机状态机器。HMM的使用涉及到训练和分类两个阶段,训练阶段包括指定一个隐马尔可夫模型的隐藏状态

36、数,并且优化相应的状态转换和输出概率以便于产生的输出符号与在特定的运动类别之内所观察到的图像特征相匹配。对于每一个运动类别,一个HMM是必须的。匹配阶段涉及到一个特定的HMM可能产生相应于所观察图象特征的测试符号序列的概率计算。HMM 在学习能力和处理未分割的连续数据流方面比DTW有更好的优越性,当前被广泛地应用于人的运动模式匹配中3。3、 神经网络NN(Neural Network):它同样也是目前比较感兴趣的匹配时变数据的方法,如Guo等用其分析人的运动模式;Rosenblum等使用径向基函数网络从运动中识别人的情感5。这些方法的共同理论基础是经典统计学,采用的是研究样本数目趋于无穷大时的

37、渐进理论。然而在实际问题中,样本数目往往有限,故这些在理论上有显著长处的分类方法在实际应用中的表现却可能“不尽人意”。因此,借助现代信息处理技术,寻找适合小样本的模式识别方法成为人们的研究目标,支持向量机(support vector machine,SVM)应运而生。4、支持向量机(support vector machine,SVM):它是一种泛化能力很强的分类器,是针对小样本统计估计和预测学习的最佳理论和识别方法,与传统的模式识别方法相比具有推广能力强、能保证全局最优等优点,因而引起了国内外学者的普遍研究兴趣。目前,这种新的学习算法被建议用以替代神经网络训练方法, 并且在签名识别、人脸检

38、测、文本分类和步态识别等领域的研究中取得了比传统方法更好的结果5。第三章 步态特征提取在图像进行预处理后,要从步态序列图像中计算获取步态特征。步态特征提取是步态识别过程中最关键的工作,所选择的特征会直接影响后面的识别效果。步态特征提取的方法分为两类:基于模型的方法和非基于模型的方法。在本文中使用了三种模型进行步态特征提取,分别为人体结构模型、肢体角度模型和人体轮廓模型,其中,前两种是基于模型的方法,后一种是非基于模型的方法。3.1 基于模型的方法3.1.1 人体结构模型对步态视频序列中的每一个轮廓,本文根据人体解剖学知识,可按其身高比例,分为四个部分:头部、躯干、大腿、小腿,如图3.1所示。图

39、3.1 人体身高比例本文提取9个特征向量,分别为:(1) 、质心与左脚之间的距离l1;(2) 、质心与右脚之间的距离l2;(3) 、前半身面积sf;(4) 、后半身的面积sb;(5) 、除头以外,躯干的标准差sita1;(6) 、大腿部位的标准差sita1;(7) 、小腿部位的标准差sita1;(8) 、步长与身高的比rt;(9) 、质心偏移比dt。根据观察,步幅与高度的比例反映个体的高度;头、躯干与下肢的比例反映个体年龄特征;质心偏移反映身体倾斜程度。设人体的质心为( X ave ,Yave ) ,我们把轮廓边界上每一点看成一个矢量,用复数形式表示如: zi = xi + jyi , i =

40、 1,2,.N ,N为轮廓像素点数,则:NN1 N1 NX ave = xi i =1Yave = yi i=1(3-1)若左脚坐标为(x1,y),右脚坐标为(x2,y),则质心与两脚之间的距离l 表示为:( Xave - x)2 + (Yave - y)2l =(3-2)步长lt表示为:lt = (x2 - x1)(3-3)设头部横坐标为Yhead,则身高ht=Yhead-y,则步长与身高的比rt为:rt = lt / ht(3-4)中心坐标(x0,y0)公式如下:x0=xmin+bt/2y0=ymin+ht/2(3-5)其中,xmin为人体最左边缘的横坐标;bt为人体宽度;ht为人体高度;

41、ymin 为人体最低点。则,质心偏移比为:dt=(x0-Xave)/(y0-Yave)(3-6) 在行走过程中,人体的各个部分在不断的变化着,我们忽略人体在细节上的特点,同时获得稳定的步态特征,可以把人体各部分的面积和标准差等作为步态特征。将人体分为头、躯干、大腿、小腿部四部分后,由于人类在行走过程中,头部的变化比较小,本文选择躯干、大腿、小腿三部分作为特征代表人体在行走过程中的面积变化,它们的标准差sita可以定义为: 1 M 2k( X ( x, y) - X )2k( x , y )Wksitai =(3-7)kk其中k=1、2、3, M 2 为区域k中像素点的数目,W 表示区域k, X

42、 (x, y) 表示区域k中(x,y)处的值, X k 为区域k中像素均值。将人体分为前半区域和后半区域如图3.2所示:图3.2 人体区域划分前半身的面积sf和后半身的面积sb可表示为:Sk = P( x, y)( x, y )Rk(3-7)其中:1, (x, y) Rtatget P(x, y) = 0,(x, y) Rbackk为子块号,分别代表前半身和后半身,Rk 表示第k个子块区域 Rback 代表背景区域, Rt arg er 代表目标区域。选取经格式转换后的CASIA数据库23中的fyc-00_1-019.bmp图像为例,如下图3.3所示。图3.3 图形文件图中左脚坐标为(212,

43、20),右脚坐标为(273,20),头部横坐标Yhead=146, ymin=20。求出人体质心坐标(Xave,Yave)为(246,81),质心与两脚之间的距离l1=69.8355,l2=66.7083,步长lt=61,身高为ht=126,人体中心(x0,y0)为(242.5,83)。根据以上公式,求出图3.3的步态特征如表3.1所示:表3.1 人体结构模型步态特征步态特征l1l2sfsbSita1Sita2Sita3rtdt数据69.8466.710.47750.52250.58490.87040.37130.4841-1.75提取7个人的25张图像,每张图像上提取9个步态特征,则每人将有

44、225个特征数据。人体结构模型,总体来说比较直观,易理解,但在选取结构特征时,不易把握,计算比较复杂。3.1.2 肢体角度模型利用线段表示身体的不同部分,在图像序列中跟踪各个部分的摆动角度,利用摆动的角度作为特征进行步态识别。本文根据人体的身高比例、走路方式,得到四个关键点:(1) 、头顶坐标(xhead,yhead);(2) 、质心坐标(Xave,Yave);(3) 、左脚坐标(xfoot1,yfoot);(4) 、右脚坐标(xfoot2,yfoot)。连接各个关键点,构成人体肢体结构模型,如图3.5。图3.4 肢体结构模型为了表达步态特征,可以计算简化后的肢体模型中三部分与竖直坐标轴之间的

45、角度a1,a2,a3,同等条件求其正切值tan1,tan2,tan3,来表示每部分的角度:tan1=(Xave-xhead)/(yhead-Yave)tan2=(Xave-xfoot1)/(Yave-yfoot)(3-8)tan3=(xfoot2-Xave)/(Yave-yfoot)例如图3.4中人体顶部坐标( xhead,yhead ) 为(245,146),右脚坐标(xfoot1,yfoot)为(212,20),左脚坐标(xfoot2,yfoot)为(230,20),根据人体结构模型中的公式(3-1)求出图中人体质心坐标(Xave,Yave)为(246,81)。将各个坐标带入式(3-8)中

46、,得到步态特征如下表3.2:表3.2肢体角度模型步态特征步态特征tan1tan2tan3数据0.01538580.623302-0.268481将三部分的肢体角度作为步态特征,虽然特征向量少,但计算量小,能够把握整体的特征,每个人25幅图像,共75个特征数据。3.2 非基于模型的方法3.2.1 人体轮廓模型基于轮廓的步态识别方法,从轮廓边界像素点和质心之间的距离构成特征向量集。将二维轮廓形状变化转换成一维的距离信号来近似的表达步态运动的时空变化模式6。即:( Xave - xi ) + (Yave - y )22ili =其中, (Xave,Yave) 为轮廓的质心, li为边界像素点(xi

47、, yi ) 到质心的距离。所有的边界像素点与质心的距离构成了特征向量S , 即:S = d 1, d 2, , d i, , d n。本文将Yave - yi固定选取为20和40,即,边缘点与质心纵坐标的距离为20和40。依次选取与质正负距离为20和40的八个点,如图3.6所示。图3.5 人体轮廓模型边界像素点与质心的距离表示为:l 0 =( Xave - x0)2 + 20 2 l1 =( Xave - x1)2 + 20 2 l 2 =l3 =l 4 =l5 =l 6 =l 7 =( Xave - x2)2 + 40 2 ( Xave - x3)2 + 40 2 ( Xave - x4)

48、2 + 20 2 ( Xave - x5)2 + 20 2 ( Xave - x6)2 + 40 2 ( Xave - x7)2 + 40 2 (3-9)例如图3.6中横坐标值分别为:x0=224;x4=230;x1=267;x5=257;x2=235;x6=226;x3=263;x7=267。根据人体结构模型中的式(3-1)求出图中人体质心坐标(Xave,Yave)为(246, 81)得到如下特征向量为S=l0,l1,l3,l4,l5,l6,l7,每幅图像8个步态特征,每人共25幅图像,每组共200个数据。表3.1 人体结构模型步态特征步态特征l0l1l2l3l4l5l6l7数据29.732

49、941.4843.4625.6122.8344.7245.18人体轮廓模型的特征提取方法不需要事先建立模型,原理简单易懂,算法适应性好,不仅适用于人也可以适用于其它运动物体,但易受外界环境的影响。3.3 特征提取程序本文采用的程序开发软件为 VC+ 6.0,开发出一个根据.bmp 格式的一组图像,生成步态特征的程序,分别将三种方法的步态特征提取出来,生成 SVM 软件使用的训练数据和检验数据文件格式的文件,如下: : : .是训练数据集的目标值,对于分类问题,它是标识某类的整数(支持多个类);对于回归问题,是任意实数。在本文中,提取 7 个人的步态特征,则的值应为 1,2 ,7。是以 1 开始

50、的整数,可以是不连续的。在本文中,不同的识别方法的范围也不同。在人体结构模型中,每幅图中提取 9 个步态特征,每个人提取 25 幅图像,则的取值应为 1,2,225;在肢体角度模型中,每幅图中提取 3 个步态特征,每个人提取 25 幅图像,则的取值应为 1,2,75;在人体轮廓模型中,每幅图中提取 8 个步态特征,每个人提取 25 幅图像,则的取值应为 1,2, 200;为实数,也就是我们常说的自变量,的值与序号相对应。在人体结构模型中,的值分别为 9 个步态特征的值,每人有 225 组数据;在肢体角度模型中,的值分别为 3 个步态特征的值,每人有 75 组数据;在人体结构模型中,的值分别为

51、8 个步态特征的值,每人有 200 组数据。由于篇幅原因,以肢体角度模型为例,由步态特征生成程序,生成步态特征数据如下:11:0.07953212:0.4187343:-0.05177034:0.02942025:0.6320276:0.01818387:08:0.8172749:0.074209910:-0.014085411:0.89630412:0.15507213:-0.042883414:0.89630415:0.23495516:0.014493817:0.81727418:0.2851519:0.029420220:0.6577721:0.35988622:0.043505723

52、:0.57059624:0.45369925:0.028993626:0.47865827:-0.29375128:029:0.37876730:-0.22796831:-0.015385832:0.32769433:-0.16822734:0.097077435:0.25534236:0.031260237:0.050891338:0.2120539:-0.059772540:0.031260241:0.25957342:-0.19281443:044:0.44579945:-0.2639546:0.030778947:0.57867348:-0.26848149:0.031260250:0

53、.62330251:-0.23362552:0.015385853:0.64630154:-0.25098155:0.015385856:0.62330257:-0.26848158:0.030312359:0.55699460:-0.23362561:0.030312362:0.46527563:-0.22972464:-0.015626365:0.36939366:-0.17086567:0.046909468:0.30092869:-0.12370270:0.015626371:0.23126872:-0.075902873:0.031756774:0.24345275:-0.05977

54、25其中,首数字表示值为 1;1:0.0795321 表示:,如上面数据显示,每三组为一张图片的步态特征,共有 75 组,1 1:0.0795321 2:0.418734 3:-0.0517703 表示第一个人的第一张图片的三个特征向量,即肢体模型中三部分与竖直坐标轴之间的夹角的正切值 tan1=0.0795321,tan2=0.418734, tan3=-0.0517703。第四章 步态识别算法4.1 支持向量机原理支持向量机SVM(Support Vector Machines) 是Vapnik等人建立的一种新的学习机器。它是一种泛化能力很强的分类器,是针对小样本统计估计和预测学习的最佳理

55、论和识别方法,与传统的模式识别方法相比具有推广能力强、能保证全局最优等优点,因而引起了国内外学者的普遍研究兴趣14。支持向量机的基本思想是在样本空间或特征空间,构造出最优超平面,使得超平面与不同类样本集之间的距离最大,从而达到最大的泛化能力。设给定训练数据为(x1,y1),(x,y2),(xi,yi),其中x Rn , y -1,1, ,若n维空间中的线性判别函数一般形式为:g(x)=(w.x)+b,且集合中的所有数据都可以被分类面w.x+b=0所正确划分,则该分类面就是最优超平面。而距离该最优超平面最近的异类向量就是所谓的支持向量(Support Vector),支持向量与超平面之间的距离最

56、大(即边缘最大化),一组支持向量可以唯一的确定一个超平面13。如图4.1所示:图 4.1 线性可分情况下的最优分类面图中,实心点和空心点代表两类样本,H为分类线, H1 , H 2 分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(Margin),位于它们之上的样本就称为支持向量,它们支撑了最优分类面。所谓最优分类线就是要求分类线不但能将两类无错误地分开,而且要使两类的分类空隙最大。前者是保证经验风险最小(为零),使分类空隙最大实际上就是使推广性的界中的置信范围最小,从而使真实风险最小。若提供的样本线性不可分,线性分类器的求解程序会无限循环,这就要求使线性不可分

57、的数据变得线性可分,这里就引入了核函数。如下图3.2中线性不可分问题,横轴上端点a和b之间的所有点定为正类,两边的点定为负类。线性函数不能把两类正确分开,因为二维空间里的线性函数是指直线。图 4.2 线性不可分若使用二次曲线,也即随后所说的多项式核函数,如图4.3,通过点在这条曲线的上方还是下方即可以判断点所属的类别,它的函数表达式可以写为:2g ( x) = c0 + c1 x + c2 x图 4.3二次曲线构建新的向量: y1 1 a1 c0 y = y = x y = a = c 2 2 1 y x 2 a c 3 3 2 则函数表达式 g(x) = a y ,在任意维度的空间中,这种形

58、式的函数都是一个线性函数,其中a,y是多维向量,通过向高维空间转化,使其变得线性可分,在高维空间,最优分类线就成为最优分类面。在支持向量机的学习过程中,由于采用不同的核函数得到不同的支持向量机算法,因此,核函数的类型及其参数的选择对支持向量机的性能有重要影响。在本文,我们采用下列三种核函数构造支持向量机分类器:1、线形核函数: K (x, z) = x z ;2、高斯径向基核函数:K (x, z) = exp-x - z 22s 2o 是径向基函数的宽度。3、多项式核函数: K (x, z) = (x z + 1)2 ,d是多项式的阶数。对核函数的选择,现在还缺乏指导原则,目前还没有统一的标准

59、。各种实验的观察结果表明,某些问题用某些核函数效果很好,用另一些就很差,但是一般来讲,由于径向基核函数能够较好地平滑数据中的噪声,增强了支持向量机分类算法的有效性和鲁棒性,因此,径向基核函数分类性能较为稳定。4.2 支持向量机的数学模型4.2.1 线性模型支持向量机是用分类超平面将空间中两类样本点正确分离,并得到最大的分类间隔,我们将SVM的最优化问题中的分类超平面归一化:令=1,而w和b可以按比例缩放。离超平面最近的样本(支持向量)满足:(w xi ) + b = 1,若y=1 (w xi ) + b = -1,若y=-1支持向量到超平面的距离1/ w。原问题就转换成一个有约束非线性规划问题,经运算得到原最优化问题的Wolfe对偶问题:Maximizew(a ) = a - 1 l2a iaj yiy j xi x jli =1i , j =1ls.ta i yi = 0i=1a i 0i = 1,Lli其解是原最优化问题的整体最优解。解出ai 后利用a i yi xi 确定最优超平面,注意到只有支持向量所对应的Lagrange乘子ai 才不是0。利用Wolfe对偶问题, 不但使问题更好处理,而且使样本在新问题中仅以向量点积的形式出现,正是这一重要特点,使支持向量机法能推广到非线性情况4.2.2 非线性模型把寻找最优超平面最终归结为其Wolfe对偶问题克服了“维数灾难”

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!