模式识别第4章线性判别函数.ppt

上传人:za****8 文档编号:15484670 上传时间:2020-08-12 格式:PPT 页数:48 大小:546KB
收藏 版权申诉 举报 下载
模式识别第4章线性判别函数.ppt_第1页
第1页 / 共48页
模式识别第4章线性判别函数.ppt_第2页
第2页 / 共48页
模式识别第4章线性判别函数.ppt_第3页
第3页 / 共48页
资源描述:

《模式识别第4章线性判别函数.ppt》由会员分享,可在线阅读,更多相关《模式识别第4章线性判别函数.ppt(48页珍藏版)》请在装配图网上搜索。

1、,武汉大学电子信息学院,IPL,第四章 线性判别函数,模式识别与神经网络Pattern Recognition and Neural Network,内容目录,IPL,第四章 线性判别函数,6,7,4.2 Fisher线性判别,3,4.3 感知器准则,4.5 多类问题,4.6 分段线性判别函数,5,4.1 引言,1,4,4.4 最小平方误差准则,4.7 讨论,2,第四章 线性判别函数,3,4.1 引言,基于样本的Bayes分类器:通过估计类条件概率密度函数,设计相应的判别函数,最一般情况下适用的“最优”分类器:错误率最小,对分类器设计在理论上有指导意义。 获取统计分布及其参数很困难,实际问题中

2、并不一定具备获取准确统计分布的条件。,分类器功能结构,第四章 线性判别函数,4,直接确定判别函数,基于样本的直接确定判别函数方法: 设定判别函数形式,用样本集确定参数。 使用准则函数,表达分类器应满足的要求。 这些准则的“最优”并不一定与错误率最小相一致:次优分类器。 实例:正态分布最小错误率贝叶斯分类器在特殊情况下,是线性判别函数g(x)=wTx(决策面是超平面),能否基于样本直接确定w?,引言,第四章 线性判别函数,5,线性判别函数,d维空间中的线性判别函数的一般形式:,x是样本向量,即样本在d维特征空间中的描述, w是权向量,w0是一个常数(阈值权)。,引言,第四章 线性判别函数,6,两

3、类问题的分类决策规则,引言,第四章 线性判别函数,7,线性判别函数的几何意义,决策面(decision boundary)H方程:g(x)=0 向量w是决策面H的法向量 g(x)是点x到决策面H的距离的一种代数度量,引言,第四章 线性判别函数,8,广义线性判别函数,线性判别函数是形式最为简单的判别函数,但是它不能用于复杂情况。 例:设计一个一维分类器,使其功能为:,二次函数的一般形式:,引言,第四章 线性判别函数,9,广义线性判别函数(2),二次函数的一般形式:,g(x)又可表示成:,引言,映射XY,第四章 线性判别函数,10,广义线性判别函数(3),按照上述原理,任何非线性函数g(x)用级数

4、展开成高次多项式后,都可转化成线性判别函数来处理。 一种特殊映射方法:增广样本向量y与增广权向量a,引言,第四章 线性判别函数,11,广义线性判别函数(4),增广样本向量使特征空间增加了一维,但保持了样本间的欧氏距离不变,对于分类效果也与原决策面相同,只是在Y空间中决策面是通过坐标原点的,这在分析某些问题时具有优点,因此经常用到。,引言,线性判别函数的齐次简化:,第四章 线性判别函数,12,线性分类器设计步骤,线性分类器设计任务:给定样本集K,确定线性判别函数g(x)=wTx的各项系数w。步骤: 收集一组样本K=x1,x2,xN 按需要确定一准则函数J(K,w),其值反映分类器的性能,其极值解

5、对应于“最好”决策。 用最优化技术求准则函数J的极值解w*,从而确定判别函数,完成分类器设计。,对于未知样本x,计算g(x),判断其类别。,引言,第四章 线性判别函数,13,4.2 Fisher线性判别,线性判别函数y=g(x)=wTx: 样本向量x各分量的线性加权 样本向量x与权向量w的向量点积 如果| w |=1,则视作向量x在向量w上的投影 Fisher准则的基本原理:找到一个最合适的投影轴,使两类样本在该轴上投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使分类效果为最佳。,第四章 线性判别函数,14,Fisher线性判别图例,Fisher判别,x1,x2,w1,H: g=0

6、,w2,Fisher准则的描述:用投影后数据的统计性质均值和离散度的函数作为判别优劣的标准。,第四章 线性判别函数,15,d维空间样本分布的描述量,Fisher判别,各类样本均值向量mi,样本类内离散度矩阵Si与总类内离散度矩阵Sw,样本类间离散度矩阵Sb:,离散度矩阵在形式上与协方差矩阵很相似,但协方差矩阵是一种期望值,而离散矩阵只是表示有限个样本在空间分布的离散程度,第四章 线性判别函数,16,一维Y空间样本分布的描述量,Fisher判别,各类样本均值,样本类内离散度和总类内离散度,样本类间离散度,以上定义描述d维空间样本点到一向量投影的分散情况,因此也就是对某向量w的投影在w上的分布。样

7、本离散度的定义与随机变量方差相类似,第四章 线性判别函数,17,样本与其投影统计量间的关系,Fisher判别,样本x与其投影y的统计量之间的关系:,第四章 线性判别函数,18,样本与其投影统计量间的关系,Fisher判别,第四章 线性判别函数,19,Fisher准则函数,Fisher判别,评价投影方向w的原则,使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内尽可能密集的要求 Fisher准则函数的定义:,Fisher最佳投影方向的求解,第四章 线性判别函数,20,Fisher最佳投影方向的求解,Fisher判别,采用拉格朗日乘子算法解决,m1-m2是一向量,对与(m1-m2)平行的向

8、量投影可使两均值点的距离最远。但是如从使类间分得较开,同时又使类内密集程度较高这样一个综合指标来看,则需根据两类样本的分布离散程度对投影方向作相应的调整,这就体现在对m1-m2 向量按Sw-1作一线性变换,从而使Fisher准则函数达到极值点,第四章 线性判别函数,21,判别函数的确定,前面讨论了使Fisher准则函数极大的d维向量w*的计算方法,判别函数中的另一项w0(阈值)可采用以下几种方法确定:,分类规则:,Fisher判别,第四章 线性判别函数,22,Fisher公式的推导,Fisher判别,第四章 线性判别函数,23,4.3 感知器准则,感知准则函数是五十年代由Rosenblatt提

9、出的一种自学习判别函数生成方法,由于Rosenblatt企图将其用于脑模型感知器(Perceptron),因此被称为感知准则函数。其特点是随意确定的判别函数初始值,在对样本分类训练过程中逐步修正直至最终确定。,第四章 线性判别函数,24,基本概念,感知器:Perceptron,Rosenblatt,50d/20thc 线性可分性:训练样本集中的两类样本在特征空间可以用一个线性分界面正确无误地分开。在线性可分条件下,对合适的(广义)权向量a应有:,规范化样本向量 :将第二类样本取其反向向量,感知器准则,第四章 线性判别函数,25,解向量与解区,感知器准则,第四章 线性判别函数,26,感知器准则函

10、数,对于任何一个增广权向量a , 对样本y正确分类,则有:aTy0 对样本y错误分类,则有:aTy0 定义一准则函数JP(a) (感知准则函数):,感知器准则,被错分类的规范化增广样本集,恒有JP(a)0,且仅当a为解向量,Yk为空集(不存在错分样本)时, JP(a)=0,即达到极小值。确定向量a的问题变为对JP(a)求极小值的问题。,第四章 线性判别函数,27,梯度下降算法,梯度下降算法:对(迭代)向量沿某函数的负梯度方向修正,可较快到达该函数极小值。,感知器准则,第四章 线性判别函数,28,算法(step by step),感知器准则,1. 初值: 任意给定一向量初始值a(1) 2. 迭代

11、: 第k+1次迭代时的权向量a(k+1)等于第k次的权向量a(k)加上被错分类的所有样本之和与rk的乘积 3. 终止: 对所有样本正确分类,第四章 线性判别函数,29,感知器方法例解,固定增量法与可变增量法 批量样本修正法与单样本修正法 单样本修正法:样本集视为不断重复出现的序列,逐个样本检查,修正权向量 批量样本修正法:样本成批或全部检查后,修正权向量,感知器准则,y3,y1,第四章 线性判别函数,30,感知器方法小结,感知准则函数方法的思路是:先随意找一个初始向量a(1),然后用训练样本集中的每个样本来计算。若发现一个y出现aTy0。当然,修改后的a(k+1)还可以使某些y出现a(k+1)

12、Ty 0的情况,理论证明,只要训练样本集线性可分,无论a(1)的初值是什么,经过有限次叠代,都可收敛。,感知器准则,第四章 线性判别函数,31,4.4 最小平方误差准则,规范化增广样本向量yi,增广权向量a,正确分类要求: aTyi0, i=1,N 线性分类器设计求一组N个线性不等式的解 样本集增广矩阵Y及一组N个线性不等式的的矩阵表示:,引入余量(目标向量) b=b1, b2, , bNT, bi任意给定正常数, aTyi = bi 0 N个线性方程的的矩阵表示:,第四章 线性判别函数,32,平方误差准则函数,定义误差向量 e=Ya-b: 定义平方误差准则函数Js(a):,MSE准则,最小二

13、乘近似解(MSE解):,MSE方法的思想:对每个样本,设定一个“理想”的判别函数输出值,以最小平方误差为准则求最优权向量,第四章 线性判别函数,33,MSE准则函数的伪逆解,MSE准则,Y的伪逆矩阵,第四章 线性判别函数,34,MSE方法与Fisher方法的关系,与Fisher方法的关系:当,MSE准则,N1个,N2个,MSE解等价于Fisher解,第四章 线性判别函数,35,MSE方法与Bayes方法的关系,MSE准则,当N,b=uN= 1,1, , 1T 时,则它以最小均方误差逼近Bayes判别函数:,第四章 线性判别函数,36,MSE方法的迭代解,a*=Y+b, Y+=(YTY)-1YT

14、,计算量大 实际中常用梯度下降法:,MSE准则,批量样本修正法,单样本修正法,第四章 线性判别函数,37,4.5 多类问题,两类别问题可以推广到多类别问题 i/i 法:将C类别问题化为(C-1)个两类(第i类与所有非i类)问题,按两类问题确定其判别函数与决策面方程 i/j 法:将C类中的每两类别单独设计其线性判别函数,因此总共有C(C-1)/2个线性判别函数,第四章 线性判别函数,38,多类线性判别函数,将特征空间确实划分为c个决策域,共有c个判别函数,多类问题,决策规则:,决策域的边界由相邻决策域的判别函数共同决定,此时应有gi(x)=gj(x) 线性分类器的决策面是凸的,决策区域是单连通的

15、 多类分类器的分界面是分段线性的,第四章 线性判别函数,39,多类线性决策面图例,多类问题,第四章 线性判别函数,40,决策树简介,决策树:一种多极分类器,它采用分级的形式,综合用多个决策规则,逐步把复杂的多类别分类问题转化为若干个简单的分类问题来解决,多类问题,第四章 线性判别函数,41,二叉决策树,二叉决策树:除叶节点外,决策树的每个节点ni都有且只有两个子节点nil和nir。二叉决策树把复杂的多类别分类问题转化为多极两类分类问题来解决。在每个节点ni ,都把样本集分成两个子集。每个子集可能仍包含多类别的样本,继续分直至仅包含单类别样本的叶节点,多类问题,第四章 线性判别函数,42,4.6

16、 分段线性判别函数,有些复杂模式识别问题不是线性可分的,需使用非线性的分类方法 分段线性判别函数:一种特殊的非线性判别函数,它的决策面是若干超平面 树分类器的各节点上采用线性判别规则,即构成分段线性分类器,第四章 线性判别函数,43,基于距离的分段线性判别函数,最小距离分类器:把各类别样本特征的均值向量作为各类的代表点(prototype) ,根据待识样本到各类别代表点的最小距离判别其类别。决策面是两类别均值连线的垂直平分面 分段线性距离分类器:将各类别划分成相对密集的子类,每个子类以它们的均值作为代表点,然后按最小距离分类 判别函数定义:i有li个子类,即属于i 的决策域Ri分成li个子域R

17、i1, Ri2, Rili),每个子区域用均值mik代表点,分段线性判别,判别规则:,or,第四章 线性判别函数,44,分段线性距离分类器图例,分段线性判别,m1,m2,x,g(x)=0,m1,m2,x,第四章 线性判别函数,45,分段线性判别函数,分段线性判别函数的一般形式: gik(x)表示第i类第k段线性判别函数,li为i类所具有的判别函数个数,wik与wi0k分别是第k段的权向量与阈值权,分段线性判别,第i类的判别函数:,判别规则:,决策面取决于相邻的决策域,如第i类的第n个子类与第j类的第m个子类相邻,则由它们共同决定的决策面方程为,第四章 线性判别函数,46,4.7 讨论,基于样本

18、的直接确定判别函数方法主要包含两个步骤: 确定使用的判别函数类型或决策面方程类型,如线性分类器,分段线性分类器等 在选定函数类型的条件下,确定相应的参数,从而完成整个分类器设计 线性判别函数计算简单,在一定条件下能实现最优分类,经常是一种“有限合理”的选择 分段线性分类器可以实现更复杂的分类面,第四章 线性判别函数,47,习题,有一个三次判别函数:z=g(x)=x3+2x2+3x+4。试建立一映射xy,使得z转化为y的线性判别函数。 证明决策面H:wTx+w0=0的系数向量w是决策面H的法向量 Ex-4.15 设五维空间的线性方程为55x1+68x2+32x3+16x4+26x5+10 =0,试求出其权向量与样本向量点积的表达式wTx+w0=0中的w,x以及增广权向量与增广样本向量形式aTy中的a与y,第四章 线性判别函数,48,习题(续),设在三维空间中一个类别分类问题拟采用二次曲面。如欲采用广义线性方程求解,试问其广义样本向量与广义权向量的表达式,其维数是多少?,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!