模式识别期末考试复习资料

上传人:痛*** 文档编号:89421109 上传时间:2022-05-13 格式:DOC 页数:7 大小:93.50KB
收藏 版权申诉 举报 下载
模式识别期末考试复习资料_第1页
第1页 / 共7页
模式识别期末考试复习资料_第2页
第2页 / 共7页
模式识别期末考试复习资料_第3页
第3页 / 共7页
资源描述:

《模式识别期末考试复习资料》由会员分享,可在线阅读,更多相关《模式识别期末考试复习资料(7页珍藏版)》请在装配图网上搜索。

1、-题型:填空题1. 填空题5题2. 名词解释4题3. 问答题4题4. 计算作图题3题5. 综合计算题1题备注1:没有整理第一章和第六章,教师说不考的备注2:非线性判别函数相关概念P69 概率相关定义、性质、公式P83以后 最小错误率贝叶斯决策公式P85 最小风险贝叶斯P86 正态贝叶斯P90 综合计算有可能是第六次作业一、填空题物以类聚人以群分表达的是聚类分析的根本思想。模式识别分类:1.从实现方法来分模式识别分为监视分类和非监视分类;2.从理论上来分,有统计模式识别,统计模式识别,模糊模式识别,神经网络模式识别法 聚类分析是按照不同对象之间的差异,根据距离函数的规律做模式分类的。模式的特性:

2、可观察性、可区分性、相似性模式识别的任务:一是研究生物体包括人是如何感知对象的,二是如何用计算机实现模式识别的理论和方法。计算机的开展方向:1.神经网络计算机模拟人的大脑思维;2.生物计算机运用生物工程技术、蛋白分子作芯片;3.光计算机用光作为信息载体,通过对光的处理来完成对信息的处理。训练学习方法:监视学习、无监视学习无先验知识,甚至类别数也未知。统计模式识别有:1.聚类分析法 非监视;2.判决函数法/几何分类法(监视);3.基于统计决策的概率分类法- 以模式集在特征空间中分布的类概率密度函数为根底,对总体特征进展研究,以取得分类的方法数据的标准化目的:消除各个分量之间数值围大小对算法的影响

3、模式识别系统的根本构成:书P7聚类过程遵循的根本步骤:特征选择;近邻测度;聚类准则;聚类算法;结果验证;结果判定。相似测度根底:以两矢量的方向是否相近作为考虑的根底,矢量长度并不重要。确定聚类准则的两种方式: 阈值准则,函数准则基于距离阈值的聚类算法分解聚类:近邻聚类法;最大最小距离聚类法类间距离计算准则:1最短距离法2最长距离法 3中间距离法4重心法5类平均距离法6离差平方和法P24系统聚类法合并的思想用于随机模式分类识别的方法,通常称为贝叶斯判决。BAYES 决策常用的准则:最小错误率;最小风险错误率的计算或估计方法:按理论公式计算;计算错误率上界;实验估计。. z-名词解释1. 名词解释

4、相似性测度:衡量模式之间相似性的一种尺度明氏距离:P17当m=2时,明氏距离为欧氏距离。当m=1时:绝对距离 曼哈顿距离 称为街坊距离 感知器算法:就是通过训练样本模式的迭代和学习,产生线性或广义线性可分的模式判别函数。梯度:P59感知器P227模糊度P182清晰性P182含混性近似性随机性模式:对客体研究对象特征的描述定量的或构造的,是取自客观世界的*一样本的测量值的集合或综合。模式所指的不是事物本身,而是从事物获得的信息。模式识别:确定一个样本的类别属性模式类的过程,即把*一样本归属于多个类型中的*个类型。模式类:具有*些共同特性的模式的集合。特征选择:在原始特征根底上选择一些主要特征作为

5、判别用的特征。特征提取:采用*种变换技术,得出数目上比原来少的综合特征作为分类用。特征抽取:通过各种手段从原始数据中得出反映分类问题的假设干特征有时需进展数据标准化特征空间:进展模式分类的空间。特征向量:用 n 维列向量来表示 一个模式样本,说明该样本具有 n 个数字特征 *= (*1 , *2 , , *n)T常称之为特征向量。人工智能:是研究如何将人的智能转化为机器智能,或者是用机器来模拟或实现人的智能。 聚类分析:根据模式之间的相似性相邻性对模式进展分类,是一种非监视分类方法。聚类准则:根据相似性测度确定的,衡量模式之间是否相似的标准。即把不同模式聚为一类还是归为不同类的准则同一类模式相

6、似程度的标准或不同类模式差异程度的标准。聚类准则函数:在聚类分析中,表示模式类相似或类间差异性的函数。相似度:衡量模式之间相似程度的尺度。相似性测度:衡量模式之间相似性的一种尺度。欧氏距离简称距离:P15马氏距离:P15明氏距离:P17当m=2时,明氏距离为欧氏距离。当m=1时:绝对距离 曼哈顿距离 称为街坊距离 汉明(Hamming)距离:P17判别函数:直接用来对模式进展分类的准则函数。感知器算法:就是通过训练样本模式的迭代和学习,产生线性或广义线性可分的模式判别函数。梯度:P59分类器的正确率:指分类器正确分类的工程占所有被分类工程的比率。过拟合:高维空间训练形成的分类器,相当于在低维空

7、间的一个复杂的非线性分类器,这种分类器过多的强调了训练集的准确率甚至于对一些错误/异常的数据也进展了学习,而正确的数据却无法覆盖整个特征空间。为此,这样得到的分类器在对新数据进展预测时将会出现错误。这种现象称之为过拟合,同时也是维数灾难的直接表达。. z-问答题2. 问答题统计模式识别的优缺点:主要优点: 1比拟成熟 2能考虑干扰噪声等影响 3识别模式基元能力强主要缺点: 1对构造复杂的模式抽取特征困难2不能反映模式的构造特征,难以描述模式的性质3难以从整体角度考虑识别问题句法模式识别优缺点:主要优点:1识别方便,可以从简单的基元开场,由简至繁。2能反映模式的构造特征,能描述模式的性质。3对图

8、象畸变的抗干扰能力较强。主要缺点:当存在干扰及噪声时,抽取特征基元困难,且易失误。模糊模式识别优缺点:主要优点:由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。主要缺点:准确合理的隶属度函数往往难以建立,故限制了它的应用。神经网络模式识别法优缺点:主要优点:可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。主要缺点:模型在不断丰富与完善中,目前能识别的模式类还不够多。分类与聚类的区别:分类:用类别的样本训练集来设计分类器监视学习, 由学习过程和识别过程两局部组成,且用于学习的样本类别是

9、的。聚类集群:事先不知样本的类别,而利用样本的先验知识来构造分类器无监视学习。马氏距离的优缺点:优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;由标准化数据和中心化数据即原始数据与均值之差计算出的二点之间的马氏距离一样;马氏距离还可以排除变量之间的相关性的干扰;满足距离的四个根本公理:非负性、自反性、对称性和三角不等式。缺点:有可能夸张变化微小的变量的作用;协方差不易计算近邻聚类法优缺点:优点:计算简单一种虽粗糙但快速的方法。局限性:聚类过程中,类的中心一旦确定将不会改变,模式一旦指定类后也不再改变。聚类结果很大程度上依赖于第一个聚类中心的位置选择、待分类模式样本的排列次序

10、、距离阈值T的大小以及样本分布的几何性质等。最大最小距离算法小中取大距离算法 :算法思想:在模式特征矢量集中以最大距离原则选取新的聚类中心。以最小距离原则进展模式归类,通常使用欧式距离。层次聚类法系统聚类法、分级聚类法:思路:每个样本先自成一类,然后按距离准则逐步合并,减少类数。动态聚类的根本步骤:建立初始聚类中心,进展初始聚类;计算模式和类的距离,调整模式的类别;计算各聚类的参数,删除、合并或分裂一些聚类;从初始聚类开场,运用迭代算法动态地改变模式的类别和聚类的中心使准则函数取得极值或设定的参数到达设计要求时停顿。ISODATA与K-均值算法比拟:相似:聚类中心的位置均通过样本均值的迭代运算

11、决定。相异: K-均值算法的聚类中心个数不变; ISODATA的聚类中心个数变化。 ISODATA根本思路:1选择初始值包括假设干聚类中心及一些指标。可在迭代运算过程中人为修改,据此将N个模式样本分配到各个聚类中心去。2按最近邻规则进展分类。3聚类后的处理:计算各类中的距离函数等指标,按照给定的要求,将前次获得的聚类集进展分裂或合并处理,以获得新的聚类中心,即调整聚类中心的个数。4判断结果是否符合要求: 符合,完毕; 否则,回到2。不同聚类算法比拟:算法根本思想聚类中心个数样本归类聚类结果对初始中心选择类中心类间距离其他特点分解聚类近邻分裂单调变化,阈值确定不变敏感不变否模式样本的几何分布性质

12、影响均存在!排列次序或读入次序的影响不可无视。最大最小距离不变不敏感不变否系统聚类层级聚类合并同上变化不敏感变化需要动态聚类K-均值兼顾指定,不变变化敏感变化否ISODATA变化变化不敏感变化需要线性判别函数的特点:形式简单,容易学习;用于线性可分的模式类。分段线性判别函数特点:相对简单;能逼近各种形状的超曲面。一维正态曲线的性质:(1) 曲线在 * 轴的上方,与*轴不相交。(2) 曲线关于直线 * =对称。(3) 当 * =时,曲线位于最高点。(4) 当*时,曲线上升;当*时,曲线下降.并且当曲线向左、右两边无限延伸时,以*轴为渐近线,向它无限靠近。(5) 一定时,曲线的形状由确定。越大,曲

13、线越矮胖,表示总体的分布越分散;越小。曲线越瘦高。表示总体的分布越集中。特征选择和提取的目的:经过选择或变换,组成识别特征,尽可能保存分类信息,在保证一定分类精度的前提下,减少特征维数,使分类器的工作既快又准确。K-L变换进展特征提取的优缺点:优点:变换在均方误差最小的意义下使新样本集* *逼近原样本集*的分布,既压缩了维数又保存了类别鉴别信息。变换后的新模式向量各分量相对总体均值的方差等于原样本集总体自相关矩阵的大特征值,说明变换突出了模式类之间 的差异性。C*为对角矩阵说明了变换后样本各分量互不相关,亦即消除了原来特征之间的相关性,便于进一步进展特征的选择。缺点:对两类问题容易得到较满意的

14、结果。类别愈多,效果愈差。需要通过足够多的样本估计样本集的协方差矩阵或其它类型的散布矩阵。当样本数缺乏时,矩阵的估计会变得十分粗略,变换的优越性也就不能充分的地显示出来。计算矩阵的本征值和本征向量缺乏统一的快速算法,给计算带来困难。 . z-计算作图题3. 计算作图题最大最小距离算法小中取大距离算法 :计算按照P22的例2.1来最短距离准则进展系统聚类分类:P25例2.21234523314474855262685913层次聚类分析:此处为例题(1) 设全部样本分为6类(2) 作距离矩阵D(0)(3) 求最小元素728238745522(4) 把1, 3合并7=(1,3); 4, 6合并8=(

15、4,6)(5) 作距离矩阵D(1)(6) 假设合并的类数没有到达要求,转(3), 否则停顿(7) 求最小元素(8) 8, 5, 2合并, 9=2,5,4,6(9) 如无阈值要求,直至最后归为一类10K均值算法P28例2.3判别函数:P40第一种:例3.1&3.2P42此法将 M 个多类问题分成M个两类问题,识别每一类均需M个判别函数。识别出所有的M类仍是这M个函数。 第二种:P44例3.3&3.4每别离出一类,需要与I 有关的M-1个判决函数;要分开M类模式,共需M(M-1)/2个判决函数。对三类问题需要3(3-1)/2=3个判决函数。即:每次从M类中取出两类的组合:第三种:P45例3.5&3.6把 M 类情况分成了(M -1)个两类问题。感知器算法:P54例3.8;P57例3.9最小风险贝叶斯决策分类:P88例4.2二维样本变换成一维样本:P138例5.2样本压缩:P143例5.3. z

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!