模式识别实验指导书

上传人:xu****iu 文档编号:163412017 上传时间:2022-10-21 格式:DOC 页数:12 大小:175.02KB
收藏 版权申诉 举报 下载
模式识别实验指导书_第1页
第1页 / 共12页
模式识别实验指导书_第2页
第2页 / 共12页
模式识别实验指导书_第3页
第3页 / 共12页
资源描述:

《模式识别实验指导书》由会员分享,可在线阅读,更多相关《模式识别实验指导书(12页珍藏版)》请在装配图网上搜索。

1、实验一、基于感知函数准则线性分类器设计1.1 实验类型:设计型:线性分类器设计(感知函数准则)1.2 实验目的:本实验旨在让同学理解感知准则函数的原理,通过软件编程模拟线性分类器,理解感知函数准则的确定过程,掌握梯度下降算法求增广权向量,进一步深刻认识线性分类器。1.3 实验条件:matlab软件1.4 实验原理:感知准则函数是五十年代由Rosenblatt提出的一种自学习判别函数生成方法,由于Rosenblatt企图将其用于脑模型感知器,因此被称为感知准则函数。其特点是随意确定的判别函数初始值,在对样本分类训练过程中逐步修正直至最终确定。感知准则函数利用梯度下降算法求增广权向量的做法,可简单

2、叙述为: 任意给定一向量初始值,第k+1次迭代时的权向量等于第k次的权向量加上被错分类的所有样本之和与的乘积。可以证明,对于线性可分的样本集,经过有限次修正,一定可以找到一个解向量,即算法能在有限步内收敛。其收敛速度的快慢取决于初始权向量和系数。1.5 实验内容已知有两个样本空间w1和w2,这些点对应的横纵坐标的分布情况是:x1=1,2,4,1,5;y1=2,1,-1,-3,-3;x2=-2.5,-2.5,-1.5,-4,-5,-3;y2=1,-1,5,1,-4,0;在二维空间样本分布图形如下所示:(plot(x1,y1,x2,y2))1.6 实验任务:1、 用matlab完成感知准则函数确定

3、程序的设计。2、 请确定sample=(0,-3),(1,3),(-1,5),(-1,1),(0.5,6),(-3,-1),(2,-1),(0,1),(1,1),(-0.5,-0.5),( 0.5,-0.5);属于哪个样本空间,根据数据画出分类的结果。3、 请分析一下和对于感知函数准则确定的影响,并确定当=1/2/3时,相应的k的值,以及不同时,k值得变化情况。4、 根据实验结果请说明感知准则函数是否是唯一的,为什么?实验二、基于Fisher准则线性分类器设计2.1实验类型:设计型:线性分类器设计(Fisher准则)2.2实验目的:本实验旨在让同学进一步了解分类器的设计概念,能够根据自己的设计

4、对线性分类器有更深刻地认识,理解Fisher准则方法确定最佳线性分界面方法的原理,以及Lagrande乘子求解的原理。2.3实验条件:matlab软件2.4实验原理:线性判别函数的一般形式可表示成 其中 根据Fisher选择投影方向W的原则,即使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,用以评价投影方向W的函数为: 上面的公式是使用Fisher准则求最佳法线向量的解,该式比较重要。另外,该式这种形式的运算,我们称为线性变换,其中式一个向量,是的逆矩阵,如是d维,和都是dd维,得到的也是一个d维的向量。向量就是使Fisher准则函数达极大值的解,也就是按F

5、isher准则将d维X空间投影到一维Y空间的最佳投影方向,该向量的各分量值是对原d维特征向量求加权和的权值。以上讨论了线性判别函数加权向量W的确定方法,并讨论了使Fisher准则函数极大的d维向量 的计算方法,但是判别函数中的另一项尚未确定,一般可采用以下几种方法确定如或者 或当与已知时可用当W0确定之后,则可按以下规则分类,使用Fisher准则方法确定最佳线性分界面的方法是一个著名的方法,尽管提出该方法的时间比较早,仍见有人使用。2.5实验内容:已知有两类数据和二者的概率已知=0.6, =0.4。中数据点的坐标对应一一如下: 数据:x = 0.2331 1.5207 0.6499 0.775

6、7 1.0524 1.1974 0.2908 0.2518 0.6682 0.5622 0.9023 0.1333 -0.5431 0.9407 -0.2126 0.0507 -0.0810 0.7315 0.3345 1.0650 -0.0247 0.1043 0.3122 0.6655 0.5838 1.1653 1.2653 0.8137 -0.3399 0.5152 0.7226 -0.2015 0.4070 -0.1717 -1.0573 -0.2099y = 2.3385 2.1946 1.6730 1.6365 1.7844 2.0155 2.0681 2.1213 2.4797

7、 1.5118 1.9692 1.8340 1.8704 2.2948 1.7714 2.3939 1.5648 1.9329 2.2027 2.4568 1.7523 1.6991 2.4883 1.7259 2.0466 2.0226 2.3757 1.7987 2.0828 2.0798 1.9449 2.3801 2.2373 2.1614 1.9235 2.2604z = 0.5338 0.8514 1.0831 0.4164 1.1176 0.5536 0.6071 0.4439 0.4928 0.5901 1.0927 1.0756 1.0072 0.4272 0.4353 0.

8、9869 0.4841 1.0992 1.0299 0.7127 1.0124 0.4576 0.8544 1.1275 0.7705 0.4129 1.0085 0.7676 0.8418 0.8784 0.9751 0.7840 0.4158 1.0315 0.7533 0.9548数据点的对应的三维坐标为x2 = 1.4010 1.2301 2.0814 1.1655 1.3740 1.1829 1.7632 1.9739 2.4152 2.5890 2.8472 1.9539 1.2500 1.2864 1.2614 2.0071 2.1831 1.7909 1.3322 1.1466

9、 1.7087 1.5920 2.9353 1.4664 2.9313 1.8349 1.8340 2.5096 2.7198 2.3148 2.0353 2.6030 1.2327 2.1465 1.5673 2.9414y2 = 1.0298 0.9611 0.9154 1.4901 0.8200 0.9399 1.1405 1.0678 0.8050 1.2889 1.4601 1.4334 0.7091 1.2942 1.3744 0.9387 1.2266 1.1833 0.8798 0.5592 0.5150 0.9983 0.9120 0.7126 1.2833 1.1029 1

10、.2680 0.7140 1.2446 1.3392 1.1808 0.5503 1.4708 1.1435 0.7679 1.1288z2 = 0.6210 1.3656 0.5498 0.6708 0.8932 1.4342 0.9508 0.7324 0.5784 1.4943 1.0915 0.7644 1.2159 1.3049 1.1408 0.9398 0.6197 0.6603 1.3928 1.4084 0.6909 0.8400 0.5381 1.3729 0.7731 0.7319 1.3439 0.8142 0.9586 0.7379 0.7548 0.7393 0.6

11、739 0.8651 1.3699 1.1458数据的样本点分布如下图:2.6实验要求:1) 请把数据作为样本,根据Fisher选择投影方向的原则,使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,求出评价投影方向的函数,并在图形表示出来。并在实验报告中表示出来,并求使取极大值的。用matlab完成Fisher线性分类器的设计,程序的语句要求有注释。2) 根据上述的结果并判断(1,1.5,0.6)(1.2,1.0,0.55),(2.0,0.9,0.68),(1.2,1.5,0.89),(0.23,2.33,1.43),属于哪个类别,并画出数据分类相应的结果图,

12、要求画出其在上的投影。3) 回答如下问题,分析一下的比例因子对于Fisher判别函数没有影响的原因。实验三、K均值聚类算法动态聚类3.1 实验类型:设计型:K均值/C-均值动态聚类算法3.2 实验目的:本实验旨在让同学理解动态聚类算法的原理,掌握K均值/C-均值算法,并能利用K均值/C-均值算法解决实际的分类问题。3.3 实验条件:matlab软件3.4 实验原理:动态聚类方法的任务是将数据集划分成一定数量的子集,例如将一个数据集划分成三个子集,四个子集等。因此要划分成多少个子集往往要预先确定,或大致确定,当然这个子集数目在理想情况现能体现数据集比较合理的划分。这里要解决的问题是:1 怎样才能

13、知道该数据集应该划分的子集数目2 如果划分数目已定,则又如何找到最佳划分。因为数据集可以有许多种不同的划分方法,需要对不同的划分作出评价,并找到优化的划分结果。由于优化过程是从不甚合理的划分到“最佳”划分,是一个动态的迭代过程,故这种方法称为动态聚类方法。我们先讨论在子集数目已定条件下的聚类方法,然后在讨论如何确定合理的子集数目。一个动态聚类算法需要有以下几个要点:1.选定某种距离度量作为样本间的相似性度量;2.确定样本合理的初始分类,包括代表点的选择,初始分类的方法选择等。3.确定某种评价聚类结果质量的准则函数,用以调整初始分类直至达到该准则函数的极值。这是一个动态聚类方法的三个要素,其中初

14、始划分只是为了使划分能从某个初始点开始,。而相似度量计算方法对解决实际问题很重要,我们先从最简单的度量数据之间的欧氏距离开始,然后再提到其它相似性度量方法。第三个要素,即使用准则函数作为优化的评价是动态聚类方法的核心。动态聚类算法原理上就是通过迭代求函数极值的方法要解决的问题是数据的聚类,也就是将现有的数据集进行划分。因此要构造一个函数,这个函数的值与数据划分有关,从而调整数据的划分使该函数达到极值。K均值/C-均值算法1.准则函数误差平方和准则K均值/c-均值算法的准则函数表示了相似度量是以数据到数据子集均值的模的平方来度量,这是用欧氏距离的度量方法。这个准则函数是以计算各类均值,与计算各类

15、样本到其所属类均值点误差平方和为准则,若各类均值表示成 其中第i类集合为,其样本数目为是样本特征向量。此时误差平方和准则可表示成其含义是各类样本与其所属样本均值间误差平方之总和。对于样本集的不同分类,导致不同的样本子集及其均值,从而得到不同的值,而最佳的聚类是使为最小的分类。这种类型的聚类通常称为最小方差划分。C均值算法可归纳成:(1) 选择某种方法把N个样本分成C个聚类的初始划分,计算每个聚类的均值和(2) 选择一个备选样本y,设其在中(3) 若,则转(2),否则继续(4) 计算(5) 对于所有的j,若,则将y从移到中。(6) 重新计算和的值,并修改。(7) 若连续迭代N次(即所有样本都运算

16、过) 不变,则停止,否则转到2。上述C均值算法都是在类别c已知条件下进行的,在类别数未知情况下使用C均值算法时,可以假设类别数是逐步增加的,例如对c1,2,3,分别使用该算法。准则函数是随c的增加而单调地减少的。 3.5 实验内容: 已知有样本点的横纵坐标分别如下:x1 = 0.5660 0.6294 0.5315 0.5860 0.5129 0.5017 0.7854 0.6011 0.6505 0.7938 0.9977 0.6802 0.4088 0.0849 0.2912 0.0147 0.0773 0.1329y1 = 0.5769 1.2209 1.2649 1.1579 1.3104 0.8742 0.3062 0.3707 0.7067 0.1684 0.8137 0.4662 0.2223 0.4949 -0.1375 0.2308 0.1497 0.1813样本点的分布情况如下图:3.6 实验要求,1、 请用C均值算法对上述样本分类,类别数为3,并且分析分类结果。2、 回答下列习题设两个集群的数据分别为与试求:1) 两个集群的均值。2) 若将数据从第一个集群转移至第二个时,准则函数值的变化量请修改程序将上述样本点分为4类,并且分析类别数目的多少对的影响(选作)。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!