系统聚类分析课程设计

上传人:jin****ng 文档编号:177265928 上传时间:2022-12-25 格式:DOCX 页数:19 大小:98.49KB
收藏 版权申诉 举报 下载
系统聚类分析课程设计_第1页
第1页 / 共19页
系统聚类分析课程设计_第2页
第2页 / 共19页
系统聚类分析课程设计_第3页
第3页 / 共19页
资源描述:

《系统聚类分析课程设计》由会员分享,可在线阅读,更多相关《系统聚类分析课程设计(19页珍藏版)》请在装配图网上搜索。

1、系统聚类分析课程设计空间分析学院:地质工程与测绘学院专业:遥感科学与技术班级:2011260601学号:学生姓名:指导老师:3335557目录第 1章 前言第 2章 算法设计背景2.1 聚类要素的数据处 理2.2 距离的计算 第 3章 算法思想与编程实现3.1 算法思 想3.2 用 Matlab 编程实现3.2.1 程序代码73.2.2 编程操作结果第4章K-均值算法应用与优缺点1341 K-均值聚类法的应用134.2 K-均值聚类法的优缺点14第 5 章 课程设计总结 1 4主要参考文献 15第一章 前言本课题是根据李斌老师所教授的空间分析课程内容及要求而选定 的,是对于系统聚类算法的分析研

2、究及利用相关软件的编程而实现系统聚 类。研究的是系统聚类算法的分析及编程实现,空间聚类的目的是对空间 物体的集群性进行分析,将其分为几个不同的子群(类)。子群的形成的 是地理系统运作的结果,根据此可以揭示某种地理机制。此外,子群可以 作为其它分析的基础,例如,公共设施的建立一般地说是根据居民点群的 分布,而不是具体的居民住宅的分布来布置的,因此需要对居民点群进行 聚类分析以形成若干居民点子群,这样便于简化问题,突出重点。空间聚类可以采用不同的算法过程。在分析之初假定n个点自成一类,然 后逐步合并,这样在聚类的过程中,分类将越来越少,直至聚至一个适当的 分类数目,这一聚类过程称之为系统聚类。 常

3、见的聚类分析方法有系统聚类 法、动态聚类法和模糊聚类法等。下面主要介绍系统聚类算法,并基于 Matlab 软件用K-means算法(即k-均值算法)来实现系统聚类的算法编程。第二章 算法设计背景2.1聚类要素的数据处理假设有 m 个聚类的对象,每一个聚类对象都有 个要素构成。它们所对应 的要素数据可用 表3.4.1 给出。 在聚类分析中,常用的聚类要素的数据处 理方法有如下几种。总和标准化 标准差标准化 极大值标准化经过这种标准化所得的新数据,各要素的极大值为 1,其余各数值小于1。 极差的标准化经过这种标准化所得的新数据,各要素的极大值为 1,极小值为0,其余的数值 均在0 与 1 之间。2

4、.2 距离的计算距离是事物之间差异性的测度,差异性越大,则相似性越小,所以距离是系 统聚类分析的依据和基础。选择不同的距离,聚类结果会有所差异。在地理分区和分类研究中,往往采 用几种距离进行计算、对比,选择一种较为合适的距离进行聚类。第三章 算法思想与编程实现3.1 算法思想我们已经指出系统聚类方法首先将n个空间点看做是n个子群,然后根据所 选用的聚类统计量来计算n个子群之间的关系。对于距离,计算n个子群两两 之间的距离,首先选择距离最近的两个子群(点)归为一个新的子群,这样就 得到n-1个子群两两之间的聚类统计量,继续选择距离最近的子群合并,再得 到n-2个子群,依此类推,直到所有的子群全部

5、合并。K-means算法是硬聚类算法,是典型的局域原型的目标函数聚类方法的代表, 它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得 到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应 某一初始聚类中心向量V最有分类,使得评价指标J最小。算法采用误差平方 和准则函数作为聚类准则函数。K-均值算法的聚类准则是使每一聚类中,多模式点到该类别的中心的距离的 平方和最小。其基本思想是:通过迭代,主次移动各类的中心,直到得到最好 的 聚类为止。其算法框图如图所示。具体的计算步骤如下:假设图像上的目标要分为m类,m为已知数。第一步:适当地选取m个类的初始中心Z(

6、i),Z(i), ,Z,初始中心的选1 2 M 择对聚类结果有一定的影响,初始中心的选择一般有如下几种方法:1)根据问题的性质和经验确定类别数m,从数据中找出直观上看来比 较适合的m个类的初始中心。2)将全部数据随即地分为m个类型,计算每类的重心,将这些重心 作为m个类的初始中心。第二步:在第k次迭代中,对任一样本X按如下的方法把它调整到m个类 别中的某一类别中去。对于所有的i H j, i = 1,2, ,m,如果X-Z(k) jX-Z(k),则XGS仗)其中S )是以Z仗)为中心的类。ijji第三步:由第二步得到S(k)类新的中心jZ (k),Z (k)=工 Xjj Nj X gS(K)j

7、式中,N为S(k)类中的样本数。Zz)是按照使J最小的原则确定的,J的表达式j为:jjJ=区工 |x - Z(k+1) j=1 X gS(k)Jj第四步:对于所有的i=1,2,m,如果Z(k+1)=Z(k),则迭代结束,否则转到ii第二步继续迭代。这种算法的结果受到所选聚类中心的数目和其初始位置以及模式分布的几 何性质和读入次序等因素的影响,并且在迭代过程中又没有调整类数的措施, 因此可能产生不同的初始分类得到不同的结果,这是这种方法的缺点。可以通 过其他的简单的聚类中心试探方法,如最大距离法,找出初始中心,提高分类 效果。3.2用Matlab编程实现3. 2. 1程序代码对于上述的K-mea

8、n算法用Matlab软件实现编程并调用数据小的图片进行聚类分析及编程是否正确性的检测。具体程序代码如下:%读取图片Imag =imread(hand.jpg);%只能读取三个波段sample= rgb2gray(Imag);%将彩色图片转换为灰度图片m n =size(sample);%读取图片的维数sample= reshape(sample,m*n,1);%将矩阵变换为m*n行1列的向量k = 4;%分成4类t = 0;%控制循环次数flag = 0;%一个和sample等维数的标记向量ocentre1 = 80;%选取第1类聚类中心ocentre2 = 160;%选取第2类聚类中心oce

9、ntre3 = 220;%选取第3类聚类中心ocentre4 = 255;%选取第4类聚类中心sample = double(sample);%将 uint8 类型转换为 double 型while t = 0%fsample1 = 0;%fsample2 = 0;%fsample3 = 0;%fsample4 = 0; fsample = zeros(4,1);num = zeros(4,1);dis = zeros(1,4);for i = 1:m*n%a = 5 - 2;%b = 2 - 5;dis(1) = abs(sample(i) - ocentre1); %求到第1个聚类中心距离

10、dis(2)= abs(sample(i)- ocentre2);%求到第2个聚类中心距离dis(3)= abs(sample(i)- ocentre3);%求到第3个聚类中心距离dis(4)= abs(sample(i)- ocentre4);%求到第4个聚类中心距离mindis = min(dis(1) dis(2) dis(3) dis(4); %求最小的距离%选取最小值,第一个值给disl,第二个值给dis2,判断dis2dis1, 则给dis2值于disl,计算第三个距离给dis2,返回第三步,循环switch mindiscase dis(1)%flag = cat(1,flag,

11、1); %将标记数组赋值1,该点属于第1类%fsample1 = cat(1,fsample1,sample(i);flag(i) = 1;fsample(1) = fsample(1) + sample(i);num(1) = num(1) + 1;case dis(2)%flag = cat(1,flag,2); %将标记数组赋值2,该点属于第2类%fsample2 = cat(1,fsample2,sample(i);flag(i) = 2;fsample(2) = fsample(2) + sample(i);num(2) = num(2) + 1;case dis(3)%flag =

12、 cat(1,flag,3); %将标记数组赋值3,该点属于第3类%fsample3 = cat(1,fsample3,sample(i);flag(i) = 3;fsample(3) = fsample(3) + sample(i);num(3) = num(3) + 1;case dis(4)%flag = cat(1,flag,4); %将标记数组赋值4,该点属于第4类%fsample4 = cat(1,fsample4,sample(i);flag(i) = 4;fsample(4) = fsample(4) + sample(i);num(4) = num(4) + 1;endend

13、%重新计算聚类中心%m1 n1 = size(fsample1);%m2 n2 = size(fsample2);%m3 n3 = size(fsample3);%m4 n4 = size(fsample4);%ncentre1 = sum(fsample1)/(m1 - 1);%ncentre2 = sum(fsample2)/(m2 - 1);%ncentre3 = sum(fsample3)/(m3 - 1);%ncentre4 = sum(fsample4)/(m4 - 1);%flag%fsamplencentre1 = fsample(1)/num(1);ncentre2 = fs

14、ample(2)/num(2);ncentre3 = fsample(3)/num(3);ncentre4 = fsample(4)/num(4);%flag(1) = ;if ncentre1 = ocentre1 & ncentre2 = ocentre2.& ncentre3 = ocentre3 & ncentre4 = ocentre4 for i = 1:m*nswitch flag(i)case 1sample(i) = 60;case 2sample(i) = 120;case 3sample(i) = 180;case 4sample(i) = 240;endendt = 1

15、;elseocentre1 = ncentre1;ocentre2 = ncentre2;ocentre3 = ncentre3;ocentre4 = ncentre4;endendsample = uint8(sample);sample = reshape(sample,m,n);imshow(sample);3.2.2编程操作结果实验调用前图片:实验调用后结果截图图片:回File Edit WevToo-l: Deskto Windo He-lf 常色Rd B坠纵巴型銘第四章K-均值算法应用与优缺点4.1K-均值聚类法的应用 在机械设备铁路监测技术中的应用 在人力资源管理中的应用。 在商

16、业银行客户分类中的应用。4.2K-均值聚类法的优缺点缺点 在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以 估计的。 在 K-means 算法中,首先需要根据初始聚类中心来确定一个初始划 分,然后对初始划分进行优化。 从 K-means 算法框架可以看出,该算法需要不断地进行样本分类调 整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的 时间开销是非常大的。优点:本算法确定的K个划分到达平方误差最小。当聚类是密集的,且类与 类之间区别明显时,效果较好。对于处理大数据集,这个算法是相对可伸 缩和高效的,计算的复杂度为O(NKt),其中N是数据对象的数目,t

17、是迭 代的次数。一般来说, KN, tN 。第五章 课程设计总结通过此次课程设计,对空间分析中的聚类分析有了更一步的了解和体会,尤 其是对系统聚类分析有了深刻的掌握,基于Mat lab软件的方便性和语言的简洁 易懂性,基本完成了该次课程设计的程序编写。当然,在课程设计主要是依据空间分析及模式识别导论两本所学课 程教材中的聚类分析章节来参考编写的,空间聚类可以采用不同的算法过程。 在分析之初假定n个点自成一类,然后逐步合并,这样在聚类的过程中,分类 将越来越少,直至聚至一个适当的分类数目,这一聚类过程称之为系统聚类。 显然,距离是事物之间差异性的测度,差异性越大,则相似性越小,所以距离 是系统聚

18、类分析的依据和基础。设计算法思想和选用其中的最短距离的原则来 进行系统聚类,我们已经指出系统聚类方法首先将n个空间点看做是n个子群, 然后根据所选用的聚类统计量来计算n个子群之间的关系。对于距离,计算n 个子群两两之间的距离,首先选择距离最近的两个子群(点)归为一个新的子 群,这样就得到n-1个子群两两之间的聚类统计量,继续选择距离最近的子群 合并,再得到n-2个子群,依此类推,直到所有的子群全部合并。设计的程序也有不足之处,对于数据量大的空间聚类显得不实用,仅仅较 适合数据小的系统聚类,如上述小数据量的图片的聚类分析,对于提高程序空 间聚类分析能力,还待进一步的研究。主要参考文献1郭仁忠,空间分析,北京:高等教育出版社,20012范久伦,赵凤,等.模式识别导论,西安:西安电子科技大学出版社,2012.53张强,王正林,精通MATLAB图像处理,电子工业出版社,20094张克权,组合指标分类方法简介与分析,北京:测绘出版社, 19805郭仁忠,张克权q型聚类分析中变量相关性的处理方法分析,武汉测绘科技大学报,1987,12(3)6薛山,MATLAB基础教程,北京:清华大学出版社,2011

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!