误差分析课件 聚类分析之谱系聚类法

上传人:t****d 文档编号:206168571 上传时间:2023-05-02 格式:PPT 页数:27 大小:1.10MB
收藏 版权申诉 举报 下载
误差分析课件 聚类分析之谱系聚类法_第1页
第1页 / 共27页
误差分析课件 聚类分析之谱系聚类法_第2页
第2页 / 共27页
误差分析课件 聚类分析之谱系聚类法_第3页
第3页 / 共27页
资源描述:

《误差分析课件 聚类分析之谱系聚类法》由会员分享,可在线阅读,更多相关《误差分析课件 聚类分析之谱系聚类法(27页珍藏版)》请在装配图网上搜索。

1、 聚类分析之 -谱系聚类法谱系聚类法1类间距离及其递推公式谱系聚类法的应用分析谱系聚类法的步骤谱系聚类2引言 谱系聚类法也称为系统聚类法,是目前应用较为广泛的一种聚类方法,它根据植物分类学的思想对研究对象进行分类。在植物分类学中,分类的单位是:门、纲、目、科、属、种,其中种是分类的基本单位。分类单位越小,它所包含的植物就越少,植物间的共同特征就越多。谱系聚类3 利用这种分类思想,谱系聚类法首先视各样品自成一类,然后把最相似的样品聚为小类,再将已聚合的小类按其相似性再聚合,随着相似性的减弱,最后将一切子类都聚合成一个大类,从而得到一个按相近性大小聚结起来的谱系图,再进一步根据实际情况确定合适的分

2、类个数。谱系聚类4问题判断两个样品最相似的依据是什么?谱系聚类5类间距离及其递推公式 常用的类间距离有四种:最短距离 最长距离 类平均距离 重心距离类间距离谱系聚类6 以 分别表示样品 ,以 简记 与 的距离 ,设 分别表示两个类,它们分别含有 个样品.我们用 来表示类 与 之间的距离.最短距离 即用两类中样品之间距离最短者作为两类间的距离.谱系聚类7最长距离 即用两类中样品之间距离最长者作为这两类间的距离.类平均距离 即用两类中所有两两样品之间的距离的平均作为两类之间的距离.或者 即用两类中所有两两样品之间的平方距离的平均作为两类间的平方距离.谱系聚类8重心距离设类 中的样品为 ,则其均值称

3、为类 的重心.其中,分别是 的重心,即用两类的重心之间的距离作为两类间的距离.谱系聚类9 按照谱系聚类的思想,先将样品聚合成小类,再逐步聚为大类.设类 由类 合并所得,则 包含 个样品.为了更方便地实现谱系聚类,我们需要建立类间距离的递推公式,即计算类 与其他类 之间的距离.类间距离的递推公式谱系聚类10常用的四种类间距离的递推公式最短距离最长距离谱系聚类11类平均距离对于类平均距离的下列定义方式 同理可得递推公式如下:谱系聚类12重心距离由 的合并集 的重心是 而 由,有 谱系聚类13 若采用欧氏距离的距离,以上介绍的4种类间距离的递推公式可统一表示为 计算样品之间 谱系聚类14各种类间距离

4、的参数如下表所示谱系聚类15谱系聚类法的步骤(1)n个样品开始时作为n个类,计算两两之间的距离,构成一个对称距离矩阵 此时,谱系聚类16 (2)选择 中主对角线以下(或以上)的最小距离,设这个元素是 ,这时 ,首先将 合并为一个新类 .在 中消去 ,所对应的行与列,并加入由新类 与剩下的其他未聚合的类间的距离所组成的一行和一列,得到一个更新的距离矩阵 ,它是 阶方阵.(3)从 出发重复步骤(2)的做法得 ,再由 出发重复上述步骤,直到 个样品聚为一个大类为止.(4)在合并过程中要记下合并样品的编号及两类合并时的距离(称为距离水平),并绘制聚类谱系图.谱系聚类17谱系聚类法的应用分析 核电企业对

5、自身库存的优化管理 仓库内存货位置摆放的合适与否会直接影响到总搬运费用、大修工作效率以及仓库人员的工作积极性。因此将备品备件正确地分类存放是非常重要的。应用谱系聚类法中的最短距离法对核电企业的备品备件进行分类,然后根据分类的结果对这些类之间的关系做总结归纳。谱系聚类18谱系聚类法的应用分析 将备品备件大致分为以下几类:机械类:紧固件、密封、轴承、过滤器、压缩机、管道、热交换器等;电气类:熔断器、断路器、变压器、电气元件、电机、电缆等;仪表类:电子元件、电路板、电源、工业计算机及备件、各种测量仪等;五金类:金属材料等;其他类:焊接材料、润滑油、安全防护、消防器材等。谱系聚类19谱系聚类法的应用分

6、析 为了便于说明,列举了部分变量指标,对这五类备品备件的各项变量打分如下表(满分10 分):谱系聚类20谱系聚类法的应用分析 然后利用欧式距离公式,根据表内的打分计算各类之间的相互距离,得到矩阵如下:谱系聚类21谱系聚类法的应用分析 由上述矩阵知,G4与G5之间距离最短,所以组成一个新类G6。然后再用G6 与其他类再次比较,即用G6 里面的子类G4 与G5 分别与其他类的欧氏距离进行比较,选择其中距离小的为两类之间的距离。故得到新矩阵如下:谱系聚类22谱系聚类法的应用分析 此时,G3 与G6 之间的距离最短,所以G3、G4 和G5 共同组成一个新类G7,同上述步骤一样,得出新的矩阵如下:谱系聚

7、类23谱系聚类法的应用分析 同理,G2 与G7 组成一个新类G8,G8 与G1 的欧氏距离为:综上所述,我们在距离为11 的水平上首先合并五金类和其他类,得到新类G6=G4,G5;然后,更新距离矩阵后又在距离为12 的水平上合并G3 与G6 得到新类G7=G3,G4,G5;在距离为13 的水平上合并G2 与G7 为新类G8;最后在距离为41 的水平上将G1 与G8 合并成一个大类。谱系聚类24谱系聚类法的应用分析 将上述聚类过程连同合并时的水平用图表示出来,可以画出谱系图如下:谱系聚类25谱系聚类法的应用分析 由此可见,这五类归纳为两类比较合适,即电气类、仪表类、五金类和其他类为一类,机械类自成一类。把聚类结果按照现实中的具体情况再加以调整,将相近的类存放在比较近的位置或者以相同的工作程序进行处理,以便于按照大修及日常维护工作的需要及时地准备好备品备件,为机组正常运行发电提供有效保障并且降低了搬运成本。谱系聚类26谱系聚类27

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!