聚类算法简介ppt课件

上传人:txadgkn****dgknqu... 文档编号:170029563 上传时间:2022-11-18 格式:PPT 页数:29 大小:559.50KB
收藏 版权申诉 举报 下载
聚类算法简介ppt课件_第1页
第1页 / 共29页
聚类算法简介ppt课件_第2页
第2页 / 共29页
聚类算法简介ppt课件_第3页
第3页 / 共29页
资源描述:

《聚类算法简介ppt课件》由会员分享,可在线阅读,更多相关《聚类算法简介ppt课件(29页珍藏版)》请在装配图网上搜索。

1、寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多 聚类算法简介寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多什么是聚类?聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数

2、据相似度较小;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多为什么需要聚类?对相似的对相似的文档或超文档或超链接进行链接进行聚类,由聚类,由于类别数于类别数远小于文远小于文档数,能档数,能够加快用够加快用户寻找相户寻找相关信息的关信息的速度速度;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。

3、准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多聚类图示聚类中没有任何指导信息,完全按照数据的分布进行类别划分聚类中没有任何指导信息,完全按照数据的分布进行类别划分寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多什么是分类?数据集合 ,类别标记集合 数据集合:训练数据 待分类数据 已知 问题:方法:根据训练数据获得类别划分标准 C;()&()xTrainData konwClass xClass

4、xC ClassData()f x;()()tClassDataClass tf t TrainData;()tClassDataClass t?Data,()xDataClass xC 寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多分类图示训练数据训练数据待分类数据待分类数据寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中

5、毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多聚类与分类的区别 有类别标记和无类别标记;有监督与无监督;(有训练语料与无训练语料)Train And Classification(分类);No Train(聚类);寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多聚类的基本要素 定义数据之间的相似度;聚类有效性函数(停止判别条件);1.在聚类算法的不同阶段会得到不同

6、的类别划分结果,可以通过聚类有效性函数来判断多个划分结果中哪个是有效的;2.使用有效性函数作为算法停止的判别条件,当类别划分结果达到聚类有效性函数时即可停止算法运行;类别划分策略(算法);通过何种类别划分方式使类别划分结果达到有效性函数;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多 相似度 Euclidean Distance1(,)()rimjmmEuclideanAAijA A数据表示为向量,向量中某一维

7、对应数据某一特征或属性数据表示为向量,向量中某一维对应数据某一特征或属性仅计算了数据向量中属于同一维度特征的权值差距仅计算了数据向量中属于同一维度特征的权值差距;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多 聚类有效性函数 最小误差():最小方差:21|iiiicx Cieieiix Ccx mCxmJxmJC个类别,待聚类数据,为类别 的中心,越小聚类结果越好221|iiix CxCSxxn eJ衡量同一类

8、别内数据的平均误差和衡量同一类别内数据的平均误差和;iSeJ衡量属于不同类别的数据与类别中心的的误差和衡量属于不同类别的数据与类别中心的的误差和;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多聚类算法的简单分类 基于划分:K-means,K-medoids 基于层次:HFC 基于密度:DBSCAN 基于网格:CLIQUE,STING 寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒

9、假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多K-means 初始参数-类别数&初始类别中心;聚类有效性函数-最小误差;优点:聚类时间快;缺点:对初始参数敏感;容易陷入局部最优;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多K-means步骤 1 设置初始类别中心和类别数;2 根据类别中心对数据进行类别划

10、分;3 重新计算当前类别划分下每类的中心;4 在得到类别中心下继续进行类别划分;5 如果连续两次的类别划分结果不变则停止算法;否则循环25;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱

11、很多初始值敏感初始化初始化4个类别中心个类别中心;左侧的全体数据仅与第一个类别中心相似左侧的全体数据仅与第一个类别中心相似;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多层次聚类 分裂或凝聚算法运行到某一阶段,类别划分结果达到聚类标准时算法运行到某一阶段,类别划分结果达到聚类标准时即可停止分裂或凝聚即可停止分裂或凝聚;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社

12、会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多基于聚类的入侵检测方法 由于IDS需要处理的数据量非常大,对建模和检测的准确性、时效性要求高,因此在研究基于聚类的入侵检测方法时重点考虑三个方面的要求:聚类算法时间复杂度低;聚类精度高,能将不同类型的数据聚集在分离的簇中;给簇准确做标记,能得到较准确的分类模型。寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但

13、是,目前社会上寒假招工的陷阱很多基于聚类的检测方法 主要由两大模块构成:模型建立 第一步:对训练集进行聚类;第二步:利用聚类结果得到分类模型;模型评估 检测率:被正确检测的攻击记录数占整个攻击记录数的比例。误报率:表示正常记录被检测为攻击的记录数占整个正常记录数的比例。未见攻击类型的检测率:表示测试集中出现而训练集中没有出现的新类型攻击记录被正确检测的比例。寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多基于聚类

14、的入侵检测方法分类 有指导的入侵检测方法 通过在已标记为正常和入侵的数据集上进行训练,建立分类模型,通过检测数据偏离各分类模型的偏差来检测非正常的、潜在的入侵行为。方法的有效性取决于训练数据集的质量。要求训练数据被正确地标记为正常或攻击,如果标记不正确,则算法可能会将某种入侵行为及其变种看成正常而不能检测,从而使检测率降低,或者将正常行为看成入侵,使误报率提高。寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多有指

15、导的聚类检测过程 1.初始时,簇集合为空,读入一个新的对象;2.以这个对象构建一个新的簇,该记录的类别标记作为新簇类别的标志;3.若已到数据库末尾,则转6,否则读入新对象,利用给定的距离定义,计算它与每个簇间距离,并选择最小的距离;4.若最小距离超过阈值,或对象的类别与其最近簇的类别不同,转2;5.否则将该对象并入具有最小距离的簇中并更新该簇的各类属性值的统计频度及数值属性的簇中心,转3;6.结束。寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。

16、但是,目前社会上寒假招工的陷阱很多基于聚类的入侵检测方法分类 无指导的入侵检测方法 是在未标记的数据上训练模型并检测入侵,不需要任何先验知识,可能检测新的、未知的入侵。基于基本的假定:正常行为较入侵行为占绝对的比例;入侵行为偏离正常行为是可以区别的。寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多聚类簇寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱

17、很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多无指导的聚类检测过程 1.模型建立 第一步:对训练集T1进行聚类,得到聚类结果T1=C1,C2,Ck;第二步:给簇做标记:统计每个簇Ci(1i k)的异常因子或数据量的大小。2.确定模型:确定每个簇的类中心和半径阈值。3.利用最近邻分类方法对测试集中的每个对象进行分类;寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社

18、会上寒假招工的陷阱很多实验数据集KDD CUP KDD Cup1999入侵数据包是真正的网络数据,它是在军事网络坏境中运用非常广泛的模拟入侵攻击所得到的数据集。包含大约490万条数据纪录。通过检测记录中是否包含有攻击行为以及攻击行为的类别,把记录标记成为正常记录或是某种攻击的记录。并且认为这些标记都是正确可信的。寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多实验数据集KDD CUP KDD Cup1999中总共

19、包括了41个特征,其中9个是离散的特征值,而32个是连续的特征值。这些特征是从连接中抽取出来专门为了区分正常连接和异常连接的特征。寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多单个单个TCP连接的基本属性连接的基本属性 特征名称特征名称特征描述特征描述数据类型数据类型duration连接时间的长短连接时间的长短连续型连续型protocol_type协议类型,比如协议类型,比如tcp,udp等等离散型离散型ser

20、vice目的端的网络服务,比如目的端的网络服务,比如http,telnet等等离散型离散型src_bytes从源端到目的端传输的字节数从源端到目的端传输的字节数连续型连续型dst_bytes从目的端到源端传输的字节数从目的端到源端传输的字节数连续型连续型flag连接的状态为连接的状态为normal还是还是error离散型离散型land源和目的主机源和目的主机/端口是否相同,相同为端口是否相同,相同为1,不同为,不同为0离散型离散型wrong_fragment错误分片的数目错误分片的数目连续型连续型urgent紧急包的数目紧急包的数目连续型连续型寒假来临,不少的高中毕业生和大学在校生都选择去打工

21、。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多实验数据集KDD CUP 实验数据集采用KDD Cup1999网络数据集。该数据集中包含的攻击类型可以分成是四大类:DOS拒绝服务攻击类型(比如,Syn flood);U2R非授权得到超级用户权限或运行超级用户函数(比如,缓冲溢出攻击);R2L从远程计算机进行非授权的访问(比如,密码的猜测及用户权限级别的提升);Probing扫描或者对其它系统漏洞的探测(比如,端口扫描)。寒假来临,不少的高中毕业生和大学在校生都选

22、择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多实验数据集KDD CUP攻击所属类别 攻击名称 DOS Back,land,Neptune,pod,smurf,teardrop U2R Buffer_overflow,loadmodule,perl,rootkit R2L ftp_write,guess_passwd,imap,multihop,phf,spy,warezclient,warezmaster Probing Ipsweep,nmap,portsweep,satan 寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多寒假来临,不少的高中毕业生和大学在校生都选择去打工。准备过一个充实而有意义的寒假。但是,目前社会上寒假招工的陷阱很多 Thank You!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!