Clementine12中的数据挖掘算法

上传人：jin****ng 文档编号：178903774 上传时间：2022-12-30 格式：DOCX 页数：3 大小：46.18KB

收藏版权申诉举报下载

第1页 / 共3页

第2页 / 共3页

第3页 / 共3页

资源描述：

《Clementine12中的数据挖掘算法》由会员分享，可在线阅读，更多相关《Clementine12中的数据挖掘算法（3页珍藏版）》请在装配图网上搜索。

1、Clementine12中的数据挖掘算法SPSS 2010-03-31 08:39:10阅读14评论0字号：大中小迅速的找到自己最近老有朋友问我Clementine12中都有哪些算法？感觉Clementine12中的算法很多，很齐全并且根据商业目的做了大体的分类(预测的、分类的、细分的、关联的)，所以大家只要清楚自己的商业问题是哪类问题、用什么算法能达到自己想要的目的就可以根据Clementine12中的模型划分，想要的mode；下图是Clementine12中所有数据挖掘的算法:两坂Logistic 5 回归利别式时1间序列QUESTCHA1DGRIAprian隔會异常C5 Q;燧瞅决集

2、列表k-MeansKohonenSLRMGenLinCarmasps 5-market, r. blog. 163.coin下面是谢邦昌教授的数据挖掘(Data Mining)十种分析方法，以便于大家对模型的初步了解，不过也是日常挖掘中经常遇到的算法，希望对大家有用！(甚至有数据挖掘公司，用其中的一种算法就能独步天下)1、记忆基础推理法(Memory-Based Reasoning； MBR)记忆基础推理法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute)，通常找寻最相似的案例来做比较。记忆基础推理法中有两个主要的要素，分别为距离函数( distance

3、 function)与结合函数 (combination function)。距离函数的用意在找出最相似的案例；结合函数则将相似案例的属性结合起来，以供预测之用。记忆基础推理法的优点是它容许各种型态的数据，这些数据不需服从某些假设。另一个优点是其具备学习能力，它能藉由旧案例的学习来获取关于新案例的知识。较令人诟病的是它需要大量的历史数据，有足够的历史数据方能做良好的预测。此外记忆基础推理法在处理上亦较为费时，不易发现最佳的距离函数与结合函数。其可应用的范围包括欺骗行为的侦测、客户反应预测、医学诊疗、反应的归类等方面。2、市场购物篮分析(Market Basket Analysis)购物

4、篮分析最主要的目的在于找出什么样的东西应该放在一起？商业上的应用在藉由顾客的购买行为来了解是什么样的顾客以及这些顾客为什么买这些产品，找出相关的联想(association)规则，企业藉由这些规则的挖掘获得利益与建立竞争优势。举例来说，零售店可藉由此分析改变置物架上的商品排列或是设计吸引客户的商业套餐等等。购物篮分析基本运作过程包含下列三点：(1) 选择正确的品项：这里所指的正确乃是针对企业体而言，必须要在数以百计、千计品项中选择出真正有用的品项出来。(2) 经由对共同发生矩阵(co-occurrence matrix)的探讨挖掘出联想规则。(3) 克服实际上的限制：所选择的品项愈多，计

5、算所耗费的资源与时间愈久(呈现指数递增)，此时必须运用一些技术以降低资源与时间的损耗。购物篮分析技术可以应用在下列问题上：(1) 针对信用卡购物，能够预测未来顾客可能购买什么。(2) 对于电信与金融服务业而言，经由购物篮分析能够设计不同的服务组合以扩大利润。(3) 保险业能藉由购物篮分析侦测出可能不寻常的投保组合并作预防。(4) 对病人而言，在疗程的组合上，购物篮分析能作为是否这些疗程组合会导致并发症的判断依据。3、决策树(Decision Trees)决策树在解决归类与预测上有着极强的能力，它以法则的方式表达，而这些法则则以一连串的问题表示出来，经由不断询问问题最终能导出所需的结果。典

6、型的决策树顶端是一个树根，底部有许多的树叶，它将纪录分解成不同的子集，每个子集中的字段可能都包含一个简单的法则。此外，决策树可能有着不同的外型，例如二元树、三元树或混和的决策树型态。4、基因算法(Genetic Algorithm)基因算法学习细胞演化的过程，细胞间可经由不断的选择、复制、交配、突变产生更佳的新细胞。基因算法的运作方式也很类似，它必须预先建立好一个模式，再经由一连串类似产生新细胞过程的运作，利用适合函数(fitness function)决定所产生的后代是否与这个模式吻合，最后仅有最吻合的结果能够存活，这个程序一直运作直到此函数收敛到最佳解。基因算法在群集(clust

7、er)问题上有不错的表现，一般可用来辅助记忆基础推理法与类神经网络的应用。5、群集侦测技术(Cluster Detection)这个技术涵盖范围相当广泛，包含基因算法、类神经网络、统计学中的群集分析都有这个功能。它的目标为找出数据中以前未知的相似群体，在许许多多的分析中，刚开始都运用到群集侦测技术，以作为研究的开端。6、连结分析(Link Analysis)连结分析是以数学中之图形理论(graph theory)为基础，藉由记录之间的关系发展出一个模式，它是以关系为主体，由人与人、物与物或是人与物的关系发展出相当多的应用。例如电信服务业可藉连结分析收集到顾客使用电话的时间与频率，进而

8、推断顾客使用偏好为何，提出有利于公司的方案。除了电信业之外，愈来愈多的营销业者亦利用连结分析做有利于企业的研究。7、在线分析处理(On-Line Analytic Processing； OLAP)严格说起来，在线分析处理并不算特别的一个数据挖掘技术，但是透过在线分析处理工具，使用者能更清楚的了解数据所隐藏的潜在意涵。如同一些视觉处理技术一般，透过图表或图形等方式显现，对一般人而言，感觉会更友善。这样的工具亦能辅助将数据转变成信息的目标。8、类神经网络(Neural Networks)类神经网络是以重复学习的方法，将一串例子交与学习，使其归纳出一足以区分的样式。若面对新的例证，神经网络

9、即可根据其过去学习的成果归纳后，推导出新的结果，乃属于机器学习的一种。数据挖掘的相关问题也可采类神经学习的方式，其学习效果十分正确并可做预测功能。9、区别分析(Discriminant Analysis)当所遭遇问题它的因变量为定性(categorical)，而自变量(预测变量)为定量(metric)时，区别分析为一非常适当之技术，通常应用在解决分类的问题上面。若因变量由两个群体所构成，称之为双群体一区别分析(Two-Group Discriminant Analysis)；若由多个群体构成，则称之为多元区别分析 (Multiple Discriminant Analysis； MDA)

10、。(1) 找出预测变量的线性组合，使组间变异相对于组内变异的比值为最大，而每一个线性组合与先前已经获得的线性组合均不相关。(2) 检定各组的重心是否有差异。(3) 找出哪些预测变量具有最大的区别能力。(4) 根据新受试者的预测变量数值，将该受试者指派到某一群体。10、罗吉斯回归分析(Logistic Analysis)当区别分析中群体不符合常态分配假设时，罗吉斯回归分析是一个很好的替代方法。罗吉斯回归分析并非预测事件（event）是否发生，而是预测该事件的机率。它将自变量与因变量的关系假定是S 行的形状，当自变量很小时，机率值接近为零；当自变量值慢慢增加时，机率值沿着曲线增加，增加到一定程度时，曲线协率开始减小，故机率值介于0与1之间。

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

Clementine12中的数据挖掘算法

最新文档

相关资源

相关搜索