数据挖掘简介

上传人:仙*** 文档编号:240698068 上传时间:2024-04-30 格式:PPT 页数:14 大小:826KB
收藏 版权申诉 举报 下载
数据挖掘简介_第1页
第1页 / 共14页
数据挖掘简介_第2页
第2页 / 共14页
数据挖掘简介_第3页
第3页 / 共14页
资源描述:

《数据挖掘简介》由会员分享,可在线阅读,更多相关《数据挖掘简介(14页珍藏版)》请在装配图网上搜索。

1、数据挖掘概述数据挖掘概述数据挖掘概述数据挖掘概述姓名:朱磊 学号:10721042 指导老师:王建国Contents数据挖掘简介数据挖掘简介1数据挖掘分类数据挖掘分类2成功案例成功案例3总结与展望总结与展望4数据挖掘简介数据挖掘简介v产生背景随着数据库技术的飞速发展,快速增长的海量数据收集、存放在大量数据储存库中理解他们已经远远超出人的能力数据坟墓难得再访问的数据档案数据丰富,但信息缺乏如何利用大量数据如何利用大量数据数据挖掘定义v从大量的、不完全的、有噪声的、随机的数据中提取含在其中的、人们事先不知道的、有用的信息和知识的过程。v功能的广义观点:从存放在数据库、数据仓库或其他信息库中的大量数

2、据中发现知识的过程v数据挖掘是一个新兴、交叉学科领域演变历程演变历程数据仓库 提取信息和知识数据挖掘数据库原始文件原始文件处理原始文件处理纸张纸张界面、查询界面、查询硬盘硬盘联机分析处理联机分析处理各个数据库各个数据库各种媒体各种媒体20世纪60年代前20世纪60年代20世纪80年代现在现在 数据挖掘受多学科的影响数据挖掘受多学科的影响数据挖掘数据挖掘BBE EC CDDAA统计学数据库技术信息科学其他学科机器学习数据挖掘步骤数据挖掘步骤结果解释和评估数据挖掘算法执行数据收集数据收集和与处理和与处理问题定义数据挖掘分类数据挖掘分类离群点离群点分析分析分类分类分析分析聚类聚类分析分析关联关联分析

3、分析时间时间序列序列数据挖掘数据挖掘v分类分析分类分析:找出描述和区分数据类或概念的模型,:找出描述和区分数据类或概念的模型,以便能够使模型预测未知的对象类以便能够使模型预测未知的对象类v常用方法:分类规则;决策树;神经网络;常用方法:分类规则;决策树;神经网络;v聚类分析聚类分析:根据最大化类内部的相似性、最小化:根据最大化类内部的相似性、最小化类之间的相似性的原则进行聚类或分组类之间的相似性的原则进行聚类或分组v常用算法:常用算法:K-MEAMS;分层凝聚发;估算最大;分层凝聚发;估算最大值法值法v关联分析关联分析:发现数据库中不同项之间的联系:发现数据库中不同项之间的联系v常用方法:常用

4、方法:Apriori;MAQA;IUA;v时间序列分析时间序列分析:描述行为随时间变化的对象的规:描述行为随时间变化的对象的规律或趋势,并对其建模律或趋势,并对其建模匹配方法:匹配方法:ARMA模型模型v离群点分析离群点分析:检测和分析离群点:检测和分析离群点离群点:与数据的一般行为或模型不一致的点离群点:与数据的一般行为或模型不一致的点成功案例成功案例v啤酒加尿布啤酒加尿布v地点:沃尔玛在美国加州的某连锁店地点:沃尔玛在美国加州的某连锁店v起因:每天销售信息和顾客基本情况的数据库中起因:每天销售信息和顾客基本情况的数据库中发现购买婴儿尿布的顾客多是男性,而且往往也发现购买婴儿尿布的顾客多是男

5、性,而且往往也同时购买啤酒同时购买啤酒v经过:重新布置货架,把啤酒类商品布置在婴儿经过:重新布置货架,把啤酒类商品布置在婴儿尿布货架附近,并在两者之间放上土豆之类的佐尿布货架附近,并在两者之间放上土豆之类的佐酒小食品和男性生活用品酒小食品和男性生活用品v结果:上述几种商品销量大增结果:上述几种商品销量大增总结与展望总结与展望v现状:作为一个新兴的研究领域,数据挖掘已经现状:作为一个新兴的研究领域,数据挖掘已经取得了广泛和重大进展。应用到众多领域,出现取得了广泛和重大进展。应用到众多领域,出现了大量的商品化数据挖掘系统了大量的商品化数据挖掘系统v发展方向:对现有方法进一步改进,研究发展数发展方向:对现有方法进一步改进,研究发展数据挖掘语言的标准化,可视化方法和处理复杂数据挖掘语言的标准化,可视化方法和处理复杂数据类型的新方法据类型的新方法v目前面临困难:成功案例少,中小企业需求少目前面临困难:成功案例少,中小企业需求少人才稀缺人才稀缺

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!