数据挖掘实验指南part

上传人:y****n 文档编号:253055932 上传时间:2024-11-28 格式:PPT 页数:17 大小:1.22MB
收藏 版权申诉 举报 下载
数据挖掘实验指南part_第1页
第1页 / 共17页
数据挖掘实验指南part_第2页
第2页 / 共17页
数据挖掘实验指南part_第3页
第3页 / 共17页
资源描述:

《数据挖掘实验指南part》由会员分享,可在线阅读,更多相关《数据挖掘实验指南part(17页珍藏版)》请在装配图网上搜索。

1、,单击此处编辑母版标题样式,,*,,*,单击此处编辑母版文本样式,,第二级,,单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,*,,*,数据挖掘实验指南,,本,ppt,主要为,08,届信科,胡旭灵,根据实验课内容制作,,10,届统计旷英兰参与部分修改,特表感谢!,2024/11/28,1,数据挖掘实验指南,本ppt使用说明,,标为,红色,字体为课程涉及的主要操作,,此,ppt,主要为方便大家熟悉,weka,的基本使用,如果要深入学习,可参考其他书籍,欢迎和大家一起共同学习进步。,,软件中提到的软件,自带数据,,是指在软件安装文件夹中有个,data,的文件夹里面的数据。,202

2、4/11/28,2,数据挖掘实验指南,总体框架,,2024/11/28,3,数据挖掘实验指南,Weka软件,,Weka,软件是著名的免费数据挖掘软件,各位同学可到官方网站下载,,共有两种类型,一种以,jre,结尾,表示软件自带,java,虚拟机,另一种不带(适合,pc,上已安装,java,虚拟机)。,2024/11/28,4,数据挖掘实验指南,安装运行weka,,下载安装包后,解压安装。,,注:安装后若发现运行软件出现一闪而过,则说明,java,环境变量没设置好(鉴于大家都学过,java,,设环境变量的步骤是大家应该会的)。,,2024/11/28,5,数据挖掘实验指南,设置java环境变量后

3、运行,,,2024/11/28,6,数据挖掘实验指南,Weka功能简介,,Weka,介绍,,菜单栏里,program,里有个重要的,logwindow,—,日志窗口选项卡,用来显示包括出错信息等。,,Visualization,是进行,,数据可视化操作,,Tools,是与查看文件,,有关的功能,,2024/11/28,7,数据挖掘实验指南,四大主要应用程序,,Explorer,是探索数据的环境,在本课程中将,主要介绍,。,,Experimenter,是用来运行算法试验,算法检验等的环境。,,Knowledgefolw,这个环境与,explorer,相似,但支持拖放。,,simpleCLI,是,

4、命令行,界面,可以直接执行,weka,命令,其实在,cmd,命令窗里也可直接运行,weka,的命令,前提是设好环境变量等。,,,2024/11/28,8,数据挖掘实验指南,读取数据,,举例:,Explorer》openfile,(,选择本机,安装文件夹,里自带的数据,)》,选择,weather.arff,,2024/11/28,9,数据挖掘实验指南,(注:,.arff,文件是,weka,识别的主要类型,,weka,还识别,spss,的,.cvs,类型,的数据,故数据转换,,为,普通数据,->spss.csv->.arff,,,也可以用写字板和记事本打开,arff,文件以观察数据),2024/1

5、1/28,10,数据挖掘实验指南,Explorer的process界面简介,,,,,,点击,edit,可,修改数据,,选择属性后点击,remove,可删除属性,可进行数据的变换,如离散化的数据预处理,数据预处理,的主要选项,2024/11/28,11,数据挖掘实验指南,数据预处理,,数据预处理,作为数据挖掘的前奏,起着奠基石的作用,希望引起各位同学的重视。,2024/11/28,数据挖掘实验指南,12,数据预处理举例:离散化,,打开,C:\Program Files\Weka-3-6\data\weather.arff,后点击,choose,点击,2024/11/28,13,数据挖掘实验指南,

6、选择,choose,后选择,过滤规则,:,离散化,Choose->filters->unsupervised->attribute->discretize,discretize,2024/11/28,14,数据挖掘实验指南,选择规则后,应用规则进行离散化,1,、双击所选规则可进行规则的参数设置,见右框,2,、此框可调整参数,4,、点击,apply,则应用规则,3,、进行选择要离散化的属性,2024/11/28,15,数据挖掘实验指南,离散化后的结果,,2,、应用规则后,离散化分为,10,类,如下图所示,1,、应用规则后再点击该属性,可视化,2024/11/28,16,数据挖掘实验指南,数据预处理总结,,数据预处理的方式非常多,但基本流程跟离散化差不多,请各位同学自行尝试,多实践。,2024/11/28,17,数据挖掘实验指南,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

相关资源

更多
正为您匹配相似的精品文档
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  sobing.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!