2021数据挖掘实验报告-实验1-Weka基础操作

上传人:x** 文档编号:20656538 上传时间:2021-04-09 格式:DOCX 页数:9 大小:18.88KB
收藏 版权申诉 举报 下载
2021数据挖掘实验报告-实验1-Weka基础操作_第1页
第1页 / 共9页
2021数据挖掘实验报告-实验1-Weka基础操作_第2页
第2页 / 共9页
2021数据挖掘实验报告-实验1-Weka基础操作_第3页
第3页 / 共9页
资源描述:

《2021数据挖掘实验报告-实验1-Weka基础操作》由会员分享,可在线阅读,更多相关《2021数据挖掘实验报告-实验1-Weka基础操作(9页珍藏版)》请在装配图网上搜索。

1、数据挖掘实验报告-实验1-Weka基础操作学生实验报告学院:信息管理学院课程名称:数据挖掘教学班级: B01姓名:学号:实验报告课程名称数据挖掘教学班级B01指导老师学号姓名行政班级实验项目实验一: Weka的基本操作组员名单独立完成实验类型操作性实验验证性实验综合性实验实验地点H535实验日期2021.09.281. 实验目的和要求:(1)Explorer界面的各项功能;注意不能与课件上的截图相同,可采用打开不同的数据文件以示区别。(2)Weka的两种数据表格编辑文件方式下的功能介绍;Explorer-Preprocess-edit,弹出Viewer对话框;Weka GUI选择器窗口-Too

2、ls | ArffViewer,打开ARFF-Viewer窗口。(3)ARFF文件组成。2实验过程(记录实验步骤、分析实验结果)2.1 Explorer界面的各项功能2.1.1 初始界面示意其中:explorer选项是数据挖掘梳理数据最常用界面,也是使用weka最简单的方法。Experimenter:实验者选项,提供不同数值的比较,发现其中规律。KnowledgeFlow:知识流,其中包含处理大型数据的方法,初学者应用较少。Simple CLI :命令行窗口,有点像cmd 格式,非图形界面。2.1.2 进入Explorer 界面功能介绍(1)任务面板Preprocess(数据预处理):选择和修

3、改要处理的数据。Classify(分类):训练和测试分类或回归模型。Cluster(聚类):从数据中聚类。聚类分析时用的较多。Associate(关联分析):从数据中学习关联规则。Select Attributes(选择属性):选择数据中最相关的属性。Visualize(可视化):查看数据的二维散布图。(2)常用按钮Openfile:打开文件Open URL:打开URL格式文件Open DB:打开数据库文件Generate:数据生成Undo:撤销操作Edit:编辑数据Save:保存数据文件,可实现文件格式的转换,比如csv 格式文件向ARFF格式文件转换等等。(3)筛选数据Choose:从这个

4、按钮进去可以选择某个过滤器对数据进行筛选,数据预处理一般使用这个。Apply:处理完成后,点击这个按钮,处理生效。(4)数据集的属性关系和操作current relation:展示了属性的(relation)关系名称,(attributes)属性数,(Insetances)实例数,(sum of weights)权重的总和等多种属性关系。Attributes:展示了属性的所有列,上边的四个按钮是对属性列的快捷选择按钮,包括(all)全选,(none)全不选,(Ivert)反选,(patern)模式,选择符合某一条件的属性列。最下边的remove 按钮可以删除选中的属性列,如果想撤回,可以使用上

5、边提到的undo 按钮(5)属性摘要和直方图Selected attributes:如果是数值属性:属性名(Name)、属性类型(Type)、缺失值(Missing)个数及百分比、不同值(Distinct)数、唯一值(Unique)数及百分比等等。对于数值属性和标称属性,摘要的方式是不一样的。图中显示的是标签的取值及相应取值的实例数。选中属性的直方图。若数据集的最后一个属性是类标变量(这是分类或回归任务的默认目标变量,如“play” ),直方图中的每个长方形就会按照该变量的比例分成不同颜色的段。要想换个分段的依据,在上方的下拉框中选个不同的分类属性就可以了。下拉框里选上“No Class”或者

6、一个数值属性会变成黑白的直方图。Visualize:展示所有的属性的直方图(6)状态栏(status)显示一些信息让你知道正在做什么。在状态栏中的任意位置右击鼠标将会出现一个小菜单。有两个选项:Memory Information-显示WEKA可用的内存量。Run garbage collector-强制运行Java垃圾回收器,搜索不再需要的内存空间并将之释放,从而可为新任务分配更多的内存。Log:按钮可以查看以weka操作日志。没有任务时,右边的小鸟是坐着的,任务运行时,小鸟会站起来左右摇摆。若小鸟站着但不转动,表示任务出了问题。2.1.2 引例操作显示功能(1)2.2 weka 的两种数据

7、表格编辑方式下的功能介绍Explorer-Preprocess-edit,弹出Viewer对话框;1、双击鼠标可以对数据进行修改,2、在数据上使用右键可以对数据修改进行撤回(undo)3、对数据修改之后,如果想保存,点击下方的ok,撤回点击undo,不保存直接点击cancelWeka GUI选择器窗口-Tools | ArffViewer,打开ARFF-Viewer窗口。1、在最开始进入界面点击上边的tools,进入arffviewer。2、点击打开不同的文件,会在上沿像浏览器一样挨个展示arff 文件的内容。3、鼠标移动到属性名称旁边是会显示对属性列操作的格式,单机左键会对所有数据按照这个属

8、性按照升序排列,(shift +左键)会对属性按照这个属性进行降序排列,(Alt+左键)或者直接右键出现对数据进行操作的菜单,对属性列进行重命名,所有数据相加之类的操作都可以在菜单中找到。4、鼠标定在某行时,可以删除某一行5、有点像excel中的操作2.2 ARFF 文件组成2.2.1、对文件格式介绍WEKA存储数据的格式是ARFF(Attribute-Relation File Format)文件1、这是一种ASCII文本文件2、文件的扩展名为.arff3、可以用写字板打开、编辑 ARFF文件。建议用UltraEdit等编辑器使用写字板打开时如下“%”表示注释,WEKA将忽略这些行。除去注释

9、后,整个ARFF文件可以分为两个部分:(a)第一部分给出了头信息(Head information),包括了对关系的声明和对属性的声明。(b)第二部分给出了数据信息(Data information),即数据集中给出的数据。从“data”标记开始,后面的就是数据信息了。关系名称在ARFF文件的第一个有效行来定义,格式为:relation 属性声明用一列以“attribute”开头的语句表示。数据集中的每一个属性都有对应的“attribute”语句,来定义它的属性名称和数据类型(datatype):attribute其中属性声明语句的顺序很重要,它表明了该项属性在数据部分的位置。最后一个声明的属

10、性被称作class属性,在分类或回归任务中,它是默认的目标变量。WEKA一共支持五种数据类型numeric 数值型nominal 标称(nominal)型string 字符串型date Relational 关系型还可以使用两个类型“integer”和“real”,但是WEKA把它们都当作“numeric”看待。注意:“integer”,“real”,“numeric”,“date”,“string”这些关键字是区分大小写的,而“relation”、“attribute ”和“data”则不区分。每个实例占一行,实例的各属性值用逗号“,”隔开。如果某个属性的值是缺失值(missing value),用问号“?”表示,且这个问号不能省略。2.2.2 xls文件转arff文件(1)创建xls文件,保存为csv文件(2)weka中打开csv格式的文件,另存为arff文件,因为在数据处理中,arff文件最受欢迎转存后3问题反馈与收获3.1 问题与解决办法突然忘记了怎么将表格图片快捷保存了,咨询百度也没找到结果,然后决定使用截图了3.2 发现与收获我发现:在数据处理的时候使用离散化,可以更好的显示数据之间的差别。如下所示经过离散化之后,数据可以更清楚看出规律了4指导教师评语及成绩:评语:成绩:指导教师签名:批阅日期:月日

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!