数据挖掘课程设计

上传人:jin****ng 文档编号:193731700 上传时间:2023-03-12 格式:DOCX 页数:18 大小:681.20KB
收藏 版权申诉 举报 下载
数据挖掘课程设计_第1页
第1页 / 共18页
数据挖掘课程设计_第2页
第2页 / 共18页
数据挖掘课程设计_第3页
第3页 / 共18页
资源描述:

《数据挖掘课程设计》由会员分享,可在线阅读,更多相关《数据挖掘课程设计(18页珍藏版)》请在装配图网上搜索。

1、枣庄学院信息科学与工程学院课程设计任务书题目:数据挖掘在期末成绩评估中的应用小组成员:赵尊强、桂文学成员学号:201212110136、201212110106专业班级:计算机科学与技术、2012级本1班课 程:数据挖掘指导教师:迟庆云职称:副教授完成时间: 2015年 5 月2015 年 6 月枣庄学院信息科学与工程学院制2015 年 5 月 20 日课程设计任务书及成绩评定课程设计的任务和具体要求任务:1. 确定挖掘主题和方法:根据挖掘的主题和目标,确定合适的挖掘方法。2. 数据选择和预处理:根据所收集数据,填充缺失值,平滑噪声数据,消除 异常值,解决数据不一致等问题。3挖掘方法实现:规划

2、挖掘过程,界面设计,挖掘方法实现。4挖掘数据: 对预处理后的数据进行挖掘4.模式的可视化表达与解释:根据应用领域的信息和知识需求,以直观有效 的形式,如图表等显示数据挖掘出的模式,用特定领域的知识加以解释,使 得用户能够理解和接受。要求:.撰写出符合要求的软件项目综合实践报告。指导教师签字:迟庆云_日期:_指导教师评语成绩: 指导教师签字: 日期:课程设计所需软件、硬件等 硬件环境:It erl(R) Core(TM)2 Duo CPU,主频 2.31GHz;内存 3G;硬盘320G以上;1024X768显示分辨率软件环境:Delphi ,SQL Server2008 , WEKA课程设计进度

3、计划起至日期工作内容备注5月01日一06日5月07日一20日6月05日一08日6月09日一18日搜集资料课程设计分析系统设计、测试设计写报告书参考文献、资料索引序号文献、资料名称编者者出版单位1 Jamie MacLennan, ZhaoHui Tang, Bogdan Crivat 者.数据挖掘原理与应用(第 2版)SQL Server 2008数据库.北京:清华大学出版社.2 王丽珍、周丽华、陈红梅、肖清,数据仓库与数据挖掘原来及应用,北京:科学出版 社3 张兴会数据仓库与数据挖掘技术清华大学出版社目录1概述51.1应用背景和问题的提出51.2设计内容的介绍52数据仓库设计52.1概念模型

4、设计52.2逻辑模型设计62.3物理模型设计62.4 OLAP前端展示设计83数据挖掘分析83.1期末成绩评估系统应用挖掘概述83.2数据挖掘实验93.2.1实验环境93.2.2数据准备及预处理93.2.3实验内容(输入数据集,选择算法,输出结果,比较分析)113.2.4算法选择144小结171概述1.1应用背景和问题的提出在大学生活中,我们大学生在某种程度上还是比较重视自己的课程成绩的。 而有一个期末最终成绩的评估系统,无疑对同学们而言是很有用的。在这个系 统中,只需输入你估计的平时成绩以及表现和期末考试的得分,就可以预测出 最终的成绩。而这个课程成绩的组成以及得出是怎么样的呢。这个最终的得

5、分 是受到什么影响呢?本论文就以上问题进行了探讨和挖掘。1.2设计内容的介绍本课程设计主要是探讨和研究在老师给定成绩时考虑的因素,以及这些因 素所占的比例。数据仓库为一份记录着600个同学的得分情况的数据,数据挖 掘则采用决策树探究出影响结婚年龄的因素。2数据仓库设计2.1概念模型设计数据仓库里 面有一个实体,也就是成绩score。成绩的决定因 素有 performance也就平时表现情况,即根据其在课堂上的活跃程度以及认真听课 的情况来给的分,还有averscore就是同学平时的作业得分以及平时测试或者 期中测试的平均成绩,以及期末考试的成绩lasttest。2.2逻辑模型设计本数据仓库只有

6、一个表,逻辑模型设计如下:2.3物理模型设计在数据仓库的物理设计中,主要解决数据的存储结构、数据的索引策略、 数据的存储策略、存储分配优化等问题。物理设计的主要目的有两个,一是提 高性能,二是更好地管理存储的数据。访问的频率、数据容量、选择的RDBMS 支持的特性和存储介质的配置都会影响物理设计的最终结果。在本数据挖掘中, 数据的索引策略采取的并不是位图索引而是按列索引2.4 OLAP模型设计在本设计中由于案例考虑的并不复杂,所以OLAP模型设计也就比较的简 单。F面的数据是保存在Excel中的。大概的模型设计也就如下图所示2.5 OLAP前端展示设计3数据挖掘分析3.1期末成绩评估系统应用挖

7、掘概述在本系统中,数据仓库采用一个二维表来存储和表示同学们的平时成绩, 平时表现得分,以及期末成绩等属性。数据挖掘则采用关联分析来将二维表中 的实例分开,并探究这些数据所蕴含的规律。323UUUTCE 厂 rUVIUEl : MlUTUUrCTerTJEETTUTFTUDestination Locatiun : SEL-024Destination Provider: SQLN匚L110* Copy rows from %tt$% to dbo.tt$The new target table will be created.* The package will not be saved.*

8、The package will be run irrirriediately.Provider mapping file :匚:-.Prugrarri FilessMicrosoft SQL ServerM 000TSMappingFilesdetToMSSql9.:-:ml实验内容(输入数据集,选择算法,输出结果,比较分析)Help B.ackFinishCancel建立一个Analysis Services Project的项目,在数据源中输入数据集:I Connection Manager|XProvider: | Native OLE DB5QL Server Native Clie

9、nt 10.0ConnectionServer name:5EL-024vRefreshAllLog on to the server:.: Use Windows Authentication:.: Use SQL Server Authentication12Vattacha database file:Browse.ogicalname:Connection string:Provider=5QLNCLI10. l;Data 5ource=5EL-024;Integrated 5ecurity=55PI;Initial Catalog=T5db中文版的SQL SERVER工具,并完成接下

10、来的实验步骤。324算法选择分类的任务是通过分析由已知类别数据对象组成的训练数据集,建立描述 并区分数据对象类别的分类函数或分类模型(也常常称作分类器)。分类算法有多种,例如,决策树分类算法、神经网络分类算法、贝叶斯分 类算法等。这里需要用的是决策树分类算法。在本挖掘中选择是关联分析,分析过程和结果如以下图所示:下面是挖掘模型:際挖堀结构|尺挖掘模型|挖掘模型查看器|屋I挖堀堆确性題表|守 挖掘模型预测43期承X结构/HSfllBVBSBSAverecor&M i cros 口:Et _Ae soci a t i orL_Riil e sPre di c tIdKeyLastFr e di c

11、tFerferm:=LTLcePredi ctS o cr eFredict关联规则:说明(项集是比较准确的)项集:分类 矩阵:依赖 关系 网络图:丄t.d LTX.W1 兀.dswL吃计起赠贝张挖掘结构|氏挖掘複型|爲挖掘模型查看器|厨挖掘准确性图表挖掘模型预测输入选择提升團分娄短陸交叉验证阳分类矩阵中的列对应于实际值;行对应于预测值Averecore上Tt的计数:预测 35. 768449088 (实际)35.768449088 - 53.8706249664.53.8706249664 - 69690719027.69.6907190272 - 87=87.01336495362647提

12、升图:挖掘结构的数据挖掘提升图:Tt1009080702030405060708090100总体%通过整合做出散点图如下图:120團表类型:缨100挖掘结构的数摇挖掘散点图:Tt利润图设置.806040吗耶SS20406080120|oTt 分数= 5.26 理想预滅以上的分析,我们得出一个结论,就是期末成绩在最终得分中所占的比例最大, 平时成绩和平时表现的权重差不多,在这个结论中,期末考试的成绩的重要性, 不言而喻,增加期末考试的成绩,最能提高最终成绩,平时成绩和表现的得分 也很重要,但相对权重没有期末成绩大。一个分数高的学生,他的所有成绩都 应该是很高的。4小结由于团队技术水平有限,在开发过程中遇到了很多技术问题,不过大多数 都是一些小的细节问题,花了很长时间。还有就是由于对软件的不熟练,然后经常会搞错多对一等的关系,或者是 一些属性的不对应,最后通过同学的帮忙,帮我查找到错误,并帮我们改正。经过几个星期的课程设计,过程曲折可谓一语难尽。生活就是这样,汗水 预示着结果也见证着收获。通过这次的设计培养了我综合应用所学知识,发现、 提出、分析和解决实际问题,锻炼了我的实践能力。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!