大数据挖掘期末大作业

上传人:无*** 文档编号:86549489 上传时间:2022-05-07 格式:DOC 页数:12 大小:890KB
收藏 版权申诉 举报 下载
大数据挖掘期末大作业_第1页
第1页 / 共12页
大数据挖掘期末大作业_第2页
第2页 / 共12页
大数据挖掘期末大作业_第3页
第3页 / 共12页
资源描述:

《大数据挖掘期末大作业》由会员分享,可在线阅读,更多相关《大数据挖掘期末大作业(12页珍藏版)》请在装配图网上搜索。

1、word数据挖掘期末大作业1. 数据挖掘的开展趋势是什么?大数据环境下如何进展数据挖掘。对于数据挖掘的开展趋势,可以从以下几个方面进展阐述:(1)数据挖掘语言的标准化描述:标准的数据挖掘语言将有助于数据挖掘的系统化开发。改良多个数据挖掘系统和功能间的互操作,促进其在企业和社会中的使用。(2)寻求数据挖掘过程中的可视化方法:可视化要求已经成为数据挖掘系统中必不可少的技术。可以在发现知识的过程中进展很好的人机交互。数据的可视化起到了推动人们主动进展知识发现的作用。(3)与特定数据存储类型的适应问题:根据不同的数据存储类型的特点,进展针对性的研究是目前流行以与将来一段时间必须面对的问题。(4)网络与

2、分布式环境下的KDD问题:随着Internet的不断开展,网络资源日渐丰富,这就需要分散的技术人员各自独立地处理别离数据库的工作方式应是可协作的。因此,考虑适应分布式与网络环境的工具、技术与系统将是数据挖掘中一个最为重要和繁荣的子领域。(5)应用的探索:随着数据挖掘的日益普遍,其应用围也日益扩大,如生物医学、电信业、零售业等领域。由于数据挖掘在处理特定应用问题时存在局限性,因此,目前的研究趋势是开发针对于特定应用的数据挖掘系统。(6)数据挖掘与数据库系统和Web数据库系统的集成:数据库系统和Web数据库已经成为信息处理系统的主流。2. 从一个3输入、2输出的系统中获取了10条历史数据,另外,最

3、后条数据是系统的输入,不知道其对应的输出。请使用SQL SERVER 2005的神经网络功能预测最后两条数据的输出。首先,打开SQL SERVER 2005数据库软件,然后在界面上右键单击树形图中的“数据库标签,在弹出的快捷菜单中选择“新建数据库命令,并命名数据库的名称为YxqDatabase,单击确定,如如如下图所示。 然后,在新建的数据库YxqDatabas中,根据题目要求新建表,相应的表属性见如如下图所示。在新建的表完成之后,默认的数据表名称为Table_1,并打开表,根据题目提供的数据在表中输入相应的数据如如如下图所示。在测试数据被输入到数据库中之后,打开SQL Server Busi

4、ness Intelligence Development Studio命令,并在文件中新建项目,项目名称命名为MyData,并单击确定,进入下一步,如如如下图所示。在进入的新页面上,新建一个数据源,并在出现的新窗口中单击下一步,并选择新建按钮,就会出现连接收理器窗口,如右图所示。在打开的界面中,在“提供程序下拉列表框中选择Microsoft OLE DB Provider for SQL Server选项,选择完成后,单击确定,进入下一界面,至此,完成了数据连接的工作。在建立完数据连接之后,需要建立数据源视图,右键单击数据源视图,并选中“新建数据源视图命令,在数据库YxqDatabase下的

5、数据表Table_1中,选中这个数据表,然后单击下一步,并更改数据源视图的名称为YxqView,单击完成,这样就建好了数据源视图。如如如下图所示。在上面的工作完成之后,我们在界面中单击“挖掘结构,并新建一个挖掘结构然后点击下一步,在弹出的新窗口“选择挖掘技术中,我们选择“Microsoft神经网络选项,并单击下一步,如如如下图所示。弹出的新窗口要求对Table_1中的各个列指定类型:键类型、输入类型、可预测类型。把数据表Table_1中的data列定为键类型,x1,x2,x3规定为输入类型,y1,y2规定为可预测类型,选择之后情形如如如下图所示。在上图中,单击下一步,再选择默认值,并单击下一步

6、,就完成了挖掘模型的创建。挖掘模型创建完成之后会出现如如下图所示的窗口。 在此界面中,我们选择“挖掘模型查看器选项卡,会弹出一个小窗口,提问“服务器容似乎已过时。是否先生成和部署项目?单击是按钮,系统将花费一点时间进展部署和生成,见如如下图所示。部署成功后,就会弹出另外一个小窗口,提问“必须先处理Table_1挖掘模型才能浏览其容。处理模型可能要花费一些时间,具体将取决于数据量。是否继续?单击“是按钮,并在新弹出的窗口中单击“运行按钮处理成功之后在两个窗口分别单击“关闭按钮,就会得到如如下图所示的数据分析图表。最后,选择“挖掘模型预测选项卡,进展数据预测,出现的界面如如如下图所示。在所示的界面

7、中,我们单击“选项事例表按钮,在选择导航中,选择事例表为Table_1,将出现如如下图所示的界面。在上图所示的结构中,单击工具栏上的“单独查询按钮,即产生如如下图所示的界面。在上图所示的界面中,把表中数据的最后一行分别输入到变量x1,x2,x3后面的空白中,然后把挖掘模型下的Y1,Y2项拖动至最下面一行的最左边位置。然后单击工具栏上的“切换到查询结果按钮,会出现如如下图所示的界面。至此,我们通过神经网络功能预测出了最后两条数据的输出。3. 用ID3算法生成分类决策树在之前创建好的数据源与数据源视图的前提下,我们开始创建决策树的挖掘结构,单击“挖掘结构,并从中选择“新建挖掘结构命令,系统将打开数

8、据挖掘导向。在“欢迎使用数据挖掘向导页上,单击下一步按钮,在“选择定义方法页上,确认已选中“你要使用何种数据挖技术?下拉列表中选择“Microsoft决策树选项,如如如下图所示。然后单击下一步,出现“指定定型数据页,如如如下图所示。在界面中,确保选中RID列右边“键列中的复选框,这即是决策树分析中所用的属性。在上图中,单击下一步,在随后“指定列的容和数据类型页上,单击下一步按钮,出现“完成向导页。接下来,我们开始设置决策树挖掘结构的相关参数,在“挖掘模型选项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数命令,系统将打开“算法参数对话框,如如如下图所示。在设置好决策树挖掘结构的相关参数之

9、后,接下来,开始建立决策树挖掘模型,选择“挖掘模型查看器选项卡,程序是否建立部署项目,选择“是,单击运行按钮,出现“处理进度窗口,我们再次选择“挖掘模型查看器选项卡,生成的决策树如如如下图所示。4.数据挖掘与数据仓库的关系是什么?谈谈对数据挖掘的理解。首先,数据挖掘是从大量数据中 获取有效的、新颖的、潜在有用的、最终可理解的模式的过程。简单的说,数据挖掘就是从大量的数据中提取或“挖掘知识。然而,数据仓库通常是指一个数据库环境,而不是指一件产品,它提供用户用于决策支持的当前和历史数据,这些数据在传统的数据库常不方便得到。简单来说,数据仓库就是一个面向主题的、集成的、相对稳定的、反响历史变化的数据

10、集合,通常用于辅助决策支持。其实,可以用这样一个简单例子形象化两者的关系,如果将数据仓库比作矿井,那么数据挖掘就是深入矿井采矿的工作。决策者利用数据作决策,即从数据仓库中挖掘出对决策有用的信息与知识,是建立数据仓库与进展数据挖掘的最大目的。只有数据仓库先建行立完成,且数据仓库所含数据时干净、完备和经过整合的,数据挖掘才能有效地进展,因此从一定意义上可将两者的关系解读为数据挖掘时从数据仓库中找出有用信息的一种过程与技术。5. 通过我班同学的身体特征,进展数据的分析,各特征有序号、身高cm、体重(kg)、胸围(cm)、腰围(cm)、臀围(cm),总共有50个学生的资料。首先,通过之前所创建的数据源

11、、数据源视图,在接下来我们开始创建k-means挖掘结构,在此,我们新建挖掘结构,如如如下图所示。然后单击下一步,接下来出现的“指定定型数据页,也即是指定聚类分析中所用的属性,如如如下图所示。至此,k-means挖掘结构创建完成,接下来我们开始设置k-means挖掘结构的相关参数,在“挖掘模型选项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数命令,系统将打开“算法参数对话框,如如如下图所示。接着,我们开始建立k-means挖掘模型,然后选择“挖掘模型查看器,程序问是否建立部署项目,选择“是。在接下来的“处理挖掘模型页上,单击运行按钮,出现“处理速度页,如如如下图所示。在上图中,处理进度完成之后,单击关闭按钮,建模完成。 然后再次选择“挖掘模型查看器选项卡,由此得到的k-means聚类结果如如如下图所示。在上图所示的界面中,我们再次单击“分类比照按钮,得到如如下图所示,至此通过图示所示,我们可以分析出班上50位同学的各种身体特征指标。12 / 12

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!