云计算大数据挖掘体系构建分析

上传人:卢** 文档编号:112989055 上传时间:2022-06-24 格式:DOC 页数:3 大小:16KB
收藏 版权申诉 举报 下载
云计算大数据挖掘体系构建分析_第1页
第1页 / 共3页
云计算大数据挖掘体系构建分析_第2页
第2页 / 共3页
云计算大数据挖掘体系构建分析_第3页
第3页 / 共3页
资源描述:

《云计算大数据挖掘体系构建分析》由会员分享,可在线阅读,更多相关《云计算大数据挖掘体系构建分析(3页珍藏版)》请在装配图网上搜索。

1、云计算大数据挖掘体系构建分析摘要:随着挪动互联网、挪动智能终端技术的快速开展,各种业务数据有了井喷式的增加,尤其是物联网的快速开展,产生了海量的实时监测数据。随着数据量的增大和数据类型的丰富,产生了大数据挖掘和云计算技术,本文从大数据挖掘步骤为切入点,分析了大数据挖掘存在的问题以及利用云计算技术解决问题的过程。关键词:云计算;大数据挖掘1引言随着互联网技术的飞速开展以及各行业信息化的深化,业务数据从数量上还有类型上都发生了井喷式增长,特别是近几年物联网技术的普及,大量时序数据的产生标识着人类已经迈进了大数据时代。大数据不仅是数据量大,数据类型也极大的丰富。有传统的构造化数据,也有文本、图片、视

2、频等非构造化数据。大数据带来的潜在价值随着大数据挖掘技术的开展渐渐凸显出来。同时,基于云计算自身具备的计算存储资源松耦合集成和弹性资源分配等特点,可以在很大程度上支撑构建大数据挖掘体系所需的算力和存储资源需求,降低运行本钱,平安可靠。2大数据挖掘技术介绍随着信息系统数字化和智能化的不断推进,数据规模也将呈指数级趋势增长。大数据挖掘将成为推动整个产业数字化晋级的重要抓手和举措。大数据顾名思义是指数量极大的数据会聚而成,大数据包括业务系统产生的业务数据,电商交易数据,物联网技术产生的时序数据,工业制造数据等等。这些数据中包含了极大的潜在价值有待开发,大数据挖掘技术指的是从海量数据中利用适宜的模型挖

3、掘出有用的信息反响给原来的系统,带来更多的业务价值。大数据挖掘分成六个步骤:1定义问题:在进展数据挖掘之前,首先需要定义本次挖掘需要解决的问题是什么,也就是说要给本次数据挖掘定义明确的目的。根据大数据定义的问题选择适宜的模型,模型是否适宜关系着本次挖掘是否成功。2建立大数据挖掘库:大数据挖掘的根本就是用存在的历史数据训练选择的模型,调整模型中可以改变的参数到达本次挖掘最好的效果,所以建立大数据挖掘库至关重要。建立大数据挖掘库首先要搜集数据并对数据进展描绘,通过ETL技术对数据进展清洗、转化和加载。保证数据库中的数据是有效数据。3分析数据:对准备好的数据进展分析,由于大数据的数据量非常宏大,用人

4、工分析几乎不可能。一般借助R语言或者Scala语言对数据进展分析,发现数据中对挖掘预测有影响的字段,为接下来的工作做好准备。4准备数据:通过数据分析后,可以锁定对挖掘预测结果有明显影响的字段,选择这些数据并进展记录,假设有进一步的需要,可以对这些数据进展函数转化后创造新的变量,并对这些新的变量进展记录,为后续的数据挖掘工作夯实数据根底。5建立并训练模型:根据过程开始定义的问题建立挖掘模型,建立挖掘模型是一个迭代的过程,首先考察不同的模型以判断是否对定义的问题有用。先用一部分准备的数据对模型进展训练,调整模型中的变量,然后在选择另一部分数据对模型进展测试,如有需要,可以再选取一个数据集,对建立的

5、模型进展验证。6评价模型并进展施行:训练好的模型要在实际的应用中进展推广,这对模型是一次考验。训练模型中会存在某些假设的条件,假设这些条件与实现的应用中条件一致,模型的评价度将会更高。评价模型首先要在小规模范围内进展施行然后分析预测的结果是否与实际情况相符。假设模型的评价度较高,那么可以在大范围内进展推广。模型的施行一般有两种使用方法,一种是给数据分析人员或者是业务系统作为工具,根据实际的数据对业务趋势进展预测;二是把评价过的模型应用到不同的数据集合上。随着近几年互联网的高速开展,业务数据量的急速增长,业务场景也变得越来越复杂,大数据挖掘过程中数据的存储,数据的计算对计算机的要求变得越来越高,

6、大数据挖掘需要的根底资源的本钱也随之迅速上升。3云计算助力大数据挖掘云计算可以为大数据挖掘提供低本钱的算力和存储环境。云计算主要是通过虚拟化技术将CPU计算资源、硬件存储和网络资源虚拟成多个环境,根据计算和存储资源的需求情况进展动态弹性管理,从而最大限度提升物理资源的复用价值,有效降低大数据挖掘的运行本钱。云计算可以为大数据挖掘构建一个高可用的算力及存储运行环境。为此利用云计算技术可以完成大数据挖掘所需要的规模级数据存储和计算功能。同时,云计算提供了一个高度平安可靠的运行环境,通常可以实现99.9%的高可用计算性能,可以为大数据挖掘提供实时计算和平安保障,最大限度防止因电路故障或其它故障导致大

7、数据挖掘效劳停顿运行等问题。云计算可以为大数据挖掘构建一个高扩展的算力及存储运行环境。基于云计算自身的高度开放集成和扩展性等特点,可以随着大数据挖掘规模的变化来动态增减算力和存储资源,从而使得整个应用集成系统构建具有较高灵敏性,从而有效降低算力资源和存储资源的浪费,极大提升大数据挖掘系统的经济和环境效益。4完毕语云计算技术的落地为大数据的存储和计算提供了弹性的资源管理环境,按需分配大数据挖掘需要的资源,降低了大数据挖掘的本钱。随着云计算和大数据技术的不断进步,云计算和大数据技术的交融越来越严密,云计算为大数据挖掘的快速开展提供良好的资源支持。参考文献【1】邓仲华,刘伟伟,陆颖隽.基于云计算的大数据挖掘内涵及解决方案研究.情报理论与理论,2022,3807:103-108.【2】饶正婵,蒲天银.云计算条件下的大数据挖掘内涵及解决方案.电子技术与软件工程,202213:154-155.【3】孙培锋.基于云计算的大数据挖掘体系架构研究.信息技术与信息化,202209:167-169.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!