大数据分析趋势浅析课件

上传人:文**** 文档编号:180783446 上传时间:2023-01-07 格式:PPTX 页数:22 大小:1.68MB
收藏 版权申诉 举报 下载
大数据分析趋势浅析课件_第1页
第1页 / 共22页
大数据分析趋势浅析课件_第2页
第2页 / 共22页
大数据分析趋势浅析课件_第3页
第3页 / 共22页
资源描述:

《大数据分析趋势浅析课件》由会员分享,可在线阅读,更多相关《大数据分析趋势浅析课件(22页珍藏版)》请在装配图网上搜索。

1、大数据分析趋势浅析01大数据简介02大数据分析03大数据分析发展趋势目目录录01大数据简介02大数据分析03大数据分析发展趋势目目录录1 大数据简介p2012年初的一天,一位父亲进入他家附近的某超市向超市负责人兴师问罪。原因是超市把婴儿用品的优惠券寄给他17岁的女儿。一个月后,这位父亲又向超市经理致歉他的女儿确实怀孕了。原来,这家超市建立了一个客户购买体系,其中用25种典型商品的消费数据构建了“怀孕预测指数”,这样即可准确地辨别出孕妇群体,以便更好地为她们提供服务商品。这个故事被刊登在纽约时报,轰动了全美,被称为“大数据的第一课”。1 大数据简介p2012年的总统大选时,花销不到3亿美元的奥巴

2、马却击败了开支近4亿美元的罗姆尼,成为美国新一届总统。奥巴马的竞选发言人说,对于竞选团队来说,并不能只是面对一个笼统的选民概念,而主要针对每一个选民,深入挖掘他们被说服的因素是什么,这种具有针对性的方式,使得奥巴马的募捐方案和游说计划得到了意外的支持。那么,到底是什么支持了奥巴马的募捐方案和游说计划昵,是大数据。1 大数据简介p回顾自2009年淘宝在11月11日发起的“品牌商品五折优惠”活动以来的5年问,当天成交额由2009年的1亿元经过2010年的9.36亿元、2011年的52亿元、2012年的191亿元,一直狂飘到2013年的350.19亿元,正式超越美国“网络星期一”创造的单日120亿元

3、(人民币)的记录,成为全球最大的购物狂欢节。这一系列的惊人创举的背后也是大数据,是大数据造就了天猫的辉煌。1.1 大数据定义及特征p大数据(big data)或称巨量资料,这些资料的规模巨大到无法使用目前的主流软件工具,在合理的时问内通过采集、管理、处理并整理而成为帮助企业经营决策的信息。p维基百科将大数据定义为“无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的大量而复杂的数据集合”。Volume大量Velocity高速Variety多样三V特征1.2 大数据处理的主要环节1.3 大数据发展趋势1.3 大数据十大发展趋势p结合智能计算的大数据分析成为热点p数据科学带动多学科融合,但

4、是数据科学作为新型的学科,其学科基础问题体系尚不明朗,数据科学自身的发展尚未成体系p与行业数据结合,实现跨领域应用p与“物云移社”融合,产生综合价值p大数据多样化处理模式与软硬件基础设施逐步夯实p大数据安全和隐私p新的计算模式将取得突破p各种可视化技术和工具提升大数据分析p大数据技术课程体系建设和人才培养是需要高度关注的问题p开源系统将成为大数据领域的主流技术和系统选择01大数据简介02大数据分析03大数据分析发展趋势目目录录2 大数据分析简介及趋势概况p大数据分析的核心是从数据中获取价值,价值体现在从大数据中获取更准确、更深层次的知识,而非对数据的简单统计分析。神经计算01深度学习02人工智

5、能04语义计算03大数据分析01大数据简介02大数据分析03大数据分析发展趋势目目录录3.1 云中的大数据分析p如今已有很多技术可用于处理云中的数据。实例包括亚马逊Redshift所托管的BI数据仓库、谷歌BigQuery数据分析服务、IBM Bluemix云平台,以及亚马逊Kinesis数据处理服务等。“大数据的未来状态将是企业端和云端的某种混合态。”3.2 Hadoop:新的企业数据操作系统p各种分布式分析框架,如MapReduce正在演变为分布式资源管理器,它们会逐渐地将Hadoop转变为一种通用的数据操作系统。有了Hadoop这样的分布式文件存储系统,你就能执行很多不同的数据操控和分析

6、任务。3.3 大数据湖p数据湖也称之企业数据湖或企业数据集中库,会将各种数据资源倾倒进一个大的Hadoop仓库中去,而不会事先设计什么数据模型。提供各种工具,再配上对数据湖中现存数据的顶层定义,供人们去分析数据。人们就可随着对数据湖的逐步深入而构建起自己的数据视图。这正是构建一个大规模数据库增量化的、有机的模型。3.4 更有预测性的分析p有了大数据,分析师们不仅有了更多的数据可用,而且具备了处理大量多属性记录的能力。可以处理海量的记录,以及对每条记录的海量属性进行处理,从而提高了预测能力。大数据与计算能力相互结合,还能让分析师们去研究新的行为数据。例如消费者所访问的网站或位置信息等“稀疏数据”

7、。3.5 SQL on Hadoop:更快、更好pApache Hive就可为Hadoop提供一种结构化的、类SQL的查询语言。来自Cloudera,Pivotal软件、IBM和其他一些厂商的产品,不但可提供更好的性能,而且还能让查询进行的更快速。这些工具让Hadoop能更好地适用于“迭代分析”,也就是在询问了一个问题并得到答案后,可以在此基础上查询新的问题。这样的工作传统上是需要构建数据仓库才能进行的。3.6 更多、更好的NoSQLp可取代传统基于SQL关系数据库的技术叫做NoSQL数据库,它正迅速普及,并用于一些特定的分析应用中。相比于传统的关系数据库,它可提供一种更快速、更直接的方式来分

8、析客户或销售人员的关系网络。一个NoSQL键值组合数据库则可专门用于处理这样的情形,而且性能高,还是轻量级的。3.7 深度学习p深度学习是近年来受到广泛关注的一个机器学习子领域,在MTT技术评论中当选为Zam十大突破性技术之首。它以学习表示方式的多个层次为基础,这些层次对应于特征、因素或者是概念的分层结构。高层次的概念由低层次的概念定义;低层次的概念可以用来形成很不同的多高层次概念。它是基于表示学习的机器学习方法,因为表示一个对象有很多种方式,而对于特定的任务,某些表示方式会使得学习任务更加容易完成。3.8 内存分析p使用内存数据库来提速分析处理流程已越来越流行,而且收益颇大。事实上,很多企业已经在采用混合事务/分析处理(HTAP),该技术允许事务和分析处理驻留在同一个内存数据库中。p尽管采用HTAP可加快分析速度,但所有的分析必须驻留在同一个数据库内。今天大多数的分析研发都是为了解决这个问题,力图将来自很多不同系统的事务分析汇总到一个数据库中。谢谢指导!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!