大数据的前世、今生和未来

上传人:hh****2 文档编号:204330906 上传时间:2023-04-26 格式:DOCX 页数:5 大小:9.53KB
收藏 版权申诉 举报 下载
大数据的前世、今生和未来_第1页
第1页 / 共5页
大数据的前世、今生和未来_第2页
第2页 / 共5页
大数据的前世、今生和未来_第3页
第3页 / 共5页
资源描述:

《大数据的前世、今生和未来》由会员分享,可在线阅读,更多相关《大数据的前世、今生和未来(5页珍藏版)》请在装配图网上搜索。

1、大数据的前世、今生和将来 摘要: 分析了大数据产生的缘由,阐述了大数据的作用、价值以及所面临的问题。认为大数据开启了一次重大的时代转型,其科学价值和社会价值主要体现在两个方面:一方面,大数据不仅可以发觉事物的显式规律,而且可以挖掘事物的隐式规律和潜在价值;另一方面,大数据可以转化为经济价值的源泉,撼动世界的各个方面。 关键词: 大数据;关联分析;数据科学 Abstract: This paper analyzes the reasons that big data is generated. It then describes big data in terms of effects, val

2、ue, and issues. Now, big data is opening a new era of development and presents good opportunities. The science and social values of big data focus on two aspects. On the one hand, big data can discover explicit laws and also dig up implicit laws and potential value. On the other hand, big data can b

3、e changed into the fountain of economic value and shake all aspects of the world. Key words: big data; correlation analysis; data science 1 大数据的前世 大数据没有“前世”,只有“今生”和“将来”。 2 大数据的今生 Google每个月要处理900亿次的Web搜寻,数据量高达600 PB;百度拥有数千亿的网页,同时数据总量接近1 000 PB;Facebook是全球最大的在线社交网络,用户人数达12.3亿,日活跃人数达7.57亿,日均消息量达10亿条;Tw

4、itter用户数突破5亿,日活跃人数2.4亿,日均消息量2.3亿条;腾讯QQ目前拥有8亿互联网用户、4亿移动用户,数据量经压缩处理后约100 PB,并且这一数据还在以日新增200 TB到300 TB、月增加10%的数据量不断增长。 2013年中国产生的数据总量超过0.8 ZB,是2012年中国产生的数据总量的2倍,相当于2009年全球的数据总量。预料到2020年,中国产生的数据总量将是2013年的10倍,超过8.5 ZB1。 2.1大数据的起因 (1)数字化。由于计算机的出现,使得人类可以用数字化的“眼睛”来观测和处理整个世界,数字化意味着可以从大千世界的一切事物中吸取信息。数字化是大数据的手

5、段。 (2)移动化。随着智能手机、移动终端、便携设备的快速普及,推动了移动互联网的迅猛发展,使得人们可以快速、实时、便捷地产生、共享和获得数据。移动化是大数据产生的缘由之一,主要是人在产生数据。 (3)物联化。随着物联网的快速发展,世上万物皆有生命,既能被感知(传感网),又能感知“它”(物联网),还能共共享(网络化);随着物联网技术的进一步发展,感知的广度和深度都将会逐步地加大,不行避开地会产生数据的“海洋”。物联网是大数据产生的缘由之二,主要是物在产生数据。 (4)社会化。新奇、求知和沟通是人类永恒的渴求,社会网络的出现满意了人们实时沟通、共享信息、抒发情感、寻求挚友的愿望,因而得到了迅猛的

6、发展,社会网络每时、每刻、每地产生数据。社会化是大数据产生的缘由之三,主要是人和人、人和物的沟通在产生数据。 (5)网络化。随着网络用户的增加、带宽的增大以及新应用的不断出现,信息的产生和传播更快、更广、更深。网络化是大数据产生的缘由之四,主要是传播在产生数据。 当然产生大数据的缘由还有许多,如精度的提升可能使数据量指数不断增长,原来一张照片的数据量不到1 MB,现在可能超过10 MB;再如视频监控的普及、多媒体应用的增多,都产生了大数据。 总之,大数据是一种“现象”,是众多新技术和新应用产生的结果。 2.2 大数据的特点 大数据不仅是指其数据量大,而且还有许多特点,目前公认的至少有4个特点:

7、体量大、形式多、时效强、价值大 2。 ?体量大主要指范围广、规模大、容量大,通常可以达到PB级,甚至达到EB、ZB级,其中以非结构化数据居多,占总数据量的80%90%,其增长的速度比结构化数据还要快1050倍。 ?形式多主要指数据类型,具有异构性和多样性,许多不同形式(文本、音频、图像、视频)的数据共存,数据没有特征模式或者特征模式不明显,缺乏语法和语义,具有很强的混杂性和模糊性。 ?时效强主要指时效性强,要求实时分析,希望立竿见影而非事后见效,因此须要强大的计算处理实力和刚好的数据服务。 ?价值大主要指学问的聚合、产生的价值大,大数据具有大量的不相关信息,价值密度相对较低,须要困难的统计、关联、挖掘和深度分析,来对显式规律、隐式规律、未知规律、发展趋势等进行分析和预料。 2.3大数据的作用 对于大数据,你信与不信,它已存在;你喜不喜爱,它迅猛而来。 对于大数据,你用它就会有用,就会产生价值;你不用它就是垃圾,而且不只是垃圾。 (1)大数据的负面影响 任何事物都有两面性,大数据亦如此! ?信息垃圾。大数据的规模大、冗余多、类型困难,假如不能加以利用,它就是信息垃圾。另外还须要大量的存储资源、计算资源和人力资源来维护和处理,须要消耗大量的能源,不利于可持续发展。因此我们须要提倡健康的信息观念,不要随意产生和传播信息垃圾。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!