Google是如何搜集互联网信息的

上传人:痛*** 文档编号:174175281 上传时间:2022-12-14 格式:DOCX 页数:7 大小:115.35KB
收藏 版权申诉 举报 下载
Google是如何搜集互联网信息的_第1页
第1页 / 共7页
Google是如何搜集互联网信息的_第2页
第2页 / 共7页
Google是如何搜集互联网信息的_第3页
第3页 / 共7页
资源描述:

《Google是如何搜集互联网信息的》由会员分享,可在线阅读,更多相关《Google是如何搜集互联网信息的(7页珍藏版)》请在装配图网上搜索。

1、如果你问别人什么是力量。培根会说“知识就是力量”,Google会说“信息就是力量”,某人会说“隐私就是力量”。毋庸置疑,Google早已认识 到信息(数据)的力量。相信其他公司,不管是互联网公司,还是其他类型公司,多多少少都应该意识到这一点了。否则,哪里会出现贩卖用户资料的案件?本文主要说Google如何搜集互联网信息、不计其数的趋势信息和Google用户(包括你我)的信息。那Google到底知道多少你的信息呢?还有你的在线习惯呢?请你坐下来,登录你的Google账号,看看你正在使用的Google服务列表,你就知道你正把多少信息交给了Google。图2:登录Google账号后的“我的产品”(注

2、:此图中产品因人而异,只要你在登录Google账号时使用过某服务,则自动会添加到此列表中。)这些服务已经引起了很多隐私问题。09年末时,Google CEO埃里克施密特曾说过:“如果你有些东西不想让别人知道,或许你本该就别做那事。”(这话听起来颇似有点“切莫伸手,伸手必被抓”的韵味。)那我们现在就来看看Google是怎么搜集从你那收集你的信息。Google信息收集渠道Google的使命是:“整合全球信息,让人人可用,人人受益”。它也正在很好地兑现这个诺言。然而,Google正在收集的信息似乎比我们意识到的还要多。1. 搜索(网页、图片、新闻和博客等)- 众所周知,Google是全球最受欢迎的搜

3、索引擎,其全球市场占有率几近70%(比如,美国本土占66%)。Google追踪所有的搜索,其现在的搜索方式也越加个性化,个性化势必将越来越细化。2. 搜索结果中的点击- Google不仅能知道我们要找什么,它也知道我们点击了哪些搜索结果。(编者注:这个做SEO的朋友应该很清楚,可以从Google Analytics中知道。)3. 网页检索- Google的网页爬虫Googlebot就是一只不知疲倦的小蜜蜂,一直不停地“品读”和收录数十亿的网页。4. 网站分析- Google Analytics是目前最受欢迎的网站分析工具。因其免费并支持多种高级特性,全球大量网站正使用它。5. 广告服务- Ad

4、words和Adsense是Google财务成功的基石,但它们也给Google提供了大量的有价值的数据。网民点击了那些广告,广告主在竞争哪些关键字,哪些关键字最值钱等等。这些信息都是非常有用的。6. 电子邮件- Gmail是全球三大电子邮件服务之一,面临着来自微软的Hotmail还有雅虎的Email的竞争。邮件内容,包括发送内容和接收内容,都是可以解析和分析的。即使是从安全角度来看,这也是Google的一项优秀服务。Google的邮件安全服务Postini,要从海量Gmail用户中,接收超大量的数据,包括垃圾信息、恶意软件和邮件安全趋势数据。(编者注:2007年,Google以六亿二千五百万美

5、元的价格收购网络安全服务商Postini,以此为Google的小型商务客户提供更好的电子邮件安全服务。)7. Twitter- “你所有的Twitter消息都是我们的”,这句话用来解释早期的网络快速传播现象(又称“网络爆红现象”)。在09年和Twitter达成交易后,Google可以直接访问Twitter上所有的消息。8. Google应用服务(文档、电子表单和日历等) - Google的办公套件有很多用户,它当然也是Google的一个数据收集来源。9. Google公开的个人资料- Google鼓励你把你的个人资料在网络上公开,这些资料包括你活跃在哪些社交网站(Facebook或Linked

6、in),你的个人主页和在线图片等等。10. Orkut- 虽然Google的社交网络还并不是很成功,但Orkut在巴西和印度还是很成功。11. Google Public DNS- Google2009年年末推出的DNS服务并不只是帮助网民获得更快的DNA解析,也同时帮助Google自己。因为从这项服务中,Google可以获得大量的统计数据,比如网民访问了哪些网站。12. Chrome浏览器- Chrome可以收集你的浏览器行为,还有访问哪些网站。13. Google财经- 除了财经数据之外,用户在Google财经上搜索的信息和使用的信息都是Google的重要数据。14. YouTube- 这

7、个目前是全球最大最受欢迎的视频网站,为Google所有。它也向Google提供了大量的用户观看习惯方面的数据。15. Google翻译- 帮助Google完善其自然语言解析和翻译。16. Google Books- 虽然现在不是很庞大,但有潜力帮助Google知道网民阅读习惯和他们想阅读什么东西。17. Google阅读器- 目前为止是全球最受欢迎的Feed阅读器。你订阅了哪些RSS种子?你在看哪些博文?Google会知道的。18. Feedburner- 很多博客都使用Feedburner来公开其RSS种子。Google追踪Feedburner的每一条链接。19. Google地图和 Goo

8、gle Earth- 你对哪些地方感兴趣?(Google也会知道的)20. 你的联系人网络- 你在Gtalk和Gmail等上的联系,组成了一张错综复杂的用户网。如果他们都使用Google,网络映射更为深刻。虽然我们不知道Google是否做了这个,但这上面的数据是可以收集的。即将推出的- Chrome OS等Google更多可能成功的产品。刚推出不久的- 即时搜索和Goo.gl等服务已经消亡的- Google Wave等(虽然消亡了,应该死前收集了一些数据吧。)因为Google的产品数不胜数,上面的列表还会扩大。到现在为止,你应该已经知道要点了。图3:Google服务列表(Google收集的)这

9、些数据中,很多都是匿名化的,所以并非总是正确。日志可以保存9个月,服务相关的cookies可以保留18个月。即便如此,对大多数公司而言,Google手中所拥有的通用用户数据仍是有很大竞争优势,是一座名副其实的金山。Google - 一台无法停止的数据收集机器Google数据收集的方式有很多种。登录站点时生成的IP地址请求,用来设定和追踪目标的cookie。如果你登录了Google账户,你在Google下属网站上的一举一动,通常都可以和你个人账户联系起来,而不用和你的计算机对应起来。简而言之,如果你使用Google的服务,Google将知道你在搜索什么,你访问了什么网站,你看了哪些新闻和博客,等

10、等。随着Google增加更多的服务,其曝光率将更加广泛,几乎一切东西都将所谓的“Google化”。编者注:Googlization即“Google化”,2003年由ohn Batelle和Alex Salkever共同创造这个字。你使用任何单一的Google服务所贡献的数据,你无需对此过多恼火。当你使用多个Google服务是,真正有趣的窘境才出现了。这个年头,谁不是呢?可以试着一个星期上网不用Google的任何一个服务。这也就是说,没有YouTube、没有Gmail、没有Google文档、不点击 Feedburner的链接、不用Google搜索引擎等等。严格来说,你甚至必须避开和Google有

11、合作的服务,所以,非常抱歉,Twitter也不能用。这个不断增长中的Google化可能就是为什么有些人不想用Google Chrome OS的缘故。因为Chrome OS可以强有力地整合Google的多种服务,并且很可能向Google提供关于你习惯的空前绝后数量级数据。Google为什么这么做呢?就像在本文一开始所提到,信息就是力量!拥有这些信息,Google可以用非常有效的方式来整合数据。除了每个用户或访客,Google也能为整个城市或国家检测趋势和行为。Google收集的信息用途广泛。在Google所有活跃的领域,那些收集的数据可以用来制定市场决策、研究、完善产品等。比如,如果你能提前发现

12、特定的市场趋势,你就可以对市场做出有效反应。如果你能发现人们所寻和所需,你就可以基于这些发现做出决策。当然了,这对像Google这样的大公司是极为有用的。而且我们也别忘了,Google的大部分收入来自广告。Google越了解你,其广告能更加有效地服务你,这也对Google的底线有着直接影响。不只是(谷)哥这么做必须要说的是,并非只有Google一家公司在做这样的数据收集。请放心,微软也在用Bing和Hotmail做相似的事,这只是一个例子。Google的问题(如果你想称之为“问题”)是,它像一只大章鱼,其触须正伸向各个角落。Google已变成如此混杂,囊括我们在线生活的方方面面,我们(网上的操

13、作)动作、行为和关系等数量空前的信息都汇聚到Google手中。图4:Google是章鱼?造访Google数据库值得称道的是,Google正通过各种服务来利用其收集的数据,进一步为你提供服务。Google趋势Google网站趋势Google搜索解析Google广告计划其他诸如Wonder Wheel这样的搜索工具如果Google能公布如此之多的数据,可以想象一下数据量有多大,还有Google所知道的细节程度有多深。而且这些服务也能向Google提供更多的数据,比如我们对哪些趋势感兴趣,我们在找哪些网站等。在使用Google趋势等这些工具的时候,发现一个有趣的现象:我们几乎可以知道一切,但就是无法

14、知道Google自身的产品。比如,“Goolge广告计划”和“Google网站趋势”并不显示Google自身站点的信息,但你可以找到其他站点的信息。这个比较有讽刺意味!昨天“Goolge广告计划”更新2010年9月份的“全球Top1000网站”数据,你可以看到Facebook等网站的每月独立访客数量和PV数量,但你看不到Google旗下网站的数据。没有免费的午餐不知你有没有想过,为什么几乎Google所有服务都是免费的?好了,你现在知道答案了吧。还是那就老话:天下没有免费的午餐。你或许是没有给 Google掏钱(点击Google广告除外),但你已经付出信息了。虽然这并不一定是坏事,但你应该对此有所了解并加以注意。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!