《 大学计算机基础 》实验报告

上传人:仙*** 文档编号:28711170 上传时间:2021-09-08 格式:DOC 页数:15 大小:708.47KB
收藏 版权申诉 举报 下载
《 大学计算机基础 》实验报告_第1页
第1页 / 共15页
《 大学计算机基础 》实验报告_第2页
第2页 / 共15页
《 大学计算机基础 》实验报告_第3页
第3页 / 共15页
资源描述:

《《 大学计算机基础 》实验报告》由会员分享,可在线阅读,更多相关《《 大学计算机基础 》实验报告(15页珍藏版)》请在装配图网上搜索。

1、题目 期末综合实验报告网络资源和搜索引擎 目录摘要:3Abstract3(一)什么是网络资源4(二)网络资源的特点4第二章 搜索引擎5(一)什么是搜索引擎5(二)搜索引擎的分类51.全文索引52.目录索引53.元搜索引擎54.垂直搜索引擎65其他搜索引擎6(三)工作原理71.抓取网页72.处理网页73.提供检索服务7第三章 常用搜索引擎91.百度 9百度产品92.Google.hk11第四章 .网络资源和搜索引擎数据统计分析12Chapter112Chapter2 全球视野13Chapter3 搜索引擎请求量14结束语17摘要:在网络信息资源检索的研究中 ,搜索引擎的研究具有非常重要的意义。本

2、文在基于对现有搜索引擎的分析的基础上 ,阐述了搜索引擎的智能化发展 ,以及将会从根本上改变现有信息资源检索方式和信息服务模式。关键词:搜索引擎; 网络信息资源; 信息检索; AbstractIn the research the Internet information resources retrieval, the study of search engine enjoys a great significance. It is based on the analysis of the current search engine that this article expounds its

3、 intelligent development. The existing information resources retrieval method and information service pattern will be essentially altered.Keywords : Search engine Internet information resources Information retrieval一、网络资源(一)什么是网络资源网络资源是指通过现代计算机和通讯技术相结合构筑起来的以超链接方式将文字、图像、语言和视频信息链接为超文本和超媒体系统.它具有信息来源广、量

4、大、传播速度快、内容宠杂不一形式多样及时等特点(二)网络资源的特点 在网络环境下,信息资源在数量、结构、分布和传播范围、类型、控制机制和传递手段方面都与传统的信息资源有了显著差异,呈现出新的特点。 1、以网络为传播媒体 在网络时代,信息的存在需要借助一种不同于以往载体的信息载体网络,为用户提供的信息是来自Internet的各种网络服务器上的虚拟信息,而不是实实在在的实体形式的信息。信息的存储和查询更加方便,而且存储信息密度高、容量大、可以无损耗地被重复利用。 2、以多媒体为内容特征 Internet上的信息资源的存储和处理采用文本、超文本、多媒体和超媒体形式。 文本形式的信息资源的知识单元是按

5、线性顺序排列的,超文本形式的信息资源是按知识单元及其关系建立的知识结构网络。它通过网上各节点的链路把相关信息(文字信息、图片、地图和其他直观信息)有机地编织在一个网状结构内,检索用户能够从任何一个节点开始,从不同角度检索到感兴趣的信息。超文本信息资源是人机交互式的,可随时调用、检索和存储信息。 多媒体信息资源是包括文本、图像和声音在内的各种信息表达或传播形式的总称。它提供的信息集图、文、声于一体,可以为用户提供文本、图像、声音信息以及它们的组合。 3、以现代信息技术为纪录手段 网络信息以数字形式存在,可以借助网络进行远距离传播,从而使全球信息资源的共享成为可能。 4、数据结构具通用性、开放性和

6、标准化 数据结构的通用性、开放性和标准化使得信息资源易于扩充,各个系统之间易实现互连和互操作。 5、具高度的整合性,便于多种媒体一体化 易于实现各种网络资源的相互转化和二次开发,在新的平台上形成新的综合性信息产品,便于检索,增加了信息资源的利用价值。 6、交互性能增强 传播方式的多样性、交互性,从多方面贴近人们的生活,它具有潜在活力,也最具表现力。 第二章 搜索引擎(一)什么是搜索引擎搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的网站网页及其他信息,并对收集到的信息进行相关组织和处理,建立相应的数据库和索引文档,为用户提供搜索服务的系统。(二)搜索

7、引擎的分类1.全文索引全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。 根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。2.目录索引 虽然有搜索功能,但严格

8、意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类0目录搜索。3.元搜索引擎元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。4.垂直搜索

9、引擎 垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。5其他搜索引擎(1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。 (2)门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分类目录也

10、没有网页数据库,其搜索结果完全来自其他搜索引擎。 (3)免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。(三)工作原理1.抓取网页每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。 2.处理网页搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复

11、网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。 3.提供检索服务用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。第三章 常用搜索引擎1.百度 百度现在当之无愧是中国网民最钟爱的搜索引擎,几乎整个中国网络的搜索都是在百度上,下面简单介绍一下。百度的起名,来自于“众里寻她千百度”的灵感,1999年底,百度由李彦宏和徐勇创立于美国硅谷,2000年百度公司回国发展。Baidu(百度)是目前全球最优秀的中文搜索引擎。中国所有提供搜索引擎的门户网站中,超过80%以上都由百度提

12、供搜索引擎技术支持,现有客户包括新浪、 Chinaren、腾讯、263、21cn等。百度提供免费中文检索代码,任何人都可将百度搜索引擎挂接到自己的网站。百度是世界上第一个支持搜索动态网页的搜索引擎。百度产品百度产品很多,主要提供新闻、网页、贴吧、知道、百科、MP3、图片、视频、下吧、网站、网站、词典、国学、黄页和风云榜等搜索服务。2.Google.hkGoogle公司(英语:Google Inc.,NASDAQ:GOOG、FWB:GGQ1),是一家美国的跨国科技企业,致力于互联网搜索、云计算、广告技术等领域。Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有

13、股份公司),于1998年9月7日以私有股份公司的形式创立,以设计并管理一个互联网搜索引擎。Google公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 创始人 Larry Page 和 Sergey Brin 在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Dont be evil)是谷歌公司的一项非正式的公司口号,最早是由Gmail服务创始人在一次会议中提出。第四章 .网络资源和搜索引擎数据统计分析Chapter1 市场份额 2011年10

14、月28日根据易观智库EnfoDesk产业数据库发布的2011年第3季度中国搜索引擎市场季度监测数据显示,2011年第3季度中国搜索引擎运营商市场份额中,百度占到78.2%,谷歌中国占到17.2%。Chapter2 全球视野 近期我们从中国搜索类网站统计排名中了解到,百度以绝对的优势排名第一,其用户覆盖数达到了104200。而在全球的搜索引擎市场中,百度是否还能榜上有名呢?下面,和您一起关注5月份全球各搜索引擎的市场走向情况。图1:全球各搜索引擎市场份额(2011年5月)由图1我们看到,Google全球占了82.8%的市场份额,继续领跑全球搜索引擎市场,雅虎全球则以6.42%的市场份额位居第二。

15、而百度再次击败Bing位居第三。另外我们看到,google、雅虎、百度、必应四大搜索引擎在五月份占了98.02%的市场,可见这四大搜索引擎已然成为全球搜索引擎市场的主流产品。下面我们通过图2来了解全球各搜索引擎的市场走向情况。图2:全球各搜索引擎所占市场份额(2011年1月至2011年5月)Chapter3 搜索引擎请求量 2009年全球搜索请求量规模为9886.1亿次,年同比增长30.0%,艾瑞观察全球搜索请求量历年增长态势发现,其近三年基本维持在30%上下的增幅,全球搜索引擎流量既2004年前后50%左右的增速之后,逐步进入稳定增长阶段。自2007年中国成为全球搜索请求量最高的国家以来,其

16、在全球市场的领先优势持续强化:2007年至2009年,中国搜索逐渐拉大与美国等其他国家的差距。数据来源:参考文献及网站:【1】百度文库【2】【3】中国知网:【4】google学术【5】论文搜索引擎与网络信息资源检索研究 作者:王进孝【6】浙大图书馆结束语因为自己的计算机基础不好,所以做很多东西常常要花比别人更多的时间,但一学期下来,感觉自己还是学到了很多东西。在此,感谢老师的辛勤工作和耐心的讲解,让我对计算机科学这门课程有了初步的了解,虽然自己知道自己懂的只是皮毛而已,但这对我今后对计算机的学习将会有着很好的指导作用。这次的实验报告还是花了自己相当的时间和精力,虽然可能做的并不是很好,但也算是尽了自己最大的努力了。Fighting!羂腿

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!