利用因特网获取信息.ppt

上传人:w****2 文档编号:16583242 上传时间:2020-10-15 格式:PPT 页数:13 大小:291.50KB
收藏 版权申诉 举报 下载
利用因特网获取信息.ppt_第1页
第1页 / 共13页
利用因特网获取信息.ppt_第2页
第2页 / 共13页
利用因特网获取信息.ppt_第3页
第3页 / 共13页
资源描述:

《利用因特网获取信息.ppt》由会员分享,可在线阅读,更多相关《利用因特网获取信息.ppt(13页珍藏版)》请在装配图网上搜索。

1、第一节 利用网络获取信息 达县第四中学 徐兵 网络信息检索工具 全文搜索引擎 目录搜索引擎 元搜索引擎 如何才能从网络获取我们需要的信 息呢? 使用信息检索工具。 在因特网发展初期,由于网站较少,网上信息资源也 非常有限,通过网络查找信息比较容易,所以不需要专门 的信息检索工具。 进入 20世纪 90年代,面对因特网上无穷无尽的数字 化、多媒体、跨时空、跨语种的信息资源,网络用户必须 借助 信息检索工具 才能找到需要的信息。 目前,所有因特网信息检索工具中,数量最多、应用 最广的是 搜索引擎 。 搜索引擎按其检索机制主要可以分为 全文搜索引擎 、 目录搜索引擎 和 元搜索引擎 。 搜索引擎 搜

2、索引擎 全文搜索引擎 是通过用户输入关键词来查找所需的信息资源。 国外代表性的全文搜索引擎有: Google、 AltaVista。 国内代表性的全文搜索引擎有: 百度 。 优点:全文检索;检索功能强;信息更新速度快。 不足:提供的信息虽然多而全,信息太多反而降低 相应的命中率,查询结果链接较多,层次结构不清晰, 给人杂乱的感觉。 搜索引擎 全文搜索引擎分为两种:一种拥有自己的检索程序,自建网页 数据库,搜索结果直接从自身的数据库中调用;另一种则租用其他 引擎的数据库,按自定的格式排列搜索结果。 目录搜索引擎 是指把搜集到的信息资源按照一定的主题进行分类,建立层次 目录。用户查找信息时,只要逐

3、层浏览打开目录,逐步细化,就可 以查到要找的信息。 目录搜索引擎代表有: Yahoo、搜狐、新浪、网易等。 搜索引擎 优点:层次结构清晰,易于查找;多级类目,便于 找到具体明确的主题;分类目录下有简明扼要的内容, 一目了然。 缺点:搜索范围较小;更新速度慢;查找交叉类目 时容易遗漏。 元搜索引擎 也称为集成型搜索引擎,它将用户的检索请求同时 送到多个引擎上进行搜索,并将结果返回用户。 元搜索引擎有: MetaCrawler、 Ask、 Dogpile等。 搜索引擎的工作过程和原理 搜索引擎包含技术有:网络技术、数据库技术、自动标引技术、 检索技术、自动分类技术等。 基本上都是由: 信息搜索系统

4、 、 索引数据库 和 查询接口 三部分 组成。 工作流程 1、由信息搜索系统在因特网中发现、搜索网页信息; 2、对信息进行提取和组织,建立索引数据库; 3、根据用户输入的条件查询,在索引数据库中快速检出文档, 进行文档与查询的相关度评价,对将要输出的结果进行排序,并将 查询结果返回给用户。 搜索引擎工作原理 全文搜索引擎 信息搜索功能分为两种:一种是 定期搜索 ;另一种 是 提交网站搜索 。 定期搜索利用搜索引擎派出的 ”蜘蛛 “或 ”机器人 “程 序对主页中的超文本链接遍历万维网,从一个 HTML文 档 ”爬行 “到另一个 HTML文档。不需任何人工处理,全 部由程序自动完成。 全文搜索引擎

5、主要采用关键词索引技术,索引程序 生成从关键词到超文本链接的索引表。 搜索引擎工作原理 当用户以关键词查找信息时,搜索引擎会在数据库 中进行搜寻,如果找到与用户要求内容相符的网站,便 采用特殊的算法 通常根据网页中关键词的匹配程度, 出现的位置 /频次,链接质量等 计算出各网页的相关 度及排名等级,然后根据关联度高低,按顺序将这些网 页链接返回给用户。 目录搜索引擎 目录搜索引擎不同于全文搜索引擎,其信息收集系 搜索引擎工作原理 统主要由人工完成, 标引专家依靠手工来搜寻不断出现 的新网站,给每个网站一个标题和大概的描述,将其放 入相应的类目体系中 。这些类目在页面上表现为每个类 目路径下排列

6、着相关的网站,也称目录导航。 目录搜索引擎提供两种查询方式 : 一种是在网页上按 分层目录逐级查找 ,直到找到所 需信息为止; 另一种就是 选择关键词搜索 。 搜索引擎工作原理 元搜索引擎 它一般没有自己的数据库和“蜘蛛”程序,而是一 个代理的角色,接受用户的查询请求。 只是提供了一个统一的界面,把多个具有独立功能 的搜索引擎组合起来。 使用元搜索引擎,用户只需提交一次查询请求,就 可以查询多个搜索引擎,大大提高了检索效率。 检索工具的使用技巧 1、正确选择因特网信息检索工具 2、选择合适的关键词 ( 1)正确使用布尔运算符 与( +、 AND)或( OR)非( NOT、 -) ( 2)用双引号进行精确检索 ( 3)避免输入错别字及使用太常见的关键词 ( 4)尝试使用近义词 3、合理利用”网页快照“、”网页预览“和”相关 搜索“ 4、研究检索工具提供的说明,提高查询效率 检索工具的发展趋势 1、出现搜索引擎技术和搜索数据库服务提供者 2、网络搜索软件与搜索引擎的智能化 3、搜索引擎的本地化和多语种检索

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!