信息资源检索

上传人:shug****ng1 文档编号:207502959 上传时间:2023-05-06 格式:DOCX 页数:4 大小:14.50KB
收藏 版权申诉 举报 下载
信息资源检索_第1页
第1页 / 共4页
信息资源检索_第2页
第2页 / 共4页
信息资源检索_第3页
第3页 / 共4页
资源描述:

《信息资源检索》由会员分享,可在线阅读,更多相关《信息资源检索(4页珍藏版)》请在装配图网上搜索。

1、信息资源检索1、因特网的信息资源与服务存在许多误解:(1)认为因特网无所不包、无所不能。所有信 息均可在网上找到;(2)认为因特网上找到的、下载下来的信息都是正确的;(3)认为因特 网可以完全取代其他媒体或信息渠道;(4)认为因特网上的信息无太多利用价值,仅限于聊 天、菜谱、各种发烧友俱乐部等非正式、娱乐性信息,缺乏严肃类信息。2、网上有什么样的信息:政府信息(来源过最大的是美国)、科研信息、教育信息、文化信 息、休闲娱乐信息(被称为是网上最成功的领域)3、因特网信息资源的特点:无限性和广泛性、多样性、廉价性、共享性、新颖性、无序性4、因特网上信息资源的种类:Web信息资源、Telnt、FTP

2、信息资源、用户组信息资源(用 户通信、服务组是因特网上最受欢迎的信息交流形式)、RSS信息资源5、超文本传输协议HTTP、超文本标记语言HTML、通用资源定位程序URL(URL又称信息资 源的统一定位或统一资源定位器)URL包括3部分:所使用的传输协议、服务器名称、该服 务器上定位文档的全路径名;6、浏览器是一种应用于WWW的网络软件,它是运行在用户计算机上的客户程序。浏览器分 为3类:行式浏览器、文本浏览器、使用图形界面的浏览器。7、评价的标准:目的、范围、内容8、围绕网站内容的方面:准确性、权威性、新颖性、独特性、可靠性、链接、图形和多媒 体设计、信息的展示与设计、可操作性9、评价方法:定

3、性评价(即按照一定的评价标准对被评站点的各方面特征、质量作出主观 评判。)定量评价(即利用数量分析方法,对调查统计数据进行分析,进而做出较系统、客 观的评判。)10、因特网信息资源检索的特点:检索范围大、检索效率高、检索工具强大、信息冗余大11、使用关键词检索网络资源的优点是:(1)检索简单易行、利于上手(2)检索到的信息 较新,时效性好(3)可以达到较高的检全率(4)符合检索语言的文献保障原则和用户保障 原则12、基于关键词检索的缺点:关键词语言难以反映词间的相关关系;分散主题,影响查准率; 自动标引无法完全解决标引不一致的问题。13、检索工具的功能通常包括:布尔检索、截词检索、位置检索、加

4、权检索、字符串检索、 限制检索、概念检索、模糊检索、深入检索因特网信息检索工具的工作原理:网络资源目录的工作原理相对简单,一般是由人工发现、 抓取、辨别网上信息,依靠编目、标引人员的知识,按照图书分类、学科分类或其他分类依 据,建立主题树分层目录,将采集、筛选后的信息分门别类地放入各大类或子类下面。一个完整的搜索引擎应具备如下5部分:搜索器、搜索引擎数据库、索引器、检索引擎和用 户接口14、计算机检索模型包括:布尔模型、向量空间模型、概率模型、扩展布尔模型15、因特网检索工具的性能评价:收录范围、检索功能、检索效率、检索结果的处理和展示、 用户界面设计16、检索功能直接影响信息检索的检全率、检

5、准率、检索的灵活性、方便性及检索速度,是 评价与选择因特网信息检索工具的核心指标。17、检全率:对于一项检索,实际检出的真正相关的文件数目()与所有应该被检出的文件 数目徐)的比率,r/R即为检全率。18、检准率:对于一项检索,如果检出的文件数是n,其中与本次检索真正相关的文件是r, 那么检准率就是r/n。19、搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜 集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给 用户的系统。20、通用搜索引擎:Google谷歌(Google会自动以AND逻辑连接;Google也支持OR逻辑

6、 操作;Google不支持截词符的使用)百度、天网、搜狗、网易等21、目录型网络检索工具概念:因特网上的目录型检索 工具一般称为网络目录(Web Directory),又称分类站点目录、专题目录或主题指南、站点导航系统等。它是由网络开发 者将网络资源收集后,以某种分类法进行组织整理,并和检索法集成在一起的信息查询方式。 网络目录一般是通过引导网络用户的查询概念(而不是确切的词条)来帮助用户找到所需的 网络信息。22、网络资源目录一般采用人工或半自动方式采集和存储网络信息。23、一个网络资源目录到底有几层,取决于多种因素:其一与使用的目录有关;其二取决于 所选的类目;其三与主题有关。24、网络资

7、源目录使用的分类法:(1)主题分类法(2)学科分类法(3)图书分类法(4)分 面组配法25、主题分类法一般设置12-18个一级主题类目,层次一般是4级。Yahoo !就是应用了主 题分类法,它将网络资源按内容分为14个大类。26、“网络指南针”采用的分类法之一便是学科分类法,其一级类目共分58个学科。27、分面分类法的原理是首先确定几个分类标准,即分面,再确定每个分类标准中的若干特 征值,即类目。28、网络资源目录介绍:Yahoo!、Galaxy、The WWW Virtual Library、Google 网页目录、 Dmoz29、网络资源目录主要适用于:(1)用户进行较宽泛的主题浏览和检索

8、。(2)当用户尚未形 成很精确的检索概念时,采用主题指南作为检索起点非常有效。30、元搜索引擎是一种基于搜索引擎的网络检索工具。31、元搜索引擎的分类:桌面元搜索引擎、All-in-One式元搜索引擎、并行检索式元搜索 引擎32、并行检索式元搜索引擎是将多个搜索引擎集成在一起,提供一个统一的检索界面,用户 发出检索请求后,提问式被同时分别提交、发送给多个独立搜索引擎,同时检索多个数据库, 最终输出的检索结果是经过聚合、去重之后反馈的多个独立搜索引擎查询结果的综合。33、在选择、使用各元搜索引擎时应注意其在以下几方面的特点:(1)所集成搜索引擎的数 量和名称(2)检索提问的输入及处理(3)其他检

9、索选项(4)检索结果的处理34、常用的桌面元搜索引擎:飓风搜索通、网际狂搜35、Dogpile,是老资格的元搜索引擎之一,目前可检索多达26个搜索引擎和类信息资源,具体对应如下:WWW 资源:Alta V istaBay9Direct HitUsenet 资源:DFTP 资源:Fast FTP Search拍卖信息:Go T音频资源:Astraweb,AudioGalaxy,MP3Board36、TBIR:基于文本的图像检索技术;CBIR:基于内容的图像检索技术37、用来帮助图像分析、标引的Web文档内容包括:(1)图像的文件名及其网址(2)图像 的替代文字(3)图像周围的文字(4)图像所在页

10、面的标题(5)图像的超链接(6)图像所 在网页彼此间的链接38、图像的内容特征,主要采用的是图像的颜色、纹理、及其形状特征。39、OCLC FirstSearch:是由美国OCLC创建的,是一个非营利、成员制的联机计算机图书 馆服务和研究机构,也是世界上最大的文献信息服务机构之一。40、OCLC自建的数据库有以下7个:(1)WorldCat世界上最大的、每日更新的书目数据库。(2)ArticleFirst提供15000多种学术期刊中论文的书目信息(3)ContentsFirst提供 15000多种学术期刊的目次页和馆藏信息(4)FastDoc是一个全文数据库,包括来自1000 种期刊、杂志的9

11、0万篇文章(5)NetFirst是一个权威、可靠的Internet信息资源指南、 目录(6)PaperFirst提供世界范围内各种学科学术会议议论文的索引(7)ProceedingFirst 提供在世界各地举行的各类学术会议的会议目次表41、SOSIG(社会科学信息网关)是一个有关社会科学信息资源的搜索引擎。检索功能:Search SOSIG (信息检索)、Browse SOSIG (信息浏览)、Whats New (更新信息)、Add New Resource(添加新资源)、help (帮助信息)。可用 “title”、“description” 和“keyword” 这 3 个参数来限制检

12、索范围。42、ERIC数字图书馆,由美国教育部教育科学研究所主办,是教育文献。43、APA:美国心理学协会,是世界上最大的心理学家联盟。44、法律信息检索工具:LexisNexis;工程技术信息检索工具:Ei Village2;医学信息检 索工具:Medline Plus45、图书馆书目检索的途径主要有:(1)题名检索,它包括书名、丛书名、并列书名、刊名 等。(2)责任者检索,它包括著者、编者、译者、团体著者。(3)分类检索,从图书所属学 科、领域分类的角度,按分类号进行检索。(4)主题检索,以表征图书内容主题的主题词或 关键词进行检索。(5)号码检索,包括国际标准书号ISBN、国际标准刊号I

13、SSN、分类号、 索书号、订购号等。(6)出版社名称检索。46、亚马逊网上书店,是因特网上最大、最著名的图书及音像制品销售公司。47、中国期刊网(简称CNKI),它的数据库主要有:中国期刊全文库(CJD)、中国重要报纸 全文库(CCND)、中国优秀博硕士论文全文库(CDMD)、中国基础教育知识库(CFED)、中国 医院知识库(CHKD)、中国期刊题录数据库(免费)、中国专利数据库(免费)等。48、UnCover是1988年美国CARL公司建立的世界上规模最大、更新速度最快的期刊检索系 统。UnCover的服务内容有:Opening search,免费检索题录或文摘;UnCover Reveal

14、,最 新文献报到服务;DOcument Delivery,原文递送服务。49、JSTOR,全名为Journal Storage,是一个对西文过刊进行数字化的非营利机构。50、国际标准化组织ISO是世界上最大的非政府性标准化专门机构。51、参考信息即指人名、地名、机构、事件、统计数据等一类数据、事实信息,是人们在工 作研究和日常生活中经常要查考、引用的信息。52、网上参考信息源的主要类型:(1)百科知识检索网站(2)任务信息检索网站(3)地理 信息检索网站(4)时事、新闻信息检索服务(5)机构信息检索网站(6)语词信息检索网 站(7)统计信息检索网站53、百科全书是“工具书之王”。54、白页信息

15、服务:网上白页是专用于查找因特网用户个人信息的特殊工具。55、IAF是目前世界上最好的黄白页信息查询工具之一。56、年鉴是指“每年出版的统计数据和事实的汇编,兼有现期性和回溯性内容。其包含的地 区和学科领域可能较为宽广,也可能限于某一特定国家或特定的主题”。57、词典是汇集词语(或词语的某些成分),根据一定的编撰目的加以描述、处理,通常按 字顺排列,供人们查找词语信息的工具书。58、上位词,指概念上外延更广的关键词,或者可以说每一个关键词所覆盖的信息范围都是 它的上位词所覆盖信息范围的子集。下为词,则是指概念上内涵更窄的关键词。59、检索策略:(1)确定自己的问题是否适合Internet检索(2)了解Internet信息检索 的特殊性(3) 了解可用的检索工具(4)仔细分析自己的信息需求并选择合适的工具(5) 根据检索结果调整检索策略(6)检索必须找对地方(7)选择合适的提问方式60、搜索引擎的“瓶颈”:搜索引擎索引更新慢、检索结果的排序仍然不能令人满意、搜索 引擎不能查找动态生成的网页61、网络信息检索的法律问题:侵犯隐私的风险、搜索技术本身的争议和”安全港“规定、 网页缓存功能的争议、搜索引擎营销中的法律纠纷62、网络信息检索技术方面(发展方向/热点):智能检索、语义检索、P2P检索

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!