文献信息检索与利用基本知识介绍

上传人:suij****uang 文档编号:204818597 上传时间:2023-04-27 格式:DOCX 页数:12 大小:31.87KB
收藏 版权申诉 举报 下载
文献信息检索与利用基本知识介绍_第1页
第1页 / 共12页
文献信息检索与利用基本知识介绍_第2页
第2页 / 共12页
文献信息检索与利用基本知识介绍_第3页
第3页 / 共12页
资源描述:

《文献信息检索与利用基本知识介绍》由会员分享,可在线阅读,更多相关《文献信息检索与利用基本知识介绍(12页珍藏版)》请在装配图网上搜索。

1、文献信息检索与利用基本知识介绍第二届华侨华人文献信息检索与利用讲座讲义(二) 主讲人覃建宁一、网上电子资源检索与利用 l检索方法的使用1、布尔逻辑检索所谓布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进 行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为 命中文献,否则为非命中文献。常用的布尔逻辑运算有三种,分别是逻辑或、逻辑与、逻辑非。逻辑或:运算符为“OR”、“or”、“+”,有时也可以用T表示。检索式A OR B,表示包含检索词A的文献或包含检索词B的文献或者同时包 含A和B的文献均为命中文献。使用逻辑或相当于增加检索主题的同义词与

2、近 义词,扩大了检索范围。例:华侨OR华人逻辑与:运算符为“AND”、“and”、“*”,有时也可能用“&”表示。检索式A AND B,表示文献中同时包含检索词A和检索词B的文献才是命中文 献。使用逻辑与缩小了检索范围,增强了检索的专指性。例:华侨AND马来西亚逻辑非:运算符为“NOT”、“not”、“-”,有时也可能用“!”表示。检索式A NOT B,表示包含检索词A同时不包含检索词B的文献为命中文献。 逻辑非排除了不希望出现的检索词,增强了检索专指性。但在使用时要特别注意, 因为它同时排除了有用的文献。例:华侨NOT马来西亚上述三种逻辑运算的关系见图3.1。对于一个复杂的逻辑检索式,检索系

3、统的处 理是从左向右进行的。在有括号的情况下,先执行括号内的运算;有多层括号时, 先执行最内层括号中的运算,逐层向外进行。在没有括号的情况下,And、Or、 Not的运算次序,在不同的系统中有不同的规定,例如DIALOG系统中依次为 NotfAndfOr; STAIRS系统和ORBIT系统中依次为And和Not按自然顺序 执行,然后执行Or运算。检索时应注意了解各机检系统的规定。每个搜索引擎可以使用的布尔运算符是不同的,有的只允许使用大写的“AND”、 “NOT”、“OR”运算符,有的大小写通用,有的可支持“&”、“丨”、“! ”符号操作, 有的不支持或仅支持其中的一个等等。例如,Google

4、和Yahoo!中国都支持布尔逻辑检索。Google可用AND”、and”、 &进行逻辑与运算,但只能用大写OR表示逻辑或,不支持NOT逻辑符操 作,允许使用-符号代替逻辑非运算;Yahoo!中国可用AND、and、&进行逻辑与运算,以OR进行逻辑或运算,以NOT、not进行逻辑非运 算。确切地知晓每一种搜索引擎的检索功能与特性,无需死记硬背。只要在使用时, 查看帮助信息便是了。2、词组检索词组检索(phrase),也称为短语检索,或字符串检索。它是将一个词组或短语 用双引号“”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的 一种方法。检索结果必须含有与提问式完全一样(包括次序)的字

5、串。几乎所 有的搜索引擎都支持词组检索。例如,以侨务新闻作为提问关键词检索时,检索结果则仅反馈侨务新闻的内容。3、位置检索位置检索(Proximate)是在检索词之间使用位置算符(也称邻近算符Adjace nt Operators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含 有指定检索词而且这些词在记录中的位置也符合特定要求的记录。这种方法能够 提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置 相邻/相连时,可使用位置算符。机检系统中常用的位置算符(按限制强度递增顺 序排列)如下:(1) .(f)算符Field:要求被连接的检索词出现在同一字段中,字段类

6、型和词序均不I限。例女口 happiness(f)sadness and crying(2) .(s)算符Sub-field/Sentenee:要求被连接的检索词出现在同一句子(同一子字 段)中,词序不限。例如machine(s)plant(3) .(n)算符near: (n)要求被连接的检索词必须紧密相连,词之间除允许有空格、 标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多 可以夹N个词(N为自然数1、2、3.),且词序任意。例如information(nRetrieval 可以检出 information retrieval 和 retrieval inform

7、ation,又女口 eeonom ? ?(2n) recovery 可以检出 economic recovery recovery of the economy、recovery from econo mic troubles(4) .(w)算符With: (w)要求检索词必须按指定顺序紧密相连,词序不可变,词之 间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个 词之间最多可夹入N个词(N为自然数),词序不得颠倒。例如input(w)output 可检出 in put output 而 wear(1w)materials 可检出 wear materials、wear

8、of materials采用位置算符检索时,通常最严谨的算符放在最左面,例如:europea n(w)ec ono mic(w)commu ni ty(f)patio,redwood(3 n)deck?(s)(swim min g(w)pool?)注意:不同的机检系统,位置检索的功能及算符不同,应参看机检系统的说明。4、截词检索截词检索(Tru ncatio n)是指用给定的词干做检索词,查找含有该词干的全部检索 词的记录,也称词干检索或字符屏蔽检索。它可以起到扩大检索范围,提高查全 率,减少检索词的输入量,节省检索时间,降低检索费用等作用。检索时,若遇到名词的单复数形式,词的不同拼写法,词的

9、前缀或后缀变化时,均可采用此方 法。截词的方式有多种,按截断部位可分为右截断、左截断、中间截断、复合截断等; 按截断长度可以分为有限截断和无限截断。(1).右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例 如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、 geologize、geology等词的记录检索出来。若输入PY=199?,会把90年代的记 录全部查出来。(2)左截断:截去某个词的前部,是词的后方一致比较,也称后方一致检索。例 如:输入?magnetic 能够检出含有 magnetic、electromagn

10、etic、paramagnetic、 thermo-magnetic 等词的记录。(3)中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检 索。例如:输入 organi?ation 可以检出 organization、organisation;输入 f?t 可查出 foot、feet。复合截断:是指同时采用两种以上的截断方式。例如?chemi?可以检出chemical、chemist、chemistry、electrochemistry、electrochemical physicochemical、thermochemistry 等。有限截断:是指允许截去有限个字符。例如“a

11、cid? ?”表示截去一个字符,它 可检出 acidacids,但不能检出 acidic、acidicity、acidity 等词。又如 comput? ? 可检出 compute、computer、computers、computing 等词,不能检出 computable、 computation、computerize等词。注意:词干后面连续的数个问号是截断符, 表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空 格,输入时一定要注意。(6) 无限截断:是指允许截去的字符数量不限,也称开放式截断。上面右截断、 左截断所举的例子均属此类型。由上述可见:任何一种截词检索,

12、都隐含着布尔逻辑检索的“或”运算。采用截词 检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符 不得少于3个),将增加检索噪声,影响查准率。另外,不同的机检系统使用的 截词符不同、各数据库所支持的截断类型也不同,例如DIALOG系统和STN系 统用?、ORBIT系统用:、BRS系统用$、ESA-IRS系统用+等。5、字段检索字段检索(field)是一种用于限定提问关键词在数据库记录中出现的区域,控制 检索结果的相关性,提高检索效果的检索方法,多以字段限定方式实现。搜索引 擎常用的字段有:Title/t、Subject、Text、host (主机)、URL/u、domain

13、(域 名)、link (链接)等。Title:(或t:)表示查找标题中包含检索提问式的页面;URL: (或/u:)表示查找URL中包含检索提问式的页面;Link:表示查找含有链接至URL的页面;host:表示在指定的服务器上查找页面;doma in:表示查找指定域名的各页面;subject:表示查找主题中包含检索提问式的页面;text :表示文本中包含检索提问式的页面。l数据库检索的常用方法和技巧1、数据库常用的检索字段有哪些? 数据库常用的检索字段列表: 西文数据库常用字段中文数据库常用字段字段名称Abstract ABAuthor AUCorporate CS Descriptor/Sub

14、ject DE Docume nt Type DT Full-text FTISSN ISSN字段代码文摘 作者机构名称叙词/主题词文献类型 全文国际标准连续出版物号Journal Name/Publication Title JN 期刊名称Keyword/Topic KWLangage LAPublication Year PYTitle TI2、如何扩大检索范围? 对检索数量比较少的结果,关键词语言出版年题名可以进彳丁扩检,提高查全率。常用措施有: 增加一些检索词,或将查询检索词的上位类词、近义词等补充进去;调整组配算符,如改AND为OR;使用截词检索,如改center为cent*;取消或

15、放宽一些检索限定,如年限、学科、文种等; 增加或修改检索入口,如改题名为文摘或全文等。3、如何进行缩小检索范围?检索结果过多是信息检索过程中一个常见问题,从中挑选出相关度高的资料还要 花费很长时间。当检索结果过多时可考虑进行缩检,提高查准率。常用措施与扩 检相反,如减少一些相关性不强的检索词,增加AND组配算符,增加检索限定, 减少检索入口等。4、数据库比较通用的检索功能主要有哪些? 比较通用的检索功能主要有三种:简单检索:为用户提供一个简单的检索界面,页面上通常只有一个检索框。复杂检索:为专业用户、资深用户提供的比较复杂的检索界面,可以构建比较细 致的检索式,帮助用户进行精确检索。二次检索:

16、在检索结果内进一步检索,使检索结果更精练、准确。5、科技文献类型有哪些?如何识别?科技文献类型主要包括:科技图书、科技期刊、科技报告、专利文献、会议文献、 学位论文、标准文献、产品资料、技术档案、政府出版物等。类型常用字样 科技图书 Sci-Tech book: Mono graph, An thology, Textbook,Refere nee book 科技期干刊 Sci-Tech Journal: magazine, serial, periodical科技报告 Sci-Tech Report专利文献 Pate nt Docume nt: Pate nt specificati on/

17、bulleti n/aids会议文献 Conf ere nee paper: Proceed in gs, compilatio n, collected paper, records Meeti ng: workshop, sem in ar, colloquium, symposium, conf ere nee 学位论文 Dissertation, Thesis6、如何找到与课题相关的文献?首先应利用本领域的核心数据库。即根据课题内容归纳出中、英文关键词,尽可 能检索可以利用的、与课题相关的文献信息数据库,从而获得相关文献; 其次注意通过引文途径进一步获取相关文献。即利用已有文献中的参考

18、文献作为 获取新文献的线索,通过检索引文数据库获得更多文献;有时通过浏览相关学会和研究机构的网站也能得到一些有用的信息。 最后从检索结果中选出最感兴趣的若干篇文献,根据文献的出处设法获取原文。7、如何识别数据库的学科范围?一般数据库都有自己特定的学科范围、文献类型。选择数据库时,关键是识别所 选数据库中是否收录了所查找学科主题范围内的文献,是否有所需要的文献类 型。识别方法:通过数据库收录的来源期刊的学科范围识别;通过图书馆网站中资源推介栏目中描述的每种数据库的学科范围来识别; &如何选择最适合自己的数据库?选择数据库时要考虑以下几个因素:所需信息的水平:广度、深度、专指度、学术性。文献类型:

19、报纸、杂志、学术期刊、商业期刊、学位论文、会议文献和科技报告 等。数据库主题范围:专业数据库还是综合性数据库。数据库时间跨度:当你所需信息超出数据库收录文献的时间跨度时,可查图书馆 馆藏数据库的印本文献。另外,一定要多试几个数据库,因为不同数据库的收录范围不同,甚至同一学科 领域的数据库收录范围也不相同。如果还有疑问,可向图书馆员咨询请他们推荐 合适的数据库。l数据库检索策略所谓检索策略,广义讲是指为实现检索目标而制定的全盘计划和方案;狭义讲是 指检索式。检索式是用来表达用户检索提问的逻辑表达式,是检索策略的综合体 现,通常由检索词和各种逻辑算符、位置算符及系统规定的其它连接符号构成。 在联机

20、检索中,检索策略直接关系到检索结果的成败,需要对检索课题进行深入 的分析并能运用各种检索方法和技巧。一般来说,构造检索策略通常包括以下步骤:1. 分析课题。2. 选择数据库。3. 分析概念,选择检索词4. 构造检索式5. 进行检索6. 获取全文以下举例说明这些过程,假设我们要检索华侨华人文献信息专题数据库建设 方面的资料,1分析课题现在,我们分析这个课题并描述之,显然,本课题可描述为:华侨华人文献信息 专题数据库建设。另外,在明确了检索课题的主题内容后,还应预期得到什么样的检索结果,是专 业文献还是一般性或通俗文章,对文献类型、时间范围及地理范围有无特殊要求 等。显然,课题要求得到有关该主题的

21、专业文献。2. 选择数据库。选择数据库时要考虑以下几个因素:所需信息的水平:广度、深度、专指度、学术性。文献类型:报纸、杂志、学术期刊、商业期刊、学位论文、会议文献和科技报告 等。数据库主题范围:专业数据库还是综合性数据库。数据库时间跨度:当你所需信息超出数据库收录文献的时间跨度时,可查图书馆 馆藏数据库的印本文献。另外,一定要多试几个数据库,因为不同数据库的收录范围不同,甚至同一学科 领域的数据库收录范围也不相同。如果还有疑问,可向图书馆员咨询请他们推荐 合适的数据库。分析本课题,我们可以选择维普和中国期刊网进行检索。3. 分析概念,选择检索词一个检索课题往往涉及多个概念,这一步的任务就是将

22、检索课题涉及的所有概念 分离出来,并针对每一个概念选择尽可能多的检索词。分析概念可从课题名称入 手。如本例中,“华侨华人”、“文献”、“信息”、“数据库”即为概念词。4. 构造检索式构造检索式需要使用各种检索技术,如根据概念之间的逻辑关系需使用布尔逻辑 检索技术,根据词与词之间的位置关系需使用位置检索等,关于信息检索技术的 详细内容,详见前述内容。本例中,我们根据这几个概念词逻辑关系,构造如下检索式: 华人华人*文献*信息*数据库5. 入库检索进入相关数据库,如维普数据库,输入以上检索策略式6 获取全文注意,不同的数据库系统获取全文的方式不完全一致,具体操作请参阅分库使用 指南。l免费电子报刊

23、、电子图书、电子论文的查找1、本馆的电子资源说明:只有校园网用户(包括校园宽带网用户和校园网拨号用户)才能使用本馆的 网络数据库;如果设置了代理服务器,请去掉代理服务器后再使用;在网络中心 申请的出国代理不影响数据库的使用。本馆数据库都有详细的检索帮助,如有困 难,可参看帮助。u万方数据库学位论文全文、数字期刊都有人文科学类,可以查到华侨华人研究的论文和资料。u PQDD美国博、硕士论文1861年至今,可看到前24页全文。u UMI博士论文全文库美国博、硕士论文全文 提供PQDD论文全文。时间从1998年起至2003年。 注意:从PQDD中检索到并非都能在此找到全文。u中国学术期刊网期刊全文

24、要下载安装CAJ浏览器。u维普中文期刊全文数据库要下载安装维普全文浏览器。u EBSCOAcademic Search Premier :综合类期刊,可检索到华侨华人方面的文章。 u SDOS期刊全文包含有社会科学。u Kluwer期刊全文 涵盖20多个学科专题,包括生物法律、医学、心理学、物理学、 航空航天、哲学、数学、计算机科学、工程、电子工程、材料、地学、社会人文、 化学、商业管理等u科学在线期刊全文数学物理天文学地球科学化学材料科学生物医学计算机环境科学 经济教育历史哲学心理学社会科学,(免费期刊)u方正Apabi电子图书图书全文 经济、文学、艺术、数理化、生物、医药卫生、计算机科学

25、u书生之家电子图书u NetLibrary电子图书只能在线阅读,不能下载。2、互联网上的电子资源u HighWire Press (http:/i ntl.highwire.org)英文网站,需要出国帐号。u CALIS 高校学位论文库 CALIS学位论文数据库以合作建设、资源共享为目的,建立为高校师生提供 学位论文和会议论文的查询、文摘索引的浏览、全文提供(传递)等配套服务。u 毕业论文网 免费,不需要注册,有相当数量的论文。u 论文库 u 论文帝国 u 168 论文网 u 学生大论文 u 无忧论文网 只提供文摘和目录,想获取全文需要交费。u 论文资料网 只提供文摘和目录,想获取全文需要交费

26、。u 超星数字图书馆 有超星数字卡即可使用,要下载安装超星图书阅览器。l常用搜索引擎简介1、Google 搜索引擎 http:/www.google.eom/intl/zh-CN/目前最优秀的支持多语种的搜索引擎之一,也是全球最常用的搜索引擎。约搜索 3,083,324,652张网页。提供网站、图像、新闻组等多种资源的查询。包括35 个国家和地区的语言的资源。2、百度中文搜索引擎 全球最大中文搜索引擎。提供网页快照、网页预览/预览全部网页、相关搜索词、 错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索、百度搜霸、搜索援助 中心。3、一搜搜索引擎 “一搜”是雅虎中国推出的一个中文搜索网站。

27、目前设立了网页、图片、MP3和网 址四个频道。“一搜”采用雅虎花费数十亿美元打造出的搜索技术(YST),用户可 以抓取到全球50亿网页(其中3亿个中文网页)、9000万张图片、100多万个免 费音乐的海量资料。4、中国搜索(原慧聪搜索)中国搜索拥有全球领先的中文搜索引擎技术,现在已被新浪、搜狐、网易、TOM 四大门户,以及1400多家联盟成员网站所采用。每天有数千万次的搜索服务是 通过中搜的技术实现的。与一般的搜索引擎相比,中国搜索具有网页覆盖率高、 数据更新快、支持中文模糊查询、强大的个性化查询、智能查询、内容相关性分 析、便利的专业信息查询等优势,被公认为第三代智能搜索引擎的代表。5、新浪

28、分类搜索引擎http:/www.si .c n互联网上规模最大的中文搜索引擎之一。设大类目录18个,子目1万多个,收 录网站20余万。提供网站、中文网页、英文网页、新闻、汉英辞典、软件、沪 深行情、游戏等多种资源的查询。6、搜狐分类搜索引擎 搜狐于1998年推出中国首家大型分类查询搜索引擎,到现在已经发展成为中国 影响力最大的分类搜索引擎。每日页面浏览量超过800万,可以查找网站、网 页、新闻、网址、软件、黄页等信息。7、网易分类搜索引擎 http:/www. 网易新一代开放式目录管理系统。拥有近万名义务目录管理员。为广大网民创建 了一个拥有超过一万个类目,超过25万条活跃站点信息,日增加新站

29、点信息 5001000条,日访问量超过500万次的专业权威的目录查询体系。& 北大天网中英文搜索引擎由北京大学开发,简体中文、繁体中文和英文三个版本。提供全文检索、新闻组 检索、FTP检索(北京大学、中科院等FTP站点)。目前大约收集了 100万个 WWW页面(国内)和14万篇Newsgroup (新闻组)文章。支持简体中文、繁 体中文、英文关键词搜索,不支持数字关键词和URL名检索。9、一些常用的英文搜索引擎MSN Search、AOL Search Terra Lycos、Altavista、ASK jeeves二、馆际互借介绍石牌六校馆际互借到本馆办理石牌六校通过阅览证,即可到其他石牌六

30、校中的任何一校的图书馆阅 览图书资料。l清华大学、国家图书馆的馆际互借服务内容1、清华大学图书馆书、刊、会议论文、学位论文、报告、标准等文献的复印件。另清华大学图书馆 是国内馆际互借中心,可代用户向国内其他图书馆和国外图书馆申请复印。2、中国国家图书馆馆藏中英文图书的借阅及复印,包含如下文献:u查询参考工具书:百科全书、工具书、机构名录、外文年鉴。中、英、俄等主 要文种的社会及自然科学技术类文摘、索引。u国际组织和外国政府出版物:联合国系统、欧洲共同体、经济合作与发展组织 及美国政府出版(图书、期刊、文件)。u中国学位论文数据库(1990-)(原文只提供纸本复印)u中国社科报刊数据库(1993-)u NTIS美国政府报告(1983-)u声像资料二OO四年十月二十八日

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!