精准获取信息的方法编写检索式课堂PPT

上传人:沈*** 文档编号:181252107 上传时间:2023-01-11 格式:PPT 页数:74 大小:350KB
收藏 版权申诉 举报 下载
精准获取信息的方法编写检索式课堂PPT_第1页
第1页 / 共74页
精准获取信息的方法编写检索式课堂PPT_第2页
第2页 / 共74页
精准获取信息的方法编写检索式课堂PPT_第3页
第3页 / 共74页
资源描述:

《精准获取信息的方法编写检索式课堂PPT》由会员分享,可在线阅读,更多相关《精准获取信息的方法编写检索式课堂PPT(74页珍藏版)》请在装配图网上搜索。

1、.1精准获取信息的方法编写检索式.2主要内容主要内容n为什么要精准获取信息为什么要精准获取信息n检索策略和步骤检索策略和步骤n如何编写检索式如何编写检索式n搜索引擎中的检索式搜索引擎中的检索式.3为什么要精准获取信息为什么要精准获取信息保证检索的全面性保证检索的全面性 不仅要广泛查阅自己特定范围内的国内外有关研究成果,而且要把视野放宽,广泛测览特定范围以外的有关研究成果。不仅要搜集与自己观点一致的材料,也要搜集那些与自己观点不一致,或与自己构思相矛盾的资料。不仅要广泛查阅中文资料,同时也应查阅外文资料,以便及时掌握最新的研究资料和动向特别是要着力搜集第一手资料,以保证研究的客观全面。.4保证检

2、索的准确性保证检索的准确性 通过细读,基本掌握若干年来所研究的领域内讨论过的问题,分歧意见,代表人物和主要著作,主要倾向。要认真推敲观点和论据,并做好记录。从前人分歧矛盾中发现问题:从前人分歧矛盾中发现问题:(1)前人的结论可能是正确的,但论据不充分;结论可能是错误的,但研究过程或研究方法可能有启发;(2)前人的争论焦点,可能是问题的关键所在,也可能只在表面现象上争吵不休,并未触及问题的实质;(3)前人的理论依据及史料依据,可能是准确无误十分丰富,也可能是篡改文献,贫乏薄弱得不足为据。我们要通过细致查阅,搞清来龙去脉。.5检索效果评价检索效果评价 n查全率查全率是指检索出的相关文献量占系统中所

3、有相关是指检索出的相关文献量占系统中所有相关文献总量的百分比,用来反映检索的全面性。文献总量的百分比,用来反映检索的全面性。n查准率查准率是指检索出的相关文献量占所有检出文献总是指检索出的相关文献量占所有检出文献总量的百分比,用来反映检索的准确性。量的百分比,用来反映检索的准确性。查全率查全率P=a/(a+c)100%P=a/(a+c)100%查准率查准率R=a/(a+b)100%R=a/(a+b)100%R R:表示查全率;:表示查全率;P P:表示查准率;:表示查准率;a a:检出的相关文献量为;:检出的相关文献量为;b b:检出的非相关文献量;:检出的非相关文献量;c c:系统中未检出的

4、相关文献量。:系统中未检出的相关文献量。.6n查全率的互补数就是漏检率查全率的互补数就是漏检率n查准率的互补数就是误检率。查准率的互补数就是误检率。n查全率和查准率也是互补的关系。查全率和查准率也是互补的关系。在一个特定的检索在一个特定的检索系统中,当查全率不断提高的同时,查准率就会降低,系统中,当查全率不断提高的同时,查准率就会降低,而当查准率提高的同时,查全率又会降低。但当查全而当查准率提高的同时,查全率又会降低。但当查全率和查准率都很低的时候,两者可以通过检索策略的率和查准率都很低的时候,两者可以通过检索策略的改善同时得到提高。改善同时得到提高。.7检索课题检索课题主题分析主题分析选择数

5、据库选择数据库确定检索词确定检索词制定检索式制定检索式计算机处理计算机处理 数据库数据库原文原文标引标引 结果评价结果评价用户用户词表词表检索步骤检索步骤NY结结果果返返回回构造检索策略构造检索策略.8制定检索策略制定检索策略 n什么是检索式什么是检索式 检索式:检索式是指计算机检索中用来表达用户检索提问检索式:检索式是指计算机检索中用来表达用户检索提问的逻辑表达式,由的逻辑表达式,由检索词检索词、检索算符检索算符以及系统规定的以及系统规定的其他其他连接符号连接符号等构成等构成n运算符运算符 又称逻辑算符,是表达检索词之间逻辑关系和限制关系的又称逻辑算符,是表达检索词之间逻辑关系和限制关系的运

6、算符号,它是复合检索式中必不可缺的构件。包括逻辑运算符号,它是复合检索式中必不可缺的构件。包括逻辑算符、截词符、位置算符等字段检索算符、截词符、位置算符等字段检索.9编制检索式编制检索式n用逻辑算符说明词间的逻辑关系用逻辑算符说明词间的逻辑关系n用位置算符指定词间的位置关系用位置算符指定词间的位置关系n用截词符描述词尾变化用截词符描述词尾变化n检索字段检索字段n分析检索结果,调整检索式,直至满意分析检索结果,调整检索式,直至满意 试解释检索式:试解释检索式:S(speckle and nondestruc?(w)test?)/ab,ti,de.10检索词的选定确定检索词的基本准则确定检索词的基

7、本准则n必须能正确反映检索要求;必须能正确反映检索要求;n必须符合数据库的检索用词规则;必须符合数据库的检索用词规则;n优先选用具有检索意义学科名词术语;优先选用具有检索意义学科名词术语;n多选常用的基本词汇进行组配。多选常用的基本词汇进行组配。.11 进行文献的主进行文献的主题分析,包括审题分析,包括审读文献,划分主读文献,划分主题类型和分析主题类型和分析主题结构,选直接题结构,选直接表达文献主题概表达文献主题概念的词表中的正念的词表中的正式专指叙词;式专指叙词;要利用概念之间的属种关系和相关关系增加检索线索选择主题词要领选择主题词要领把握概念的含义注意利用词表 属种关系又称上下位关属种关系

8、又称上下位关系,包括概念是属概念,被系,包括概念是属概念,被包括的概念是种概念。利用包括的概念是种概念。利用属概念扩大检索途径,可提属概念扩大检索途径,可提高查全率,利用种概念缩小高查全率,利用种概念缩小查找范围,可提高查准率。查找范围,可提高查准率。相关关系指属种关系以相关关系指属种关系以外的具有交叉、并列、对立外的具有交叉、并列、对立关系的概念,以及形式与内关系的概念,以及形式与内容、本质与现象、原因与结容、本质与现象、原因与结果等关系。善于利用这些关果等关系。善于利用这些关系,有利于提高查全率。系,有利于提高查全率。词表词表是文献检索是文献检索的重要辅助工具,使用的重要辅助工具,使用时要

9、注意从多角度查词,时要注意从多角度查词,要充分利用辅助表。当要充分利用辅助表。当查不到与某个具体概念查不到与某个具体概念相对应的专指叙词时,相对应的专指叙词时,可以把该概念分解为几可以把该概念分解为几个较一般的概念个较一般的概念(外延外延相对宽的相对宽的),然后再去,然后再去查表。查表。.121 1 直接选词法直接选词法n当检索题目中使用的自由词与规范词相一致时,可直接选当检索题目中使用的自由词与规范词相一致时,可直接选取。取。n例如:例如:“光缆光缆(optical fiber)”(optical fiber)”、“计算机辅助设计计算机辅助设计(computer aided design)”

10、(computer aided design)”等,这等,这些词属于范围大、命中率高的选词,检索人员可直接进行些词属于范围大、命中率高的选词,检索人员可直接进行检索。这种方法的结果最为接近主题。检索。这种方法的结果最为接近主题。.132 2 专指选词法专指选词法n选用专指性强的主题词越多,则检出的文献针对性越强,选用专指性强的主题词越多,则检出的文献针对性越强,查准率就越高。查准率就越高。n突出检索主题的深度。突出检索主题的深度。.143 3 转换选词法转换选词法n检索词的确定必须经过对检索主题的正确分析得到。检索词的确定必须经过对检索主题的正确分析得到。n选词过程中还经常会遇到不能直接查到所

11、需文献的词,这选词过程中还经常会遇到不能直接查到所需文献的词,这中间就需要有一个转变过程。中间就需要有一个转变过程。n例如:例如:检索COBOL语言设计课题,若不加分析就选用“COBOL language design”,则必然碰壁。而通过正确分析理解就会知道COBOL语言是一种用来编制计算机程序的语言,所以应先确定检索词为“计算机程序语言(computer programming languages)”,然后再进一步与COBOL组配,定能得到满意结果。n此种选词法可促使科技人员对主题词表的主题词结构及类此种选词法可促使科技人员对主题词表的主题词结构及类型有所了解,锻炼多角度选词的能力。型有所

12、了解,锻炼多角度选词的能力。.154 4 通配符的运用通配符的运用(1 1)“?”?”代表检索词中的一个汉字、西文字符或其代表检索词中的一个汉字、西文字符或其他字符。他字符。例如:例如:“计算?计算?”,表示,表示“计算机计算机”、“计算器计算器”等词;等词;“航?器航?器”,表示,表示“航空器航空器”、“航天器航天器”等词;等词;“int?net”int?net”,表示,表示“internet”internet”、“intranet”intranet”等词。等词。.16(2 2)“#”#”代表检索词中的一个汉字、西文字符或其他代表检索词中的一个汉字、西文字符或其他字符,也可不代表任何汉字、西

13、文字符或其他字符。字符,也可不代表任何汉字、西文字符或其他字符。例如:例如:“微微#机机”,表示,表示“微机微机”、“微型机微型机”等词;等词;“missile#”missile#”,表示,表示“missile”missile”、“missiles”missiles”等等词;词;“colo#r”colo#r”,表示,表示“color”color”、“colour”colour”等词。等词。.17(3 3)“$”$”代表检索词中的任意多个汉字、西文字符或其代表检索词中的任意多个汉字、西文字符或其他字符,也可不代表任何汉字、西文字符或其他字符。他字符,也可不代表任何汉字、西文字符或其他字符。例如:

14、例如:“网络网络$”$”,代表,代表“网络网络”、“网络软件网络软件”、“网络计算网络计算机机”、“网络操作系统网络操作系统”等词;等词;“electron$”electron$”,代表代表“electron”electron”、“electrons”electrons”、“electronic”electronic”、“electronics”electronics”等词。等词。.18 “?”“?”、“#”#”和和“$”$”的相同点与不同点:的相同点与不同点:(1 1)“?”与与“#”#”均代表一个汉字、西文字符或其他字符;均代表一个汉字、西文字符或其他字符;“#”#”与与“$”$”均可以不

15、代表任何汉字、西文字符或其均可以不代表任何汉字、西文字符或其他字他字 符,检出的词均包括词干本身。符,检出的词均包括词干本身。(2 2)不同点:)不同点:使用使用“?”,检出的词不包括词干本身;,检出的词不包括词干本身;使用使用“$”$”,可代表多个汉字、西文字符或其他字符,可代表多个汉字、西文字符或其他字符 检出的词包括词干本身检出的词包括词干本身。.19使用运算符的检索技术布尔逻辑检索技术位置检索技术截词检索技术字段限定检索技术原文检索技术扩检与缩检.20一、布尔逻辑检索技术一、布尔逻辑检索技术n在检索实际中,检索提问涉及的概念往往不止一个,而同一个概念又往往涉及多个同义词或相关词。n为了

16、正确地表达检索提问,系统中采用布尔逻辑运算符将不同的检索词组配起来,使一些具有简单概念的检索单元通过组配成为一个具有复杂概念的检索式,用以表达用户的信息检索要求。.211 逻辑逻辑“与与”n含义:含义:检出的记录必须同时含有所有的检索词。n基本作用:基本作用:一种用于交叉概念或限定关系的组配,可以缩小检索范围,有利于提高检索的专指性。n用and 或*表示例如:查找同时含有概念A 和概念B 的文献,可表 示为:“A and B”或“A*B”.222 逻辑逻辑“或或”n含义:含义:检出的记录中,至少含有两个检索词中的一个。n基本作用:基本作用:用于具有并列概念关系的组配。这种组配可以扩大检索范围,

17、提高查全率。可以避免了命中文献的重复出现。n用OR 或“+”表示例如:例如:检索含有检索项A 或检索项B 的文献,可表 示为:“A OR B”或“A+B”.233 逻辑逻辑“非非”n含义:含义:排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。n基本作用:基本作用:用于从某一检索范围中排除不需要的概念。这种组配可以缩小检索范围。n用“NOT”或“-”表示,但在检索时建议使用但在检索时建议使用NOT,以避免与词间的分隔符以避免与词间的分隔符“-”混淆。混淆。例如:例如:在含有概念A 的文献集合中,排除同时含有 概念B 的文献,可表示为:“A NOT B”

18、或 “A-B”。.244 运算优先级运算优先级n运算优选级顺序为(),NOT,OR,AND;n可以用括号改变它们之间的运算顺序。通常在有通常在有括号的情况下,括号内的逻辑运算先执行,有多括号的情况下,括号内的逻辑运算先执行,有多层括号时,先执行最内层的括号。层括号时,先执行最内层的括号。例如:例如:(A OR D)AND B,表示先执行“A OR D”的 检索,再与B进行AND运算。.255 注意事项注意事项1)有的检索工具以符号形象地表达布尔检索的功能,如“+”表示逻辑与,“-”表示逻辑非。有的检索工具直接把布尔逻辑隐含在菜单中,例如,Lycos以“match all terms”表示逻辑与

19、,以“match any term”表示逻辑或。绝大多数检索工具的高级检索完全用表格和文字来表达布尔关系,如,Excite以“必须包括(MUST contain)”表示逻辑与,用“一定不含”(MUST NOT contain)表示逻辑非。有的检索工具部分支持布尔关系,如Yahoo!尚不支持逻辑非。.262)用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。布尔算符使用正确但却不能达到应有检索效果的例子很多。nOR逻辑 有些检索词表达的概念,存在整体与部分的关系。在检索中,这类关系如果处理不好,就不能得到满意的检索效果。对此,一般原则是,如果检索词

20、涉及到表达整体的概念,就要针对具体情况分别列出每一个表达部分概念的检索词,否则将出现漏检。nNOT逻辑 在检索逻辑中使用NOT,能排除含有由NOT指定的检索词的文献,协助检索出更准确的文献。但是,使用NOT必须慎重。因为,如果两个关系紧密的检索词同在一个检索逻辑中,对其中一个使用NOT逻辑会导致含另一个词的文献也被排除。.276 小结小结n检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。n用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。n另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正

21、确但不能达到应有检索效果的事情是很多的。.28表明查询结果中必须同时包含表明查询结果中必须同时包含intelligent robot和和control表明查询结果中至少包含两个检索词中的任意一个表明查询结果中至少包含两个检索词中的任意一个,intelligent robot或或control表明检索结果包含表明检索结果包含intelligent robot,但同时必须去掉和,但同时必须去掉和control相关的内容相关的内容Intelligent robot and control(intelligent robot*control)Intelligent robot or control(i

22、ntelligent robot+control)Intelligent robot not control(intelligent robot-control)注:英文数据库通常用字母,中文数据库要用符号。注:英文数据库通常用字母,中文数据库要用符号。.29二、位置检索(邻近检索)技术二、位置检索(邻近检索)技术n表明两或多个检索词之间关系的符号。表明两或多个检索词之间关系的符号。n适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。可以看成特殊功能的AND算符。AND算符不限制两个检索词的位置和出现顺序。n例如:communication AND satellite 命中的文献可能有

23、communication satellite;satellite communication;communicaticn devices for satellites;communicaticn links without satellites;n 位置算符可以改进AND算符的这种不足,它是特殊功能的AND算符。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一位置算符,检索系统不同,规定的位置算符也不同。.301)“(W)”n含义:“(W)”算符中的W含义为“With”。表示其两侧的检索词必须紧密相连,除开空格和标点号外,不得插入其他词或字母,两词的词序不可颠倒。其简略形式为(

24、)。n例如:communication(W)satellite communication()satellite 两者相同 .312)“(nw)”n“(nW)”中的“W”的含义为“Word”,它允许两词间插入最多为n个其他词,包括实词和系统禁用词,词序不变。n 例如:communication(2W)satellite 则会检出 communication satellite communication though satellite communication on the satellite.323)“(N)”n含义:“(N)”中的N含义为“Near”。表示其两侧的检索词必须紧密相连,除

25、开空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。.334)“(nN)”n含义:含义:“(nN)”是“(N)”算符的变形,不同之处为允许两词间插入最多为n个其他词,包括实词和系统禁用词。n例如:例如:COTTON(2N)PROCESSING 则命中:Cotton processing;processing of cotton;processing of Egyptian cotton.345)“(F)”5)“(F)”同字段检索同字段检索 n 含义:含义:“(F)”算符中F的含义为“Field”。这个算符表示其两侧的检索词必须在同一个词段中出现,(例如;同在题目字段或文摘字段)词序不

26、限,中间可插任意检索词项。n例如:例如:POLLUTION(F)CONTRON 可命中 Contron and management of industrial pollution 同在题目中(F)邻近算符与AND布尔逻辑主要区别在于:(F)使两个检索项在同一字段,AND布尔逻辑中两个检索词会发生在不同字段中。.356)“(s)”6)“(s)”同句检索同句检索n含义:含义:“(s)”算符中的S含义为“Sentence”。这个算符表示其两侧的检索词必须在同一自然句子(子字段)中出现,两词的词序可以颠倒。n放宽了词位置检索的要求,使表达同一概念但不满足词位置条件的文献也可以被检索出来,从而提高了查

27、全率。.36 以上介绍的各种位置算符,按照限制程度的大小,(W)、(nW)最强,(N)、(nN)次之,(S)再次之。当(nN)的n 10时,其作用已经相当于(S)。.37.38三、三、截词检索技术截词检索技术n含义:含义:用截断的词(词的片段)的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。n检索者将检索词在合适的地方截断,然后截出的片断进行检索。.39 原因原因:n由于西文的构词特性,在检索中经常会遇到名词由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性

28、质的前缀和后缀就可法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。以派生出许多意义相近的词等等。n为了保证查全,就得在检索式中加上这些具有各为了保证查全,就得在检索式中加上这些具有各种变化形式的相关意义的检索词,这样就会出现种变化形式的相关意义的检索词,这样就会出现检索式过于冗长,输入检索词的时间太久,同时检索式过于冗长,输入检索词的时间太久,同时也占太多机时。也占太多机时。.40截词的方式截词的方式 (1)按截断的字符数量来分:有限截断和无限截断)按截断的字符数量来分:有限截断和无限截断 有限截断:有具体截去的字符数。有限截断:有具体截去的字符数。无限截断:不指明具体

29、截去的字符数。无限截断:不指明具体截去的字符数。(2)按截断的位置区分:后截断、前截断以及中间截断。)按截断的位置区分:后截断、前截断以及中间截断。(3)截断常使用截断符号,各检索系统所使用的截断符)截断常使用截断符号,各检索系统所使用的截断符号有所不同,常用的符号有号有所不同,常用的符号有“?”,“”,“”以以及及“*”。以下举例中用。以下举例中用“?”来表示有限截断,用来表示有限截断,用“*”表示无限截断。表示无限截断。注意:不同的数据库所用的截词符不一样,使用应先查注意:不同的数据库所用的截词符不一样,使用应先查 一下各数据库的帮助加以确认。一下各数据库的帮助加以确认。.411 后方截词

30、(后方截词(前方一致或右截断)n含义:含义:将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。(1 1)词尾的有限截断)词尾的有限截断n相同字符串后可能变化一个字符时,则在其后使用一个“?”、空格、再加一个“?”,常用来表示检索词的单复数变化。例如:例如:用system?可以查出sytem 和systems 的文献。n相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符。例如:例如:?表示两个字符,?表示三个字符,以此类推。.42(2)词尾的无限截断)词尾的无限截断n相同字符串后可能变化任何字符串时,则在其后使用一个“?”。这种方法可以查找

31、出含有相同字符串的所有检索词。例如:例如:comput?可查出compute,computer,computing,computation,computerisation 等。.43(3)后截词主要使用在如下)后截词主要使用在如下4个方面个方面n词的单复数,如词的单复数,如book?,?,potato?;?;n年代,如年代,如198?(?(80年代),年代),19?(?(20世纪);世纪);n作者,如用作者,如用Lancaster*可检出所有姓可检出所有姓Lancaster的作的作者;者;n同根词,如用同根词,如用biolog*,可检出,可检出biological、biologist、biol

32、ogy等同根词。等同根词。.44注意(1)有限截断比较精确,只检索出用户需要的词)有限截断比较精确,只检索出用户需要的词汇;汇;(2)使用时无限截断必须注意:词干不要太短,)使用时无限截断必须注意:词干不要太短,否则会检出许多无关的文献;否则会检出许多无关的文献;(3)应尽量选用不会引起误检的截断词。)应尽量选用不会引起误检的截断词。.452 中间截词中间截词(中间屏蔽)n将提问字符串中间的字符用符号代替,主要用于英式美式不同拼法的英文单词,或单复数不同的单词。n截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时。例如:“woman”和“women”,可用

33、“wom?n”代替;“defence”和“defense”可用“defen?e”代替。检索时为防止漏检可用中间屏蔽的检索方法:m?n wom?n organi?ation defen?e 当然使用中间屏蔽的方法也要注意是否可能误检其它词汇的 文献。.463 前截断(后方一致或左截断)前截断(后方一致或左截断)n前截断检索常用于前截断检索常用于复合词复合词。n例如:?例如:?computer表示表示minicomputer,microcomputers等。等。n前截断与后截断也可以组合起来使用。前截断与后截断也可以组合起来使用。例如:例如:*chemi*可以检出下列词汇可以检出下列词汇 chem

34、ical、chemistry、chemist、eletrochemical、electrochemistry、physicochemistry、thermochemistry等。等。.47四、字段限定检索四、字段限定检索n含义:限定检索词在数据库记录中的一个或几个含义:限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。字段范围内查找的一种检索方法。(规定的字段范(规定的字段范围内出现的信息方为命中信息的一种检索方法。)围内出现的信息方为命中信息的一种检索方法。)n适用于在已有一定数量输出记录的基础上,通过适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提

35、高检索结果指定字段的方法,减少输出篇数,提高检索结果的查准率。由于字段限制采用前缀和后缀的形式,的查准率。由于字段限制采用前缀和后缀的形式,又可称为前缀限制和后缀限制。又可称为前缀限制和后缀限制。.48限制检索主要有两种方式:限制检索主要有两种方式:字段检索字段检索利用字段进行限制,如题名、摘要、全文等利用字段进行限制,如题名、摘要、全文等 通常的字段限制范围的大小顺序是:通常的字段限制范围的大小顺序是:题名题名关键词关键词摘要摘要全文全文二次检索二次检索在前一次检索的结果中进行另一概念的检索在前一次检索的结果中进行另一概念的检索.49n通常数据库中可供检索的字段分为主题字段和非主题字段。通常

36、数据库中可供检索的字段分为主题字段和非主题字段。主题字段:题名(主题字段:题名(Title)、叙词()、叙词(Descriptor)、标)、标识词(识词(Identifier)、文摘()、文摘(Abstract)等;)等;非主题字段:作者(非主题字段:作者(Author)、文献类型)、文献类型(Document Type)、语种()、语种(Language)、出版年)、出版年份(份(Publication Year)等。)等。n注意:注意:各个检索系统所设立的字段是互不相同的,即使使各个检索系统所设立的字段是互不相同的,即使使用同一字段,也可能采用不同的字段代码,在进行字段检用同一字段,也可能

37、采用不同的字段代码,在进行字段检索时,应事先参阅系统及有关数据库的说明。索时,应事先参阅系统及有关数据库的说明。.50实例:实例:字段限定在字段限定在DIALOG联机检索系统中应用联机检索系统中应用1)基本字段限制基本字段限制 n含义:含义:基本字段主要是指题目、叙词、识别词和文摘四个字基本字段主要是指题目、叙词、识别词和文摘四个字段。基本字段限制的用法是在需要指定字段的检索词后加上段。基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符后缀运算符“/”和段码。和段码。n例如:例如:OPTICAL/TI AND FIBER/TI 指在题目字段中含这两个词的指在题目字段中含这两个词的记录。

38、记录。字段段码可以多个连用,中间加字段段码可以多个连用,中间加“,”例如:例如:FIB?/TI,DE 指在题目和叙词中查找指在题目和叙词中查找“fib”为词干的所有记录。为词干的所有记录。.512)辅助字段限制辅助字段限制 除基本字段以外的可检索字段都可成为辅助字段。辅助字段运算符的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符“=”。例如:AU=“Robert,S”在作者字段中含人名为Robert,S的记录。CS=作者单位字段;LA=语言字段,例如LA=ENGLISH 英语字段 JN=刊物名称字段;PY=年份字段 例如PY=1999.52l字段限定符字段限定

39、符nin 对某一指定数据项进行检索 如:computer in TIn=用于限定性字段的检索 如:LA=ENGLISHl通配符通配符 n*代替任意一个或多个字符 如:comput*in ABl范围运算范围运算n=,=如:PY=1997;PY1996;PY=1994.53五、原文检索技术五、原文检索技术n含义:含义:“原文原文”是指数据库中的原始记录,原文检是指数据库中的原始记录,原文检索即以原始记录中的检索词与检索词间特定位置关索即以原始记录中的检索词与检索词间特定位置关系为对象的检索。系为对象的检索。n 原文检索的运算方式,不同的检索系统有不同的规原文检索的运算方式,不同的检索系统有不同的规

40、定,其差别是:规定的运算符不同;运算符的职能定,其差别是:规定的运算符不同;运算符的职能和使用范围不同。和使用范围不同。.54n原文检索的运算符可以通称为位置运算符,其运原文检索的运算符可以通称为位置运算符,其运算符主要是以下算符主要是以下4个级别:个级别:1)记录级检索)记录级检索 要求检索词出现在同一记录中要求检索词出现在同一记录中 2)字段级检索)字段级检索 要求检索词出现在同一字段中要求检索词出现在同一字段中 3)子字段或自然句级检索)子字段或自然句级检索 要求检索词出现在同要求检索词出现在同一字段或同一自然句中一字段或同一自然句中 4)词位置检索)词位置检索 要求检索词之间的相互位置

41、满足要求检索词之间的相互位置满足某些条件某些条件.55n原文检索可以弥补布尔逻辑检索、截词方法检索的原文检索可以弥补布尔逻辑检索、截词方法检索的一些不足。运用原文检索方法,可以增强选词的灵一些不足。运用原文检索方法,可以增强选词的灵活性,部分地解决布尔检索不能解决的问题,从而活性,部分地解决布尔检索不能解决的问题,从而提高文献检索的水平和筛选能力。但是,原文检索提高文献检索的水平和筛选能力。但是,原文检索的能力是有限的。从逻辑形式上看,它仅是更高级的能力是有限的。从逻辑形式上看,它仅是更高级的布尔系统,因此存在着布尔逻辑本身的缺陷。的布尔系统,因此存在着布尔逻辑本身的缺陷。.56原文检索的位置

42、算符从检索的越来越宽泛的次序可依次排列如下:原文检索的位置算符从检索的越来越宽泛的次序可依次排列如下:(W)(N)(S)(F)原文检索的位置算符可以单独使用,也可以混合在一起使用,并且可原文检索的位置算符可以单独使用,也可以混合在一起使用,并且可以与布尔逻辑算符一起混合使用,以组成比较复杂的检索提问表达式。以与布尔逻辑算符一起混合使用,以组成比较复杂的检索提问表达式。系统在处理检索式时时,位置算符是从左到右运算的,因此用户在编系统在处理检索式时时,位置算符是从左到右运算的,因此用户在编制检索式时,应将最专指的位置算符放在前面。制检索式时,应将最专指的位置算符放在前面。例如:例如:redwood

43、(w)deck?(f)patio先处理先处理(w),再处理,再处理(f)位置算符。位置算符。n与逻辑算符结合在一起时,如果没有括号(括号优先处理),则位置与逻辑算符结合在一起时,如果没有括号(括号优先处理),则位置算符先于逻辑算符执行。算符先于逻辑算符执行。例如:例如:talent(w)child And school(w)education先处理先处理(w)算符,再处理算符,再处理”And”算符。算符。例如:例如:(gifted or talent)(w)(Child or Children)则先处理括号中则先处理括号中“Or”的运算,再处理的运算,再处理(w)的运算。的运算。.57六、扩检

44、与缩检六、扩检与缩检1 1)扩检)扩检n含义:指初始设定的检索范围太小,命中文献不多,需扩含义:指初始设定的检索范围太小,命中文献不多,需扩大检索范围的方法。大检索范围的方法。n扩检方法:扩检方法:概念的扩大概念的扩大 范围的扩大范围的扩大 增加同义词增加同义词 年代的扩大年代的扩大 .58(1 1)考虑同义词或近义词(使用布尔逻辑符)考虑同义词或近义词(使用布尔逻辑符oror连接)连接)(2 2)选择较大检索范围的字段如摘要)选择较大检索范围的字段如摘要(3 3)使用截词符)使用截词符(4 4)使用上位词()使用上位词(如飞行器如飞行器航天飞机航天飞机载人航天飞机载人航天飞机).592 2)

45、缩检(又称二次检索)缩检(又称二次检索)n含义:缩检是指开始的检索范围太大,命中文献太含义:缩检是指开始的检索范围太大,命中文献太多,或查准率太低的一个方法。多,或查准率太低的一个方法。n缩检方法:缩检方法:概念的缩小概念的缩小 范围的限定范围的限定 年代的减少年代的减少 核心概念的限定核心概念的限定 语种的限定语种的限定 特定期刊的限定。特定期刊的限定。经过一次检索后经过一次检索后在上一次检索结果在上一次检索结果的范围内进行再次的范围内进行再次检索检索.60(1)(1)使用使用and and、notnot等限制检索范围等限制检索范围(2)(2)使用位置算符使用位置算符(3)(3)选择检索范围

46、较小的字段选择检索范围较小的字段(4)(4)使用二次检索使用二次检索(5)(5)使用下位词使用下位词(6)(6)使用精确检索,如对于固定短语来说可用使用精确检索,如对于固定短语来说可用“”“”引起来引起来.61总结:总结:构造专业检索式构造专业检索式选择检索字段选择检索字段(以(以CNKI为例)为例)跨库专业检索支持对以下检索字段的检索:跨库专业检索支持对以下检索字段的检索:SU=主题主题,TI=题名题名,KY=关键词关键词,AB=摘要摘要,FT=全全文文,AU=作者作者,FI=第一责任人第一责任人,AF=机构机构,JN=中文刊中文刊名名&英文刊名英文刊名,RF=引文引文,YE=年年,FU=基

47、金基金,CLC=中中图分类号图分类号,SN=ISSN,CN=统一刊号统一刊号,IB=ISBN,CF=被引频次被引频次.62总结:总结:构造专业检索式构造专业检索式使用运算符构造表达式(以使用运算符构造表达式(以CNKI为例)为例)运算符运算符检索功检索功能能检索含义检索含义举例举例适用检索项适用检索项=str1*str2并且包含包含str1和str2TI=转基因*水稻所有检索项=str1+str2或者包含包含str1或者str2TI=转基因+水稻=str1-str2不包含包含str1不包含str2TI=转基因-水稻=str精确精确匹配词串strAU=袁隆平作者、第一责任人、机构、中文刊名&英文

48、刊名=str/SUB N序位包含第n位包含检索词strAU=刘强/SUB 1%str包含包含词str或str切分的词TI%转基因水稻全文、主题、题名、关键词、摘要、分类号=str包含包含检索词strTI=转基因水稻.63总结:总结:构造专业检索式构造专业检索式使用运算符构造表达式(以使用运算符构造表达式(以CNKI为例)为例)运算符检索功能举例适用检索项=str1/SEN N str2 同段,按次序出现,间隔小于同段,按次序出现,间隔小于N句句FT=转基因转基因/SEN 0水稻水稻 主题、题主题、题名、关键名、关键词、摘要、词、摘要、分类号分类号=str1/NEAR N str2 同句,间隔小

49、于同句,间隔小于N个词个词AB=转基因转基因/NEAR 5 水稻水稻=str1/PREV N str2 同句,按词序出现,间隔小于同句,按词序出现,间隔小于N个个词词AB=转基因转基因/PREV 5 水稻水稻=str1/AFT N str2 同句,按词序出现,间隔大于同句,按词序出现,间隔大于N个个词词AB=转基因转基因/AFT 5 水稻水稻=str1/PEG N str2 全文,词间隔小于全文,词间隔小于N段段AB=转基因转基因/PEG 5 水稻水稻=str$N 检索词出现检索词出现N次次TI=转基因转基因$2使用使用“AND”、“OR”、“NOT”等逻辑运算符,等逻辑运算符,“()”符号将

50、表达式按照检索目标组合起来。符号将表达式按照检索目标组合起来。.64总结:总结:构造专业检索式构造专业检索式在在CNKI中的注意事项中的注意事项 n所有符号和英文字母,都必须使用英文半角字符;所有符号和英文字母,都必须使用英文半角字符;n“AND”、“OR”、“NOT”三种逻辑运算符的优先级相三种逻辑运算符的优先级相同;如要改变组合的顺序,请使用英文半角圆括号同;如要改变组合的顺序,请使用英文半角圆括号“()”将将条件括起;条件括起;n逻辑关系符号逻辑关系符号(与(与(AND)、或()、或(OR)非()非(NOT)前后)前后要空一个字节;要空一个字节;n使用使用“同句同句”、“同段同段”、“词

51、频词频”时,需用一组西文单时,需用一组西文单引号将多个检索词及其运算符括起,引号将多个检索词及其运算符括起,如:如:流体流体#力学力学;.65检索实例检索实例n例例1n要求检索钱伟长在清华大学或上海大学时发表的文章。要求检索钱伟长在清华大学或上海大学时发表的文章。n检索式:检索式:AU=钱伟长钱伟长 and(AF=清华大学清华大学 or AF=上海大上海大学学)n例例2n要求检索钱伟长在清华大学期间发表的题名或摘要中都包要求检索钱伟长在清华大学期间发表的题名或摘要中都包含含“物理物理”的文章。的文章。n检索式:检索式:AU=钱伟长钱伟长 and AF=清华大学清华大学 and(TI=物理物理

52、or AB=物理物理).66Google 文献检索知识Google的使用偏好设置的使用偏好设置n网址:网址:http:/.hk/nhttp:/ n使用偏好使用偏好(Preferences)中文(简体)中文(简体)Chinese(simplified)每页显示结果数目每页显示结果数目50或或100。利用搜索引擎搜索时常会出现两种情况:利用搜索引擎搜索时常会出现两种情况:一一 是搜索到的结果太多,需要大精力寻找真正想要的结果是搜索到的结果太多,需要大精力寻找真正想要的结果;二二 是搜索到的结果太少,无法找到目标。是搜索到的结果太少,无法找到目标。.67我要检索我要检索n学前教育学前教育.68一次成

53、功的搜索,应该找到我们真正想要的信息,并排除我们不想要的信息。这就必须要求使用者掌握一定的方法和技巧。解决办法如下:n1、重新选择合适的检索词;n2、利用搜索引擎提供的高级搜索功能和人性化提示重新进行搜索;n3、使用逻辑语法辅助查找;n4、使用双引号进行精确查找;n5、有针对性地选择搜索引擎。下面我们将通过实例说明怎样通过Google有效地搜索,这些方法多数情况下也适用于其它搜索引擎。.691.逻辑逻辑“与与”搜索结果要求包含两个及两个以上关键词,用“+”连接,Google可用“空格”代替“+”。注意:这里的“+”号,是英文字符,而不是中文字符的“”。此外,操作符与作用的关键词之间,不能有空格

54、。n举例:学前教育-进展或综述n检索式:学前教育+综述2.逻辑逻辑“非非”n搜索结果要求不包含某些特定信息,用“-”连接关键词。注意:这里的“-”号,是英文字符,而不是中文字符的“”。此外,操作符与作用的关键词之间,不能有空格。n举例:查找包括学前教育但不含基础教育的文献n检索式:学前教育-基础教育.703.逻辑逻辑“或或”:搜索结果至少包含多个关键词中的任意一个,用“OR”连接。注意:小写的“or”,在查询的时候将被忽略为“空格”,这样上述的操作实际上变成了一次“与”查询。n举例:学前或特殊教育n检索式:学前教育OR 特殊教育4.其它语法其它语法n强调短语用英文的“”,如上文的“学前教育。n

55、一般不支持通配符:如*?但除以*治国外n检索词的大小写不敏感。如IVF与ivf,rat与 RATn忽略极常见的英文单词。如i,com,www,标点符号、,.。n如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。如搜索:+www+的历史 internet.71Google搜索引擎高级语法1.filetype:索引某一类文件(同一扩展名)n文件扩展名:pdf、ppt、doc、xls、rtf、swf、asp、jsp、php、html、shtml、xml、cfm、wks、lwp、wrin 举例:学前教育PDF、PPT。n检索式:学前教育 filetype:pdf filetype

56、:ppt2.inurl:检索出现在网页链接或网页名称中的关键词n主要用于专题检索:检索词一定要为某一大类的专有名词。如mp3、flash、cell、tissue、tumor、音乐、电影等。n举例:学前教育有关的动画专题内容n检索式:学前教育 inurl:flash OR inurl:swf 秋天不回来 王强 inurl:mp3 电影 越狱 inurl:rm OR inurl:mpg OR inurl:avi.723.site:检索词结果固定在特定类型的网站内。n网站域名内不能有任何“/”的目录后缀;网站频道只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。n举例:检索教育网内学前教育

57、的内容。n检索式:学前教育 site:4.intitle:检索词结果固定在网页标题栏。n网页标题,就是HTML标记语言title中之间的部分。网页设计把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。n举例:查找有关学前教育的研究n检索式:intitle:学前教育 intitle:preschool 最新 音乐 intitle:MTV 下载.735.index of/主页文件夹搜索索引,可突破网关和IP限制n“index of/”加关键词可以直接进入网站首页下的所有文件和文件夹中,不必通过HTTP形式,从而避免了那些网站的限制,作到了突破限制下

58、载。n检索式:突破图书馆 index of/inurl:lib index of/cnki index of/ppt index of/mp3 index of/swf index of/AVI index of/RMVB n搜索词:mpeg4 cnki rm movie jpg admin pdf doc wmv mdb mpg mtv asf vod rar video book ebook soft password music download6.罕见语法罕见语法nlink:加网址。用来检索所有链接到该网站的链接数。nrelated:加网页网址。检索与该网页内容相似的网站。ncache

59、:加网址,网页快照功能。info:nintext:加检索词。allintext:加检索词。ninanchor:加检索词。.74检索小贴士检索小贴士n一、知网和维普:一、知网和维普:*表示表示andand关系,关系,+表示表示oror的关系,前后不空格,需的关系,前后不空格,需要写等式。其中的符号要用英文状态输入。如主题要写等式。其中的符号要用英文状态输入。如主题=(=(高中高中+高中生高中生+中中学生学生)*(自主自主+主动主动)*(学习(学习+探究)探究)n二、万方、二、万方、science directscience direct、EBSCOhostEBSCOhost、web of sci

60、enceweb of science等都是用等都是用and orand or,前后要空格,不需要等号。如,前后要空格,不需要等号。如(buzz word or popular word(buzz word or popular word or hot word)and(liguistics)or hot word)and(liguistics)n三、搜索引擎三、搜索引擎googleschoolar googleschoolar 默认大写的默认大写的OR,and OR,and 就是空格。就是空格。所有的符号(包括所有的符号(包括=、*+和括号,引号)都必须英文状态输入。和括号,引号)都必须英文状态输入。中文数据库中没有引号的形式,只有英文数据库才有。中文数据库中没有引号的形式,只有英文数据库才有。截词符号截词符号*代表代表0 0到到N N,是后缀类的,如,是后缀类的,如teachteach*,可以代表可以代表teacherteachingteachersteacherteachingteachers等,而?可以将等,而?可以将womanwoman与与womenwomen都包含在都包含在内。内。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!