信息检索技术讲义

上传人:沈*** 文档编号:224144357 上传时间:2023-07-26 格式:PPTX 页数:83 大小:550.26KB
收藏 版权申诉 举报 下载
信息检索技术讲义_第1页
第1页 / 共83页
信息检索技术讲义_第2页
第2页 / 共83页
信息检索技术讲义_第3页
第3页 / 共83页
资源描述:

《信息检索技术讲义》由会员分享,可在线阅读,更多相关《信息检索技术讲义(83页珍藏版)》请在装配图网上搜索。

1、专题二:专题二:信息检索技术信息检索技术本专题内容本专题内容第一节布尔逻辑检索第一节布尔逻辑检索第二节截词检索第二节截词检索第三节位置检索第三节位置检索第四节限定检索第四节限定检索第五节全文检索第五节全文检索第六节引文检索第六节引文检索第一节布尔逻辑检索第一节布尔逻辑检索一一.布尔逻辑运算符布尔逻辑运算符二二.布尔逻辑运算符的运算次序布尔逻辑运算符的运算次序三三.布尔表达式编制注意事项布尔表达式编制注意事项四四.布尔检索表达式的特点(优缺点)布尔检索表达式的特点(优缺点)检索单元检索单元单元词检索单元词检索?Scomputer 1 3000 computer多元词检索多元词检索?Sinform

2、ation retrieval 2 1300 information retrieval一一.布尔逻辑运算符布尔逻辑运算符布尔逻辑检索的布尔逻辑表达式是采用布尔逻辑运算布尔逻辑检索的布尔逻辑表达式是采用布尔逻辑运算符(符(逻辑与逻辑与“and”“and”、逻辑或逻辑或“or”“or”、逻辑非逻辑非“not”“not”)来连接运算分量(检索词),以及)来连接运算分量(检索词),以及表示运算表示运算优先级的括号优先级的括号组成的一种表达检索要求的一种算式,组成的一种表达检索要求的一种算式,简称提问逻辑式。简称提问逻辑式。逻辑与逻辑与“and”“and”逻辑或逻辑或“or”“or”逻辑非逻辑非“no

3、t”“not”逻辑或逻辑或“or”A or B ;A+B信息源中含有检索词信息源中含有检索词A A或或B B的所有信息均为命中的所有信息均为命中对象。对象。逻辑或可以实现扩检,增强检全率逻辑或可以实现扩检,增强检全率ABAB AB布尔或关系文氏图逻辑与逻辑与“and”A and B;A*B同时含同时含A、B两个检索词的信息为命中信息。两个检索词的信息为命中信息。逻辑与运算,可以增强查找的专指性,提高检逻辑与运算,可以增强查找的专指性,提高检准率。准率。布尔与关系文氏图AB ABA AB B逻辑非逻辑非“not”A not B ;AB;B*A逻辑非运算是一种排除性运算,逻辑非运算必须与逻逻辑非运

4、算是一种排除性运算,逻辑非运算必须与逻辑与运算同时使用。辑与运算同时使用。在实际检索中,常常在一个检索中间结果中使用在实际检索中,常常在一个检索中间结果中使用“非非”运算,用来排除指定的其中某类文献,以提高检索的运算,用来排除指定的其中某类文献,以提高检索的查准率。查准率。ABAB AB布尔非关系文氏图二二.布尔逻辑运算符的运算次序布尔逻辑运算符的运算次序对于一个布尔检索逻辑表达式,计算机对于一个布尔检索逻辑表达式,计算机的处理总是从左向右进行的,遵循四则的处理总是从左向右进行的,遵循四则运算;运算;对于运算符对于运算符or,and,not,它们的运算优先次它们的运算优先次序在不同的系统中有着

5、不同的规定:序在不同的系统中有着不同的规定:DIALOG:notandor对同一个布尔逻辑提问式来说,不同的对同一个布尔逻辑提问式来说,不同的运算次序将会产生不同的检索结果。运算次序将会产生不同的检索结果。练习练习练习练习1 1有关上海市内的河流污染的文献。有关上海市内的河流污染的文献。A A上海市内上海市内 B B河流河流 C C污染污染练习练习2 2 对日本对日本与与美国的军队信息化建设方面进行比较的文献。美国的军队信息化建设方面进行比较的文献。A A日本日本 B B美国美国 C C军队信息化建设军队信息化建设 练习练习3 3 有关日本有关日本或者或者美国的军队信息化建设方面的文献。美国的

6、军队信息化建设方面的文献。A A日本日本 B B美国美国 C C军队信息化建设军队信息化建设练习练习4 4 有关除了大米有关除了大米以外以外的谷物进口的文献的谷物进口的文献 A A谷物谷物 B B大米大米 C C进口进口 三三.布尔表达式编制中的注意事项布尔表达式编制中的注意事项(1 1)概念整体与部分的关系)概念整体与部分的关系(2 2)慎用)慎用“not”“not”(3 3)布尔逻辑算符的使用技巧)布尔逻辑算符的使用技巧(1 1)概念整体与部分的关系)概念整体与部分的关系例如例如“检索关于欧洲能源问题的文献检索关于欧洲能源问题的文献”欧洲欧洲(Europe););能源能源(Energy)E

7、urope*Engergy*概念检索(同义扩展、相关概念的联想)概念检索(同义扩展、相关概念的联想)(Europe+Britain+France+Italy+Spain+)*(Energy+coal+petroleum+natural gas+)练习练习查找查找“有关上海市内的河流污染的文献。有关上海市内的河流污染的文献。”A上海市内;上海市内;B河流;河流;C污染污染n (上海市+黄埔区+卢湾区+)*(河流+黄埔江+苏州河+暗沟)*污染(2)慎用慎用“not”避免将非运算和或运算一起使用,否则将会再避免将非运算和或运算一起使用,否则将会再现滥检现象。现滥检现象。检索逻辑检索逻辑notnot慎

8、用,否则会检索失败。慎用,否则会检索失败。例如:例如:NOT 计算机计算机 OR 软件软件military aircraft NOT aircraft(computer+software)NOT harware(3 3)布尔逻辑算符的使用技巧布尔逻辑算符的使用技巧当采用逻辑与当采用逻辑与“*”“*”连接检索词时,尽可能将连接检索词时,尽可能将出现频率低的词放在出现频率低的词放在“*”“*”之前,其目的是为之前,其目的是为了使否定的答案尽早排除。了使否定的答案尽早排除。(要求较高的查准(要求较高的查准率)率)采用逻辑或采用逻辑或“+”“+”连接检索词时,将出现频率连接检索词时,将出现频率高的词放

9、在高的词放在“+”“+”之前,确保命中答案尽早出之前,确保命中答案尽早出现。现。(保证较高的查全率)(保证较高的查全率)四四.布尔检索表达式的特点布尔检索表达式的特点优点:优点:与思维习惯一致与思维习惯一致查找出有关某一主题的文献查找出有关某一主题的文献同时包含主题同时包含主题A A和主题和主题B B的文献的文献主题主题A A和主题和主题B B只要有一种即可只要有一种即可获得主题获得主题A A的文献,但排除其中含有主题的文献,但排除其中含有主题B B的文献的文献表达方式直观清晰表达方式直观清晰方便扩检与缩检方便扩检与缩检增加逻辑或增加逻辑或(扩检扩检)增加逻辑与增加逻辑与(缩检缩检)缺点缺点检

10、索输出量难以控制;检索输出量难以控制;检索结果不能根据用户的检索需求按重要程度检索结果不能根据用户的检索需求按重要程度顺序排序输出;顺序排序输出;对于文献描述与布尔查询中的词汇无重要层次对于文献描述与布尔查询中的词汇无重要层次之分;之分;过分依赖于检索用词,检索效果不甚理想。过分依赖于检索用词,检索效果不甚理想。布尔逻辑检索小结布尔逻辑检索小结布尔检索技术一直是信息检索系统采用的主要布尔检索技术一直是信息检索系统采用的主要检索技术之一。检索技术之一。布尔逻辑检索反映了检索词之间的逻辑关系,布尔逻辑检索反映了检索词之间的逻辑关系,属于一种定性的信息检索技术,这种定性检索属于一种定性的信息检索技术

11、,这种定性检索难以分辨出检索结果之间的重要程度。难以分辨出检索结果之间的重要程度。严格的二值逻辑判断,使单纯布尔逻辑检索的严格的二值逻辑判断,使单纯布尔逻辑检索的结果缺乏结果缺乏“量量”的比较。的比较。第二节截词检索第二节截词检索(模糊检索)(模糊检索)截词检索截词检索利用检索词的词干或不完整的词形进行检索。利用检索词的词干或不完整的词形进行检索。在检索标识中保留相同部分,用相应的截词在检索标识中保留相同部分,用相应的截词符符(?#:$)代替可变化部分进行的检索。代替可变化部分进行的检索。截词检索类型截词检索类型(一)按截断字符数量分:有限截断;无限截断(一)按截断字符数量分:有限截断;无限截

12、断(二)按截词位置分:左截断;右截断;中间截断(二)按截词位置分:左截断;右截断;中间截断词干后至多跟与截字符相同的字符数nDIALOG nchild?nchild+children+nchildish+childlikenORBITn child#nBRSnchild$4(一)按截断字符数量分(一)按截断字符数量分(1)有限截断有限截断(Limited Truncation)有限截断一个字符nDIALOG ntechnique?ntechnique+techniquesnORBITn technique#nBRSntechnique$1?S au=pauling,l?pauling,l+pa

13、uling,linus+pauling,linus c+pauling,linus carling?S py=199?检出文档中所有检出文档中所有2020世纪世纪9090年代出版的文献年代出版的文献S pollut?pollutant+pollutants+pollute+polluting+pollution(2)(2)无限截断无限截断(unlimited truncation),也称,也称“开放式截断开放式截断”DIALOG中,词干后跟一个“?”ORBIT pollut:BRS pollut$(二二)按截断位置分按截断位置分(1)右截断右截断(right truncation)右截断主要用

14、于:右截断主要用于:词的单复数词的单复数 book?Child?同根词同根词color?作者作者 au=chamberlain,a?出版年出版年py=199?注意:注意:右截断截得过短易造成大量误检右截断截得过短易造成大量误检。ORBIT、BRS 有限和无限左截断有限和无限左截断;DIALOG无此功能。无此功能。#hydroxy (羟基羟基)dehydroxy+dihydroxy+hydroxy$2.hydroxydehydroxy+dihydroxy+hydroxy(2)左截断左截断(left truncation)举例举例magneticelectro-magneticelectromag

15、neticparamagneticthermo-magneticthermomagneticORBIT :magnetic BRS$.magnetic(3)中截断中截断(internal truncation)中截断中截断,也称嵌入式截词也称嵌入式截词organi?ationorganization+organisationwom?n?woman+womanly+women中截断主要用于中截断主要用于第一,单复数在词中元音上变化的情况第一,单复数在词中元音上变化的情况man men;goose geese第二,动词与名词拼写的不同第二,动词与名词拼写的不同advice advise第三,同一单

16、词英美拼写的差异第三,同一单词英美拼写的差异defense defenceORBITORBIT前后截词前后截词CHEMICALCHEMISTRYCHEMISORPRIONCHEMISTELECTROCHEMICALELECTROCHEMISTRYPHYSICOCHEMICALPHYSICOCHEMISTRYTHERMOCHEMICALTHERMOCHEMISTRY:CHEMI:主要联机系统拥有的截词功能主要联机系统拥有的截词功能联机系统右截断左截断左右同时截断中截断DIALOG有无无有ORBIT有有有有BRS有有无无截词检索的作用截词检索的作用扩大查找范围,提高检全率;扩大查找范围,提高检全率

17、;减少检索词的输入量,简化检索步骤,减少检索词的输入量,简化检索步骤,节省费用节省费用第三节位置检索第三节位置检索(邻近检索邻近检索)一一.概念及作用概念及作用二二.常用的位置逻辑算符常用的位置逻辑算符三三.位置算符的综合运算位置算符的综合运算四四.位置非算符位置非算符在美国商业与工业管理索引在美国商业与工业管理索引 ABI/INFORM查找有关查找有关“利用计算机犯罪利用计算机犯罪”的文献的文献ABI/INFORM(Copr.Data Courier Inc.)?scomputercrime 1 0 COMPUTER CRIME?sscomputer?andcrime?2 23428 COM

18、PUTER?3 1178 CRIME?4 300 2 AND 3?t4/4/1 4/4/1Scotland Yard to Battle Escalating Crime with Computerized Command and Control SystemAnonymousComputerworld v16n37 pp:18-19 Sep 13,1982The Metropolitan Police Force at Scotland Yard has installed a computerized command and control system.The system will p

19、lace Londons bobbies at the vanguard of modern computing and communications technology.When the system is fully operational,the police department will have direct connections with the Police National Computer for immediate access to such information as fingerprint records.一一.概念及作用概念及作用位置逻辑检索位置逻辑检索(P

20、roximity Searching)通过位置逻辑算符规定词间位置关系所进行通过位置逻辑算符规定词间位置关系所进行的检索。的检索。位置逻辑算符位置逻辑算符即邻接算符,是表示词间位置关系的符号即邻接算符,是表示词间位置关系的符号作用作用表达复杂概念;解决词表规范词数量不足和表达复杂概念;解决词表规范词数量不足和词表不全的困难;提高查找深度词表不全的困难;提高查找深度二二.常用的位置逻辑算符常用的位置逻辑算符(以以DIALOG为例为例)位置检索大致包括下列四种级别的检索:位置检索大致包括下列四种级别的检索:(一一)词位置检索词位置检索(二二)子字段或自然句级检索子字段或自然句级检索(三三)字段级检

21、索字段级检索(四四)记录级检索记录级检索(一一)词位置检索词位置检索(1)(W)或或()词位置顺序紧连词位置顺序紧连With表示表示(w)连接的两词相邻,词序不变。两词之间连接的两词相邻,词序不变。两词之间可有单个空格、标点符号(连字符)。可有单个空格、标点符号(连字符)。?ssolar(w)energy/?ssolar()energy可检得含有固定词组可检得含有固定词组“solar energy”的结果的结果?son(w)line可检出可检出on line或或on-line?sx(w)ray可检出可检出x-ray比较检全率比较检全率?s solar(w)energy?s solar ener

22、gy?s solar and energy(2)(nW)位置顺序隔词位置顺序隔词(nWord)(nW),表示,表示(nW)所联接的两词之间所联接的两词之间可含可含有有0n个词个词,两词次序不能颠倒。,两词次序不能颠倒。?slaw(2W)sea可以检出可以检出LAW OF THE SEA?scomputer(1W)communication可检出可检出:computer communication;computer and communication;computer for communication?sscomputer?(w)crime?S5 154 COMPUTER?(W)CRIME?8

23、202731682027316 Time Bandits Time Bandits Miksanek,Chris Miksanek,Chris Interface:Interface:Data Data Processing Processing Mgmt Mgmt v7n3 v7n3 pp:8 pp:8 Autumn 1982Autumn 1982 The cost of The cost of computer crimecomputer crime to US businesses will to US businesses will exceed$200 million in 1982

24、.Although theft of exceed$200 million in 1982.Although theft of computer time occurs in most data processing computer time occurs in most data processing(DP)centers,very few DP managers are aware of(DP)centers,very few DP managers are aware of9200305892003058Stop,Thief!/Trends to Eye in 92Stop,Thief

25、!/Trends to Eye in 92 Johnson,Bob Johnson,Bob Computerworld Computerworld v16n1 v16n1 pp:72-76 pp:72-76 Dec Dec 28,1991/Jan 28,1991/Jan 4,19924,1992 Because Because the the data data processed processed by by computers computers is is intangible,intangible,unlimited unlimited possibilities possibili

26、ties exist exist for for the the computer computer criminal criminal to to obtain,obtain,misuse,misuse,or or destroy destroy information information and,and,conceivably,conceivably,ruin ruin and and organization.organization.Recent Recent reports reports have have estimated estimated US US corporate

27、 corporate losses losses of of nearly nearly$100$100 million million because because of of computer-relatedcomputer-relatedcrimecrime;the the average average loss loss is is estimated estimated at at more more than than$600,000.$600,000.?ss computer?(1w)crime?ss computer?(1w)crime?S6 170 COMPUTER?(1

28、W)CRIME?S6 170 COMPUTER?(1W)CRIME?(3)(N)词位置紧连词位置紧连(Near)(N N)表示算符()表示算符(N N)两侧的检索词必须紧密相)两侧的检索词必须紧密相连,但两词次序可以颠倒。连,但两词次序可以颠倒。?sChemistry(N)Physics可检索到词组Chemistry Physics和和Physics Chemistry?sA(N)B(N)CABC;CAB;BAC;CBA(4)(nN)隔词运算隔词运算(nNear)(nN)表示表示(nN)两侧的检索词之间可拥有两侧的检索词之间可拥有0n个单词,且检索词的次序任意。个单词,且检索词的次序任意。?s

29、econom?(2N)recovery可检出economic recovery;recovery of the economy;recovery from economic troubles(二二)同子字段位置检索同子字段位置检索(1)(S)子字段内词运算子字段内词运算(subfield;sentence)(S)表示运算符要求参加运算的检索词必须出现表示运算符要求参加运算的检索词必须出现在同一子字段中,两词序不受限制,词间可含有在同一子字段中,两词序不受限制,词间可含有任意个词。子字段由数据库确定,可以是句子也任意个词。子字段由数据库确定,可以是句子也可以是段落。可以是段落。?sdata(S)

30、process*只要process,processing或processor和data存在于同一子字段中,即为命中。(2)(L)叙词字段检索叙词字段检索(link)(L)要求两检索词同在叙词字段要求两检索词同在叙词字段(DE)中出现,中出现,并且两词具有词表所规定的等级关系(从属关并且两词具有词表所规定的等级关系(从属关系)。系)。aircraft aircraft 主标题词主标题词 agricultural applications agricultural applications cabins cabins design design engines engines副标题词副标题词?sa

31、ircraft(L)cabins例子?s rubber(L)natural S11 23 RUBBER(L)NATURAL?t11/5/1 97093713 CA:97(12)93713a JOURNAL97093713 CA:97(12)93713a JOURNALDESCRIPTORDESCRIPTOR:RubberRubber,naturalnatural,properties,properties(三三)同字段位置算符同字段位置算符(F)同字段检索同字段检索(Field)要求(要求(F F)两侧的检索词必须出现在数据库的同)两侧的检索词必须出现在数据库的同一字段中,词序可变,字段类型可

32、用后缀符限一字段中,词序可变,字段类型可用后缀符限定。定。?senvironment?(F)impact/TITHE IMPACT ON THE ENVIRONMENT THE ENVIRONMENT IMPACT ON THE INDUSTRIAL(四四)同记录级位置检索同记录级位置检索(C)记录级记录级“与与”运算运算(Citation)要求各检索词出现在同一文献记录中,与布尔要求各检索词出现在同一文献记录中,与布尔算符算符“AND”“AND”作用相仿。作用相仿。?sremote(C)sensor?某记录标题中:REMOTE MANIPULATOR文摘中:HEAT SENSORS三三.位置

33、算符的综合运算位置算符的综合运算纯位置算符的运算顺序纯位置算符的运算顺序位置算符应按限制的强弱从左至右排列 (W)(N)(S)(L)(F)(C)位置算符和布尔算符混合使用DIALOG、BRS和 ESA:先做位置检索,再做布尔检索;ORBIT:先布尔检索,后位置检索。DIALOG检索执行的优先级排序检索执行的优先级排序括号括号(W)(N)(S)或或(L)(F)NOTANDOR说明运算次序说明运算次序?sredwood(w)deck?(f)patio?s(redwoodorpine)(w)(deck?orfloor)?s(librar?orinformation)()center?(f)(prod

34、uctivityorprofitability)四四.位置非算符位置非算符NOT反位置运算,作用正好与位置算符相反反位置运算,作用正好与位置算符相反(NOT W)(NOT nW)(NOT N)(NOT nN)(NOT F)(NOT S)(NOT L)?s cs=harvard(not s)cs=business“Bottom-Line”Bottom-Line”Management Management for for Public Public AgenciesAgenciesLynn,Lynn,Laurence Laurence E.Jr.E.Jr.HarvardHarvard Univ.U

35、niv.Kennedy Kennedy School School of of Government;Government;Seidl,Seidl,John John M.-Stanford M.-Stanford Univ.Univ.Graduate Graduate School School of of BusinessBusinessHARVARD BUSINESS REVIEW,J/Feb 1977,p.144HARVARD BUSINESS REVIEW,J/Feb 1977,p.144DOCUMENT TYPE:HBR ARTICLEDOCUMENT TYPE:HBR ARTIC

36、LE?s soybean industry(NOT L)(Japan OR United States)题名题名:Grain legumes production in Asia DE:Bean industry-Asia-Congresses;Legume industry-Asia-Congresses;Soybean industry-Asia-Congresses;Peanut industry-Asia-Congresses;Grain trade-Asia-Congresses?spig?(NOTN)GuineaInternalparasitismoffeederpigsinsou

37、thernIllinois.Pig rearing and the domesticationprocess in New Guinea and TorresStraitregion第四节限定检索第四节限定检索一、字段限定检索一、字段限定检索字段限定字段限定把检索词限定在特定字段中,以缩小文献查把检索词限定在特定字段中,以缩小文献查找的范围。找的范围。?s television?s television/tiDIALOG数据库所有数据库所有查找选项查找选项(一一)基本索引的后缀限定基本索引的后缀限定 /TI /AB /DE /DE*/ID /ID*/TX 用法:A.对检索词加单个或多个后缀s

38、tension/ti,de B.对用位置算符连接起来的检索字符串加单个或多个后缀s pop(w)top(f)can?/ti,abC.对用布尔算符连接的一组检索式加单个或多个后缀s(urban planning*transport)/s(urban planning*transport)/ti,abti,ab s contaminant?or pollutant?/s contaminant?or pollutant?/ti,deti,des budget?/tiD.对集合号加单个或多个后缀?sleukemia(白血病白血病白血病白血病)S1 15544 LEUKEMIAS1 15544 LEU

39、KEMIA?ss1(f)(catorfeline)/ti/ti/ti对整个检索式的限定对整个检索式的限定 7588 S1/TI 7588 S1/TI 5240 CAT/TI 5240 CAT/TI 572 FELINE/TI 572 FELINE/TI S2 93 S1(F)(CAT OR FELINE)/S2 93 S1(F)(CAT OR FELINE)/TITI后缀字段代码与集合号连用的两种情况:还没有被后缀代码限制过的集合号?sfiber+fibre S1 2301 FIBER+FIBRE?ss1/ti,de S2 1552 S1/TI,DE?s fiber+fibre S1 2301

40、 FIBER+FIBRE?ss1/ti,de S2 1552 S1/TI,DE?s s2/ti(不能用(不能用/ab限定)限定)S3 592 S2/TI前面已被一组字段代码所限制的集合号,可用其中某一字段进一步加以限制E.对扩展号进行后缀限定?Expand television/de,idTelevisionCircuit television;color television;satellite television;television cameras;television display systems;television systemsTelevision disease;telev

41、ision play;television news;television weeklyAUauthorCScorporate source DTdocument typeJN journal nameLA languagePY publication yearUD updateCC classification code RN=registry number of a chemical substance(二)辅助索引字段的前缀代码限定用法:1.简单用法A.和全字符串连用?s auJohnson,Robert R.B.和一个单词连用?s laGermanC.和截词符连用?s py=198?D

42、.和位置逻辑算符连用?s cs=milan?(f)cs=ital?E.和布尔算符连用?s jn=scientific Amer?and comput?/ti2.复杂用法?scs=general(w)cs=electric(f)cs=portlandWoodburn solar water heating systemInvestigators:Portland General Electric Company?scs=(general(w)electric(f)portland)?scs=(general(w)electricandportland)二二.其他限定检索其他限定检索(一)用限定指

43、令进行限定 limit(或(或L)和)和 limitall(或(或 lall)用来对已经检索出的结果记录,在输出打印之前根据用户的需求进一步加以某些限定,以缩小查找文献的范围。限定项目:文献记录存取号、语种、文献类型等。limit指令格式:L 集合号或检索项/限定项目?Slaservelocimeters S1 646 LASER VELOCIMETERSS1 646 LASER VELOCIMETERSLS1/Eng 把第一步检索出的文献限制在原文为英文的范围内把第一步检索出的文献限制在原文为英文的范围内 S2 545 S1/ENGS2 545 S1/ENG?Slaservelocimete

44、rs/eng(1)(1)对词对词(单元词和多元词)(单元词和多元词)的限定的限定(2)对整个检索式的限定?S urban planning and transport?S urban planning and transport?S1 S1 1034 1034 URBAN URBAN PLANNING PLANNING AND AND TRANSPORTTRANSPORT?L s1/maj L s1/maj *将检索结果限定在叙词字段的主要叙词中将检索结果限定在叙词字段的主要叙词中,相当于相当于/DE*/DE*S2 760 S1/MAJS2 760 S1/MAJ?S(urban plannin

45、g and transport?)/maj?S(urban planning and transport?)/maj 记录记录1 1LIGHT LIGHT RAIL RAIL TRANSIT TRANSIT DEVELOPMENT DEVELOPMENT IN IN THE UNITED STATES.THE UNITED STATES.DescriptorsDescriptors:*URBAN*URBAN PLANNING;*TRANSPORTATION;PLANNING;*TRANSPORTATION;RAILROAD RAILROAD TRANSPOTTAION-EFFICIENCY;T

46、RANSPOTTAION-EFFICIENCY;COST COST ACCOUNTING-ACCOUNTING-ANALYSISANALYSIS limitall或或 lall的用法的用法 将limitall后面所有的检索步骤都限定在指定的基本索引字段中进行。?limitall/de,tiLIMITALL started?s mozart and requiem?s mozart and requiem S1 16 MZART AND REQUIEMS1 16 MZART AND REQUIEM?t1/8/1Some unclarified questions concerning the h

47、istory of the completion of mozart s requiem DIALOG系统系统limitall检索实例检索实例(二二)限定出版年代限定出版年代(1)(1)用用“:”或或“toto”来表示年代范围来表示年代范围?s py=1992:py=1994?s py=1992:1994?s py=1992 to py=1994?s py=1992 to 1994?s management by objectives and py=1992:py=1994(2 2)年代的后缀限定)年代的后缀限定?ss1/1998?stelevision/1994-1987 or/1994:1

48、997?scaribbean(w)basin/1993-1996?ss2/2000:2003(三三)指定范围检索指定范围检索 范围算符“:”或“to”用于检索类目(节标题)代码、产品代码、出版年代或各种财政数据(如销售额、固定资产额等)以及检索集合号。例:在美国小公司名录(美国市场鉴别报告)数据库中查找所有年销售额在200万至1000万美元之间的公司?ssa=2000000:9999999?ssa=2000000:9999999 或者或者或者或者?ssa=2000000to9999999ssa=2000000to9999999 sselectricvehicles55sselectricveh

49、icles55sselectric(w)vehicles/de,id187sselectric(w)vehicles/de,id187sselectric(w)vehicles/de,id,ti315sselectric(w)vehicles/de,id,ti315sselectric(w)vehicles/ab488sselectric(w)vehicles/ab488sselectric(w)vehicles596sselectric(w)vehicles596sselectric(w)vehicle?637sselectric(w)vehicle?637sselectric(1w)veh

50、icle?721sselectric(1w)vehicle?721sselectric(s)vehicle?1010sselectric(s)vehicle?1010sselectric(f)vehicle?1930sselectric(f)vehicle?1930sselectric(c)vehicle?2215sselectric(c)vehicle?2215sselectri?(c)vehic?2793sselectri?(c)vehic?2793 比较检索查全率和查准率第五节全文检索第五节全文检索一一.全文检索概述全文检索概述二二.全文检索系统实现技术全文检索系统实现技术一一.全文检索

51、概述全文检索概述全文检索技术最早于全文检索技术最早于1959年美国匹兹堡大学卫年美国匹兹堡大学卫生法律中心建立的法律条文全文检索系统。生法律中心建立的法律条文全文检索系统。全文检索技术全文检索技术一种面向全文、提供全文的新型检索技术。它可以一种面向全文、提供全文的新型检索技术。它可以使用原文中任何一个有实际意义的词作为检索入口,使用原文中任何一个有实际意义的词作为检索入口,而且得到的检索结果是源文献而不是文献线索。而且得到的检索结果是源文献而不是文献线索。数据源是全文的;检索对象是全文的;采用的检索数据源是全文的;检索对象是全文的;采用的检索技术是全文的;提供的结果也是原文信息。技术是全文的;

52、提供的结果也是原文信息。全文检索基本概念全文检索基本概念全文数据库全文数据库全文检索技术:指对文献全文内容进行全文检索技术:指对文献全文内容进行字符串的匹配检索,包括字符串检索、字符串的匹配检索,包括字符串检索、截词检索、位置检索等等技术。截词检索、位置检索等等技术。全文检索系统全文检索系统全文检索系统特点全文检索系统特点系统制作效率高系统制作效率高词汇自然更新词汇自然更新专指性强专指性强查全率高查全率高检索者智力负担重检索者智力负担重二二.全文检索系统实现技术全文检索系统实现技术(1)(1)自动标引技术自动标引技术(2)(2)全文数据库文档索引全文数据库文档索引(3)(3)停用词表停用词表(

53、4)(4)优化查询算法优化查询算法(5)(5)数据压缩技术数据压缩技术引文检索引文检索本章总结本章总结布尔检索技术是信息检索系统采用的主要检索布尔检索技术是信息检索系统采用的主要检索技术之一,是一种定性检索,判断相关和不相技术之一,是一种定性检索,判断相关和不相关。关。截词检索技术使得检索更加灵活。截词检索技术使得检索更加灵活。位置检索是全文系统中最主要的检索技术,它位置检索是全文系统中最主要的检索技术,它是一种更高级的布尔逻辑检索,它把词间的位是一种更高级的布尔逻辑检索,它把词间的位置关系引入了布尔检索之中。置关系引入了布尔检索之中。限定检索可以大大节省检索时间,降低系统数限定检索可以大大节省检索时间,降低系统数据的传输,使命中结果更高程度上满足用户的据的传输,使命中结果更高程度上满足用户的检索要求。检索要求。熟练掌握各种检索技术具体用法。熟练掌握各种检索技术具体用法。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!