科技文献检索学习参考

上传人:无*** 文档编号:193226300 上传时间:2023-03-09 格式:PDF 页数:17 大小:634.78KB
收藏 版权申诉 举报 下载
科技文献检索学习参考_第1页
第1页 / 共17页
科技文献检索学习参考_第2页
第2页 / 共17页
科技文献检索学习参考_第3页
第3页 / 共17页
资源描述:

《科技文献检索学习参考》由会员分享,可在线阅读,更多相关《科技文献检索学习参考(17页珍藏版)》请在装配图网上搜索。

1、科技文献检索学习参考 Google 搜索从入门到精通 1.前言 “公欲善其事,必先利其器”。Internet 只有一个,而搜索引擎则有 N 多个。有搜索高手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容”。但是,对于普通人而言,掌握诸多搜索引擎的可能性似乎不大。用一两个相对强劲的具代表性的工具达到绝大多数搜索目的更为人们所迫切希望。不同的时期,涌现出不同的强者。就目前而言,我们非常幸运的有了 Google。2.摘要 本文简要的介绍了 Google 的基本搜索语法和高级搜索语法,Google 的特色功能,包括图片搜索、新闻组搜索和集成工具条等。简介 Google()是一

2、个搜索引擎,由两个斯坦福大学博士生Larry Page 与 Sergey Brin 于 1998 年 9 月发明,Google Inc.于 1999年创立。2000 年 7 月份,Google 替代 Inktomi 成为 Yahoo 公司的搜索引擎,同年 9 月份,Google 成为中国网易公司的搜索引擎。1998 年至今,Google 已经获得 30 多项业界大奖。Google 的成功得益于其强大的功能和独到的特点:Google 检索网页数量达 24 亿,搜索引擎中排名第一;Google 支持多达 132 种语言,包括简体中文和繁体中文;Google 网站只提供搜索引擎功能,没有花里胡哨的累

3、赘;Google 速度极快,年初时据说有 15000 多台服务器,200 多条T3 级宽带;Google 的专利网页级别技术 PageRank 能够提供准确率极高的搜索结果;Google 智能化的“手气不错”功能,提供可能最符合要求的网站;Google 的“网页快照”功能,能从 Google 服务器里直接取出缓存的网页;Google 具有独到的图片搜索功能;Google 具有强大的新闻组搜索功能;Google 具有二进制文件搜索功能(PDF,DOC,SWF 等)。4.搜索入门 要用 Google 做搜索,当然首先要进 Google 网站;第一次进入 Google,它会根据你的操作系统,确定语言

4、界面。需要提醒的是,Google 是通过 cookie 来存储页面设定的,所以,如果你的系统禁用 cookie,就无法对 Google 界面进行个人设定了。Google 的首页很清爽,LOGO 下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,假定你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎”,选中“搜索中文(简体)网页”选项,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。搜索:“搜索引擎”结果:已搜索有关搜索引擎的中文(简体)网页。共约有707,000 项查询结果,这是第 1

5、-10 项。搜索用时秒。仔细看一下搜索结果的前十项,就会发现绝大部分链接是搜索引擎本身,而不是对搜索引擎的或者搜索技巧方面的介绍。注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。5.初阶搜索 上例是最基本的搜索,即查询包含单个关键字的信息。但是,你可以发现,上例中,单个关键字“搜索引擎”,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢我们需要进一步缩小搜索范围和结果。搜索结果要求包含两个及两个以上关键字 一般搜索引擎需要在多个关键字之间加上“”,而Google无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得

6、的网页上有“搜索引擎”和“历史”两个关键字。示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页 搜索:“搜索引擎 历史”结果:已搜索有关搜索引擎 历史的中文(简体)网页。共约有78,600 项查询结果,这是第 1-10 项。搜索用时秒。用了两个关键字,查询结果已经从 70 多万项减少到 7 万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。怎么办呢删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。搜索结果要求不包

7、含某些特定信息 Google 用减号“-”表示逻辑“非”操作。“A B”表示搜索包含 A 但没有 B 的网页。示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页 搜索:“搜索引擎 历史-文化-中国历史-世界历史”结果:已搜索有关搜索引擎 历史-文化-中国历史-世界历史的中文(简体)网页。共约有 36,800 项查询结果,这是第 1-10项。搜索用时秒。我们看到,通过去掉不相关信息,搜索结果又减少了将近一半。第一个搜索结果是:搜索引擎直通车搜索引擎发展历史 搜索引擎直通车,.搜索引擎专业介绍站点.-14k-网页快照-类似网页 非常符合搜索要求。另外,第八

8、项搜索结果:463 搜索王 本站检索 整个网站 在此输入关键词.你的当前 位置:首页 Internet 搜索手册 搜索引擎的历史.-21k-网页快照-类似网页 也符合搜索要求。但是,10 个结果只有两个符合要求,未免太少了点。不过,在没有更好的策略之前,不妨先点开一个结果看看。点开的这个名为“搜索引擎发展历史”的网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关的。此外,搜索引擎似乎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,使搜索引擎深入人心的是“Yahoo”。了解了这些信息,我们就可以进一步的让搜索结果符合要求了。注意:这里的“”和“-

9、”号,是英文字符,而不是中文字符的“”和“”。此外,操作符与作用的关键字之间,不能有空格。比如“搜索引擎 -文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。搜索结果至少包含多个关键字中的任意一个 Google 用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有 B,要么同时有 A 和 B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关

10、键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。搜索:“搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo-文化”结果:已搜索有关搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo-文化的中文(简体)网页。共约有 8,400 项查询结果,这是第 1-10 项。搜索用时秒。我们看到,搜索结果缩小到 8 千多项,前 20 项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。注意:“与”操作必须用大写的“OR”,而不是小写的“or”。在上面的例子中,我介绍了搜

11、索引擎最基本的语法“与”“非”和“或”,这三种搜索语法 Google 分别用“”(空格)、“-”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。6.杂项语法 通配符问题 很多搜索引擎支持通配符号,如“*”代表一连串字符,“”代表单个字符等。对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用 引起来。比如,“以*治国”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。关

12、键字的字母大小写 Google 对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。搜索整个短语或者句子 Google 的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。示例:搜索关于第一次世界大战的英文信息。搜索:“world war I”结果:已向英特网搜索 world war i.共约有 937,000 项查询结果,这是第 1-10 项。搜索用时秒。搜索引擎忽略的字符以及强制搜索 Google 对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”

13、等,作忽略处理。示例:搜索关于 www 起源的一些历史资料。搜索:“www 的历史 internet”结果:以下的字词因为使用过于频繁,没有被列入搜索范围:www 的.已搜索有关 www 的历史 internet 的中文(简体)网页。共约有 75,100 项查询结果,这是第 1-10 项。搜索用时秒。我们看到,搜索“www 的历史 internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索“www 的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史

14、”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www 的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。搜索:“+www+的历史 internet”结果:已搜索有关+www+的历史 internet 的中文(简体)网页。共约有 25,000 项查询结果,这是第 1-10 项。搜索用时秒。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war I”中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。搜索:“www 的历史 internet”结

15、果:已搜索有关 www 的历史 internet 的中文(简体)网页。共约有 7 项查询结果,这是第 1-6 项。搜索用时秒。我们看到,这一搜索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。7.进阶搜索 上面已经探讨了 Google 的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。对搜索的网站进行限制“site”表示搜索结果局限于某个具体网站或者网站频道

16、,如“、“,或者是某个域名,如“”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。示例:搜索中文教育科研网站()上关于搜索引擎技巧的页面。搜索:“搜索引擎 技巧 site:”结果:已搜索有关搜索引擎 技巧 site:的中文(简体)网页。共约有 608 项查询结果,这是第 1-10 项。搜索用时秒。示例:上着名 IT 门户网站 ZDNET 和 CNET 搜索一下关于搜索引擎技巧方面的资讯。搜索:“search engine tips site:OR site:结果:已在内搜索有关 search engine tips OR site:的网页。共约有 1,040

17、项查询结果,这是第 1-10 项。搜索用时秒。注意,在这里 Google 有个小 BUG。“已在内搜索”,其实应该表述成“已在和内搜索”。示例:搜索新浪科技频道中关于搜索引擎技巧的信息。搜索:“搜索引擎 技巧 site:结果:已在搜索有关搜索引擎 技巧 的中文(简体)网页。共约有 163 项查询结果,这是第 1-10 项。搜索用时秒。注意:site 后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。在某一类文件中查找信息“filet

18、ype:”是 Google 开发的非常强大实用的一个搜索语法。也就是说,Google 不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google 已经能检索微软的 Office文档如.xls、.ppt、.doc,.rtf,WordPerfect 文档,Lotus1-2-3文档,Adobe 的.pdf 文档,ShockWave 的.swf 文档(Flash 动画)等。其中最实用的文档搜索是 PDF 搜索。PDF 是 ADOBE 公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google 检索的 PDF 文档大约有 2500 万左右,大约占所有索引的二进制文档数量

19、的 80。PDF 文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。示例:搜索几个资产负债表的 Office 文档。搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt”结果:已搜索有关资产负债表 filetype:doc OR filetype:xls OR filetype:ppt 的中文(简体)网页。共约有 481 项查询结果,这是第 1-10 项。搜索用时秒。注意,下载的 Office 文件可能含有宏病毒,谨慎操作。示例:搜索一些关于搜索引擎知识和技巧方面的PDF 文档 搜索:“search engine tips

20、OR tutorial filetype:pdf”结果:已向英特网搜索 search engine tips OR tutorial filetype:pdf.共约有 12,600 项查询结果,这是第 1-10 项。搜索用时秒。我们来看其中的一个结果:PDFSearch Engines Tips 文档类型:PDF/Adobe Acrobat-HTML 版.See what people are searching on at *Search Engine Watch Some free tips.-类似网页 可以看到,Google 用PDF来标记这是一个 PDF 的文档检索,另外,它还给出了该

21、 PDF 文档的 HTML 版本,该 HTML 版保留了文档的文字内容和结构,但没有图片。搜索的关键字包含在网页标题中“intitle”和“allintitle”的用法类似于上面的inurl 和allinurl,只是后者对 URL 进行查询,而前者对网页的标题栏进行查询。网页标题,就是 HTML 标记语言 title 中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。示例:查找日本明星藤原纪香的照片集。搜索:“intitle:藤原纪香 写真集”结果:已搜索有关 intitle:藤原纪香 写真集的中文(简体)

22、网页。共约有 315 项查询结果,这是第 1-10 项。搜索用时秒。8.图片搜索 Google 自称可以检索 390,000,000 张图片,并称自己为“互联网上最好用的图像搜索工具”。从使用结果来看,的确不错,但个人以为比 AltaVista 的还是要差一些,主要体现在检索图片数量比不上 AV,匹配度比 AV 的图片搜索器也差了些。但 AltaVista国内用户无法正常访问,因此对中国用户而言,Google 的图片搜索引擎已经是最好的了。Google 首页点击“图像”链接就进入了 Google 的图像搜索界面“。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”

23、,就会搜索到大量的小甜甜布兰妮的图片。我目前尚不是很清楚图片的排列标准,不过以观察来看,似乎图片文件名完全符合关键字的结果排列比较考前,然后才按照普通的页面搜索时的标准排列。Google 给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。Google 图像搜索目前支持的语法包括基本的搜索语法如“”、“-”、“OR”、“site”和 “filet

24、ype:”。其中“filetype:”的后缀只能是几种限定的图片类似,如JPG,GIF等。示例:查找新浪网上本拉登的图片 搜索:“拉登 OR 拉丹 site:结果:搜索有关 拉登 OR 拉丹 site:的图片。共有 6 项查询结果,这是第 1-6 项。搜索用时秒。这里我想说明一点的是,作为专门的图片搜索引擎,实际上有其特殊的用途。举个例子,互联网上本拉登的照片成千上万,但是,它们都是分散的,往往随机的分布于各种新闻报道中。如果用搜索图片库的方式(最容易想到的如“Ben Ladin photo”),来搜索本拉登的照片,显然是不恰当的,因为很少有人专门为拉登建一个在线相册。在这个时候,就派上用场了

25、。但是,如果查找的图片在网上有很多主题“gallary”,如诸多电影电视明星的照片,则明显就不适合用来查找了。对于很多报纸杂志的编辑,绝对是一个雪中送炭式的工具。比如要在某个版面上插一张专题图片,用 google 的图片搜索功能几秒钟就可以搞定。综上,可以有这样的一般性结论:如果要搜索的图片是分散的,则用 google 图片搜索;如果要搜索的图片通常是处于某个图片集合中的,则不适合用 google 图片搜索。的其他杰出功能 网页快照 网页快照是抓下来缓存在服务器上的网页。它有三个作用:第一,如果原地址打开很慢,那么可以直接查看Google 缓存页面,因为 Google 服务器速度极快。第二,如

26、果原链接已经死掉或者因为网络的原因暂时链接不通,那么可以通过 Google 快照看到该页面信息。当然,快照内容不是该页最新页面。第三,如果打开的页面信息量巨大,一下子找不到关键词所在位置,那么可以通过 Google 快照,因为快照中 Google 用黄色表明关键字位置。集成化的工具条 为了方便搜索者,Google 提供了工具条,集成于浏览器中,用户无需打开 Google 主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在Google 主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装Google

27、的工具条,可以访问“,按页面提示可以自动下载并安装。不过,目前只支持以上版本。对于经常进行网络搜索者而言,Google 工具条实在是必备的东西!单词英文解释 写英文文章的时候,最头疼的事情就是对某个英文单词的用法不确定。现在有了 Google,一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法,均可使用在线词典。进入英文 Google,输入你要查的单词。举个例子,我想查一下 suggest 的用法。结果如下:“Searched the web for suggest.Results 1-10 of about 8,000,000.Search took seconds.”注

28、意看上面句子中,单词suggest 下出现了一个横线,点击这个链接,就跳转到另外一个网站“,Google 已经把单词提交给该网站的查询脚本。看看这个网站所提供的详尽解释吧。:)网页翻译 你懂英文,但是你不见得就懂德文、法文、拉丁文。如果搜索出来的页面是这些语言怎么办呵呵,Google 提供了网页翻译功能!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个杰出功能。试着做以下搜索:“big bang site:fr”。这个表示查找关于宇宙大爆炸的法文网页。看第一条结果:The Big Bang Website-Translate this page .A pro

29、pos de Big Bang.Le dernier numro en date.Les anciens numros.Autres activits.Concerts progressifs en France.Emissions de radio.Liens.-3k-Cached-Similar pages 有点晕。没关系,点击“Translate this page”按钮。再看结果,嗯,大致能看明白,这原来是个叫“big bang”的乐队的网站,与大爆炸无关.机器翻译是一个很前沿的人工智能课题,想指望翻译出来的结果跟专门用英语撰写的内容是不可能的。但西文间的互相转译比中英文机译强得多得多

30、了。至少能看明白。单词纠错 笔者记忆力很差,英文单词经常拼写错误。但Google 有纠错功能。比如在写上文的时候,我要用到英文单词“tutorial”,我只是依稀记得好像是“tatorial”的样子,但不肯定,于是用Google查 了 一 下,它 马 上 提 醒:“您 要 找 的 会 不 会 是:tutorial”,呵呵,正是这个单词。繁简转换 对中文用户而言,常希望能同时检索繁体和简体信息。Google能做到这一点。Google 默认使用繁简自动转换功能,因此你输入的简体关键字也将被转换成繁体做检索。这样省了不少力气。当然,如果你不希望这样的话,也可以在“使用偏好”中把这个选项关掉。搜索结果过滤 网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,Google 新设立了成人内容过滤功能,见 Google 的设置页面,最底下有一个选项 SafeSearch Filtering。不过,中文状态下的 Google 尚没有这个功能。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!