文献检索基础知识.ppt

上传人:xin****828 文档编号:20668380 上传时间:2021-04-11 格式:PPT 页数:31 大小:1,022.05KB
收藏 版权申诉 举报 下载
文献检索基础知识.ppt_第1页
第1页 / 共31页
文献检索基础知识.ppt_第2页
第2页 / 共31页
文献检索基础知识.ppt_第3页
第3页 / 共31页
资源描述:

《文献检索基础知识.ppt》由会员分享,可在线阅读,更多相关《文献检索基础知识.ppt(31页珍藏版)》请在装配图网上搜索。

1、,谭 业 武 2011年9月,信息检索与学科热点 问题调研 (2009级计算机科学与技术),谭 业 武 2011年9月,第三讲 文献检索基础知识,第 3 页,一、信息资源概论 1、 信息资源的概念 数据: 从现实事物中抽象出来的,用来描述现实事物特征的符号。 信息: 定义1:是经过收集、记录、处理,以能检索的形式存储的数据 定义2:人们所感知和表述的事物运动的状态和方式。 定义n 信息资源: 信息的内容以及与信息内容相关的: 信息技术数据库技术、网络技术、搜索引擎等 人员信息系统开发人员、信息系统管理人员、图书管理人员等 设备微机设备、网络设备等,第三讲 文献检索基础知识,第 4 页,一、信息

2、资源概论(续) 2、 信息资源的分类 (1)按加工层次划分 一次信息资源 未经他人加工和组织的,已公开发行的,作者的研究或工作成果为基础而创作形成的信息资源, 例如:期刊论文、会议论文、图书等。也称为“原始文献”。 一次信息资源特点是:详细、无序,是最基本的信息源和检索对象 二次信息资源 对一次信息资源进行加工,使之有序化而形成的信息资源。 例如:索引、文摘等 二次信息资源的特点是:有序化,容易被检索 三次信息资源 对一、二次信息资源进行综合分析、评价,进一步综合、浓缩形成的信息资源。 例如:词典、年检、百科全书等 三次信息资源的特点是:高度综合、信息量大。 零次信息资源 非公开发行的信息资源

3、(以上一、二、三次信息资源均指公开发行的信息资源)。 例如:手稿、笔录等。,第三讲 文献检索基础知识,第 5 页,一、信息资源概论(续) 讨论: 以下几种信息资源按加工层次划分分别属于几次信息资源? 我系某位老师在计算机工程杂志上发表的一遍论文 08级3班某位同学向06级某同学要来的计算机组成原理课程考研笔记 滨州年鉴 中国发明专利公报,第三讲 文献检索基础知识,第 6 页,一、信息资源概论(续) 2、 信息资源的分类(续) (2)按载体形式划分 印刷型 存储介质:纸张 优点:直接阅读 缺点:存储密度小,体积大 缩微型 存储介质:胶卷等 优点:存储密度大,体积小 缺点:借助特定设备阅读 音像型

4、 利用录音、录像等技术,直接将声音、图象等记录下来。 如:音像磁带、唱片等 这里主要指模拟信号 电子型 以数码方式将各种信息存储在磁、光、电介质上。这是目前大量使用的 如:磁盘、光盘等 是数字信号,第三讲 文献检索基础知识,第 7 页,一、信息资源概论(续) 2、 信息资源的分类(续) (3)按出版形式划分 图书 优点:系统、全面 缺点:出版周期长,传递信息慢。例如计算机图书 期刊 优点:周期短,信息量大(学术论文举例) 科技报告 研究人员经过对某个专题进行研究后撰写的研究报告。 有密级,发行范围严格控制 会议文献 在各类学术会议上产生的会议论文集 比期刊还能及时的反映最新学术动态 专利文献(

5、举例) 将科技信息与法律信息融为一体的,具有明显知识产权特征的文献资料 专利类型:发明专利、实用新型专利、外观设计专利,第三讲 文献检索基础知识,第 8 页,一、信息资源概论(续) 2、 信息资源的分类(续) (3)按出版形式划分(续) 学位论文 博士论文(举例) 硕士论文(举例) 学士论文(举例) 标准文献 人们在科研和生产过程中所遵循的共同的技术依据和原则,要经过权威机构验证和批准。 按使用范围可分为国际标准、国家标准、行业标准、企业标准等 谁掌握了标准,谁就掌握了话语权。一流企业做标准,二流企业做技术,三流企业做产品 国家标准化委员会: 全国信息技术标准化委员会: 例: 软件开发类国家标

6、准 软件工程国家标准,第三讲 文献检索基础知识,第 9 页,一、信息资源概论(续) 2、信息资源的分类(续) (3)按出版形式划分(续) 政府出版物 由各级政府出版发行的文献。例如政府法令、方正政策等 便于了解国家、各级政府的方针政策、发展规划、产业政策等 例:滨州市人民政府公报 政府网站: 产品资料 产品说明书等 报纸 新闻报道、评论等 信息量大,实时性强。,第三讲 文献检索基础知识,第 10 页,二、 信息资源检索 1、 信息资源检索的概念 信息检索: 将信息按一定的方式组织和存储起来,并根据用户需求找出相关信息的过程。 包含两个方面: 信息的组织和存储 信息查找为 三个主要环节: 对信息

7、内容进行分析和编码,产生信息记录和检索标识 组织和存储,将全部记录按文件、数据库的形式组成有序信息集合 根据特定检索提问,查找出需要的信息 课堂讨论: 以学校图书馆为例,说明信息检索的概念、环节 以班级电子档案系统为例,说明信息检索的概念、环节,第三讲 文献检索基础知识,第 11 页,二、 信息资源检索(续) 2、信息资源检索的分类 按检索内容划分 文献检索以文献为检索对象,包括: 书目检索检索文献线索,如文献的目录、文摘等 全文检索检索文献的全部(以图书或论文为例) 事实与数据检索以数据为检索对象,例如: 山东省的人口 北京师范大学的位置 李叔同的出生年月 按是否使用检索工具划分 直接检索

8、一次性文献检索,例如直接到书库中找书 间接检索 先利用检索工具获得文献线索,例如先通过索引库找到书的位置,再到书库找书 按检索手段划分 手工检索 现代检索(借助计算机、网络等现代手段),第三讲 文献检索基础知识,第 12 页,三、信息资源检索的基本原理 1、基本原理 信息资源检索包括: 信息的存储 信息的存储:是将收集到的一次信息,经过著录其特征(题目、作者、关键词等)而形成索引条目,将这些索引条目组织起来成为二次信息的过程 信息的检索 信息的检索:是针对已存储好的二次信息库,查找与某特定信息相匹配的信息资源。 信息存储与检索所依据的规则必须一致。 信息检索语言:信息存储与检索共同遵循的规则称

9、为信息检索语言 信息存储人员(标引者)与检索者要使用同一种信息检索语言 因此,信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个基本过程所采用的特征标识达到一致,以便有效地获取和利用信息资源。 检索系统例:图书馆的书目和索引,计算机检索系统如cnki、万方数据、维普咨询等,第三讲 文献检索基础知识,第 13 页,三、信息资源检索的基本原理(续) 1、基本原理(续),信息检索原理图,手工检索例:图书馆书目和索引系统 计算机检索例:CNKI,第三讲 文献检索基础知识,第 14 页,三、信息资源检索的基本

10、原理(续) 2、检索效果评价 检索效果: 用户向检索系统提交检索后,系统返回检索的结果的有效程度 评价检索效果的两个物理量是: 查全率 查准率,第三讲 文献检索基础知识,第 15 页,三、信息资源检索的基本原理(续) 2、检索效果评价(续) 例如:某一检索系统,有1000万条数据,其中含有“滨州市环境保护与治理”的文献2000条,在对该系统进行检索时,共检出数据3000条,其中与“滨州市环境保护与治理”相关的1500条,则: 查全率: =1500/2000=75% 查准率: =1500/3000=50% 影响查全率与查准率的因素(了解) 标引的影响 检索语言的影响 检索策略的优劣,第三讲 文献

11、检索基础知识,第 16 页,四、信息资源检索语言 1、检索语言的概念(理解) 一个实例:我系教学档案库建设 我系教学档案库包含的内容:各年级教学计划、各年级课程表、各年级学生成绩、各年级学生试卷、教师发表的文章、各类研究项目立项书、结项书、学生各类获奖、教师各类获奖、 我系教学档案库建设的目标:所有文档有序存储,以备以后随时调阅。例如:查一下2010年我系学生在“齐鲁大学生软件设计大赛”活动中的获奖情况。 实现原则之一:制定一个文档分类方案,建立教学档案库时按照这个分类方案建设,将来查阅时也按这个分类方案来查找 这个分类方案就是一种检索语言 检索语言: 表达1:人们在加工、存储、检索信息时所使

12、用的一种规则、标识符号等。 表达2:根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。检索语言是一种受控语言,它依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用 标引人员依据检索语言对文献进行整理、加工、存储于检索系统中,检索人员依据检索语言从检索系统中查找自己要的信息,第三讲 文献检索基础知识,第 17 页,四、信息资源检索语言(续) 2、检索语言的分类 分类语言按学科性质进行分类并排序 例:中国图书分类法共有二十二个基本大类,每个大类都用一个英文字母表示。如下所示:,第三讲 文献检索基础知识,主题语言 主题

13、检索语言是直接以代表文献内容特征作为检索标识,并按其外部形式(字顺)组织起来的一种检索语言。 如:如标题词,关键词等,第 18 页,五、信息资源检索技术 1、检索方法 顺查法 以课题的起始年代为起点,按时间顺序,由远及近系统地收集该课题的文献。 检索目的:了解该课题发展的全过程。 优点:漏检率低 缺点:工作量大 倒查法 从现在开始,由近及远,逆着时间顺序向前查找文献。检索重点在于近期文献,达到目的为止。 检索目的:把握课题的最新进展 优点:快速获得该课题最新的资料 缺点:容易造成漏检 抽查法 以课题研究最活跃的年代为检索的时间段 引文追溯法 通过文章后面所列参考文献目录的线索,查找所需信息。

14、综合法 将几种检索方法综合利用,第三讲 文献检索基础知识,第 19 页,五、信息资源检索技术(续) 2、检索技术 1、检索词与检索式 检索词:表示文献特征的标题、作者、关键词等。如:“传感网”、“RFID”等 检索式:直接面对检索系统的检索条件表达式,是要求检索系统执行的检索语句。 2、布尔检索 利用布尔逻辑算符检索,是现代信息检索最常用的方法 三种逻辑算符: 与 and 或 or 非 not 例如:“RFID”and“校园管理” 3、截词检索 根据西文的构词特性,用截断的词的一个局部进行检索,并认为凡满足这个词局部的所有字符串都为命中文献。 截词算符:不同检索系统不一样,一般用? 例: 后截

15、词:comput?表示computer,computers,computing等 前截词:?computer表示minicomputer,mocrocomputer等 中截词:?comput?表示minicomputer,microcomputers等,第三讲 文献检索基础知识,第 20 页,五、信息资源检索技术(续) 3、检索策略 举例: 滨州市教育局委托我们构建一个“滨州市中小学教师网络教学资源库(B/S结构)”。 在进行设计开发之前,首先要进行大量的文献调研,把握该课题当前国内研究状况。需要: 需要确定检索词(如:“网络教育”、“教学资源库”、“B/S结构”、“网络课程”等) 确定检索式

16、 选择检索数据库(CNKI、万方、维普或百度等其它搜索)等。 初步检索 调整检索,优化检索 获取检索结果 所以: 一个检索任务的执行一般是有过程、按步骤地有序完成。检索步骤的科学安排就是检索策略。 包括: 分析检索课题 确定检索词 确定检索式 选择检索工具及数据库 输出结果或索取原始文献,第三讲 文献检索基础知识,第 21 页,五、信息资源检索技术(续) 4、检索步骤: (1)分析检索课题,明确检索需求 课题检索的意图, 立项、论文开题,进行文献综述,要强调查“全” 鉴定、验收,要强调查“新” 分析课题所属学科 分析课题的文献类型(十大文献) 确定检索时间范围 (2)选择检索工具,了解检索系统

17、 CNKI、万方、维普 工具书 搜索引擎 中国专利库等专门网站 ,第三讲 文献检索基础知识,第 22 页,五、信息资源检索技术(续) 4、检索步骤: (3)确定检索词和检索途径 检索词的确定以“RFID在校园管理中的应用研究综述”为例 要准确,不要太宽泛。 本课题涉及“RFID”、“校园”、“管理”、“校园管理”、“应用”、“研究”、“综述”。如何取舍? 找出同义词及下位词,以保证查全率 “RFID”有一中文同义词?“管理校园”的同义词、下位词 检索途径 题名途径、关键词途径、文摘途径、作者途径、分类途径、 (4)编制检索式,实施检索策略 检索式是人机交流的语言,是要求计算机执行的语句(计算机

18、专业学生应当很好理解) 本课题:(RFID or 射频识别)and(学校管理 or 校园管理 or 宿舍管理),第三讲 文献检索基础知识,第 23 页,五、信息资源检索技术(续) 4、检索步骤: (5)调整检索式,优化检索策略 有时会出现文献过多或过少的情况,这时需要:(1)调整检索策略,进行缩检或扩检,(2)调整检索途径。 逻辑与缩小范围?还是扩大范围?达到查准的目的 逻辑或扩大范围?还是扩大范围?达到查全目的 例: 调整检索途径 例: (6)索取原始文献及检索评价 前面检索到的是文献条目,还要通过各种途径得到原始万能险 下载 借阅 输出检索报告,第三讲 文献检索基础知识,第 24 页,五、

19、信息资源检索技术(续) 例:基于物联网的农产品质量安全控制及可追溯体系研究进展和方向 1、检索课题:基于物联网的农产品质量安全控制及可追溯体系研究进展和方向 2、课题背景:我系一毕业生生应聘到滨州国家农业科技园区工作,该园区承担一项国家863课题“农业物联网和食品质量安全控制体系研究” ,该项目主要是从食品生产到餐桌全过程采用物联网技术构建完善的质量监控体系,该项目目前刚刚开始,而目前国内已经有很多研究机构从各个不同侧面开展与此相关的研究。领导交给该毕业生的任务是:对该领域目前国内研究进展及方向进行调研并形成综述报告。 3、课题分析:该生在此以前对该领域非常陌生,首先通过Baidu、Googl

20、e等进行初步搜索,了解到该领域研究涉及如下方面: (1)农作物生长信息: 涉及到信息有:温度、湿度、土壤、化肥、农药残留等 设计到技术有:传感器件、传感网络、RFID (2)流通环节可追溯。 设计到:供应链管理、RFID、二维码、果蔬保鲜等,第三讲 文献检索基础知识,第 25 页,五、信息资源检索技术(续) 例:基于物联网的农产品质量安全控制及可追溯体系研究进展和方向 4、确定检索词: 从课题字面理解及前面的课题分析初步选择有一下检索词:物联网、RFID、传感器、二维码、农作物、农产品追溯、供应链、进展、方向 对检索词的分析: 其中进展、方向等词太宽泛,无检索意义,所以舍去。 增加隐含词:信息

21、采集、绿色蔬菜、无公害蔬菜 增加同义词:射频识别(RFID的同义词) 增加下位词:果蔬(农作物的下位词)、电子标签(RFID的下位词) 确定检索词: 物联网、RFID、传感器、二维码、农作物、农产品追溯、供应链、信息采集、绿色蔬菜、无公害蔬菜、射频识别、果蔬、电子标签 5、确定检索式:根据以上检索词的逻辑关系,构建如下检索式: (物联网+RFID+电子标签+传感器+射频识别)*(农作物+果蔬+绿色蔬菜+无公害蔬菜)*信息采集侧重检索关注生长过程的文献 (物联网+RFID+电子标签+传感器+射频识别)*(农产品追溯+供应链)侧重检索关注流通环节的文献,第三讲 文献检索基础知识,第 26 页,五、

22、信息资源检索技术(续) 例:基于物联网的农产品质量安全控制及可追溯体系研究进展和方向 6、选择检索工具(数据库) 中国知网 中国学术期刊全文数据库 中国博士学位论文全文数据库 中国优秀硕士论文全文数据库 中国专利全文数据库 国家科技成果数据库 万方数据 维普咨询 中国科技期刊数据库 中国知识产权局专利检索数据库 (或)(中外专利数据库服务平台),第三讲 文献检索基础知识,第 27 页,五、信息资源检索技术(续) 例:基于物联网的农产品质量安全控制及可追溯体系研究进展和方向 7、实施检索,调整检索式,优化检索策略 (1)以“(物联网+RFID+电子标签+传感器+射频识别)*(农作物+果蔬+绿色蔬

23、菜+无公害蔬菜)*信息采集”为检索式侧重检索关注生长过程的文献 选择题名途径检索出0篇文献,太少! 调整检索途径,选择关键词途径,检出2篇文献,仍然太少! 调整检索途径,选择主题途径,检出27篇文献。其中包含一些早期文献,意义不大。 调整检索式,选择近3年文献: “(SU=(物联网+RFID+电子标签+传感器+射频识别)*(农作物+果蔬+绿色蔬菜+无公害蔬菜)*信息采集)and(YE=(2009+2010+2011)”,检出23篇文献。 (2)(SU=(物联网+RFID+电子标签+传感器+射频识别+二维码)*(农作物+果蔬+蔬菜)*(追溯+供应链) 为检索式。侧重检索关注流通环节的文献 检出2

24、7篇文献 选择近3年文献:SU=(物联网+RFID+电子标签+传感器+射频识别+二维码)*(农作物+果蔬+蔬菜)*(追溯+供应链)and(YE=(2009+2010+2011)为检索式。检出17篇文献。,第三讲 文献检索基础知识,第 28 页,五、信息资源检索技术(续) 例:基于物联网的农产品质量安全控制及可追溯体系研究进展和方向 7、实施检索,调整检索式,优化检索策略 (3)以以上两个检索式在国家科技成果数据库(CNKI)中检索,分别检索出1篇 (4)按以上两个检索式在国家知识产权局专利检索中分别检索出6篇和1篇文献。 8、索取原始文献 下载以上文献 9、阅读文献并撰写文献综述,第三讲 文献

25、检索基础知识,第 29 页,六、信息资源检索系统与工具 1、信息检索系统的概念: 是按某种方式、方法建立起来的供用户查找信息的有层次的信息体系。 信息检索系统包含两个子系统: 存储子系统 检索子系统 信息资源检索系统由以下三个基本部分组成: 检索文档 检索文档即经过有序化处理并标有检索标识的信息集合 检索设备 检索设备即用以存储信息和检索标识以及实现存储和检索操作活动的一切技术设备,如手工检索系统的卡片目录望,计算机检索系统的输入装置,存储器,输出装置等,网络检索时还需要网络线路、终端设备以及相应的软件等 检索规则 检索规则是系统用来规范信息采集、分析、标引著录、组织管理、检索与传输等过程的各

26、项标准体系,第三讲 文献检索基础知识,第 30 页,六、信息资源检索系统与工具 2、检索系统的分类 按使用设备和手段划分 手工检索系统。如: 书本式的:全国新书目、全国报刊索引等。 卡片式的:图书馆的索引库 计算信息检索系统 计算机光盘检索系统 计算机网络检索系统,第三讲 文献检索基础知识,第 31 页,六、信息资源检索系统与工具 3 计算机检索系统(目前最主要的信息检索系统) 计算机检索系统的原理 存储与检索 思考如何建立一个计算机信息检索系统? 计算机系统检索的特点 快 多 新 全 方便、灵活 计算机检索系统的构成 物理构成计算机、网络设备、大型存储设备、数据库 逻辑构成 文献采集子系统为系统提供充足的数据源 检索语言 建立可用于计算机检索的数据库 用户接口子系统,第三讲 文献检索基础知识,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!