2022年情报语言学

上传人:沈*** 文档编号:119072993 上传时间:2022-07-13 格式:PDF 页数:5 大小:64.37KB
收藏 版权申诉 举报 下载
2022年情报语言学_第1页
第1页 / 共5页
2022年情报语言学_第2页
第2页 / 共5页
2022年情报语言学_第3页
第3页 / 共5页
资源描述:

《2022年情报语言学》由会员分享,可在线阅读,更多相关《2022年情报语言学(5页珍藏版)》请在装配图网上搜索。

1、.检索语言(标引语言)各种情报检索系统表达文献主题概念。检索语言的优势能简单明白又比较专指地表达文献及检索课题的主题概念;语词与概念一一对应,排除了多词一义、一词多义和词义模糊现象;能显示概念之间的关系容易将概念进行系统排列;检索时便于将标引用语和检索用语进行相符性比较检索语言的作用存储过程:一次信息(分析)信息特征检索语言(标引)标识(输入)信息检索工具(系统)(输入)检索结果检索过程:信息需求(分析)检索提问检索语言(标引)标识(检索)信息检索工具(系统)(输入)检索结果检索语言功能知识组织功能,保证较高的检索效率。具体有四点功能:对文献的情报内容(及某些外表特征)加以标引的功能;对内容相

2、同及相关的情报加以集中或揭示其相关性的功能;对大量情报加以系统化或组织化的功能;便于将标引用语和检索用语进行相符性比较的功能词汇控制指根据文献标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。词汇控制的范围词量控制词类控制词形控制词义控制词间关系控制专指度控制先组度控制词量控制方法一个宽泛的上位词,代替若干专指的下位概念,通过表示单元概念语词的组配,表达复合概念来代替直接收入词组,减少词量。词类控制方法控制、排除与标引和检索无关的词汇。按照对文献主题内容揭示的要求,一般只使用名词或名词性词组。必要时使用形容词、介词、连词和数量词。词形控制方法一个概念只有一个语词表达。汉字

3、形体的控制、外来词的控制、标点和数字的控制、同义词的控制词义控制方法加限定词、加注释词间关系控制方法词间关系的揭示主要是通过等级结构、类目注释、类目参照、交替类目等实现的。等级关系:类目的等级体系、版面的字体、字号、缩格等辅助手段。相关关系:参见注释和内容范围注释。等同关系:类名后的限定词或类目的同义词注释。专指度指检索词与文献主题概念的切合程度,是影响检索语言标引质量的一个重要因素。较高的专指度有助于提高检索的准确度,满足对特定主题文献的查找。过度专指会造成词量过大,增加标引和检索的难度,造成文献分散,影响检全率,增加系统的管理费用。提高专指度措施:扩大专指词的选用;扩大收词范围,改进收词的

4、完备性;增加类表或标题的级数或组配的级别;允许采用自由词补充标引;提高词汇的先组度等。降低专指度方法:合并近义词,用含义接近的词代替;采用上位词置代,以比较宽泛的词标引过度专指的概念;减少类表或标题级数或组配级别等;以组配形式代替先组词等。先组度检索词汇的先组程度,包括采用先组方式,还是后组方式,以及词表中先组词的使用情况。词组的数量决定先组程度。句法控制根据文献标引和检索的需要,通过一定的组词造句规则,对检索语词的组合方式作出规定。简单来说就是检索语句中语词之间形成的关系。自然语言中,由词序和虚词来表示句法结构。检索语言中,采用引用次序、辅助符号以及轮排等基本形式表示句法关系。引用次序又称组

5、配次序,是指对复合主题进行标引和检索时,各个主题因素的组合或排列的次序。在分类法中,是指类目划分标准或不同组面被引用的先后顺序;在主题法中,是指字顺标题中各个主题因素的排列次序。是先组式主题语言进行句法控制的重要手段。几种典型的引用次序显著性引用次序:根据主题概念对用户心理映象的显著程序确定的次序。基本范畴引用次序:将各种主题概念划分为范畴,并按范畴的性质、职能确定组配顺序。上下文从属引用次序:一种接近自然语言句法手段和语序的引用次序。这一引用次序是随着索引编制自动化的发展逐步建立起来的。中文引用次序:主体因素(A)、通用因素(B)、位置因素(C)、时间因素(D)、文献类型因素(E)。检全率亦

6、称查全率、命中率,是指通过检索系统检出的与某一检索提问相关的文献数与检索系统中与该提问相关的实有文献总数之比。检准率亦称查准率、相关率,指通过检索系统检出的与某一检索提问相关的文献数与检出文献总数之比。名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 5 页 -词汇控制措施提高检全率提高检准率词类限定词量控制提高先组度提高专指度词形规范同义词优选准同义词控制等级关系控制相关关系控制引用次序控制符号轮排主题词经过选择,用来表达文献主题的语词。主题法直接以表达文献主题的语词作为检索标识,以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索文献的方法。主题法特点以主题为中心

7、集中文献、直接以语词作为检索标识、以字顺方式作为主要检索途径、通过详尽的参照系统揭示主题词之间的关系、用来处理文献,编制各种检索工具及检索系统。标题法以标题词作为文献主题标识的标引和检索的主题法。标题法是最早出现的一种主题法,属于列举式主题法,先组式。标题法的特点列举式词表,形式直观;定组式标题,结构固定,含义明确;按词表列举的标题标引,操作简便;收词量大;专指度不足,修订量大;只能从规定的组配顺序入手查找,无法从多因素、多角度检索。元词法元词:用来标引文献主题的、最基本的、字面上不能再分的语词。一种以元词作为主题标识,通过字面组配的方式表达文献主题的主题法。后组式语言的先驱,是机械检索系统中

8、倒排档的先驱。元词法的特点词表体积小、标引专指度高、便于从不同角度检索、字面组配法,在字面和语义不一致时,容易造成误差、缺乏完善的参照系统,不利于族性检索。叙词法叙词 又称主题词,是经过规范化处理的,以基本概念为基础的表达文献主题的词和词组。从自然语言中精选出来的,经过严格处理的语词作为文献主题标识,通过概念组配表达文献主题的主题法。叙词语言的特点组配准确,标引能力强;结构完备,词汇控制严格;适合多途径检索,检索效率高;对检索系统的适应性强。词汇控制严格,词表编制难度大;标引规则复杂,标引难度大,速度慢;用户难以熟悉词表及标引规则,给使用带来不便。字面组配指根据构词法的原理,将一个复杂的、专指

9、的概念按其字面构成拆分成两个或两个以上的单词,标引的时候在根据构词法的原理将两个词拼接起来,表达一个专指、复杂的概念。(拆词:熊猫电视机熊猫电视机)概念组配根据概念的分析与综合原理,将一个专指、复杂的概念按其语义分解为两个或两个以上的较为宽泛的概念,标引时同样按其语义将两个或两个以上的较为宽泛的概念组合表达一个专指、复杂的概念。(拆义:熊猫电视机熊猫牌电子产品电视机)概念组配的类型交叉组配、限定组配、联结组配叙词组配的作用编制叙词表时,可以控制词量、缩小词表篇幅。标引时,通过组配来保证标识表达主题概念的专指性。提供多途径检索。有助于自由扩大或缩小检索范围。能比较及时反映新事物、新学科。上位词表

10、示属概念或整体概念的主题词下位词表示分概念或部分概念的主题词叙词表的宏观结构叙词表又称主题词表,它将自然语言转换为规范化的系统语言的一种术语控制工具,概括由自然语言优选出的语义相关、族性相关的学科术语所组成的一种规范化动态词典。按其显示方式,叙词表有:字顺显示、系统显示、图形显示三种方式。按照各组成部分的性质,一个完整的叙词表一般包括字顺表(由叙词款目和非叙词款目按字顺排列的一览表,是叙词表的主表。供标引员和用户按照字顺直接对叙词进行查找,并通过参照系统判定词汇含义,进行相关词的查检,是标引和检索的主要依据)附表(是将众多专有叙词款目按字顺排列的一览表,是字顺表的重要组成部分。专有名词指表达某

11、一单一事物对象的名称。常用的专有名词包括人名、地名、机构名、产品型号名等,数量大,范围广,作用(1)缩小主表篇幅(2)分类显示作用(3)有利于管理或增补。款目结构和排列方式与字顺主表名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 5 页 -相近,一般不收入范畴索引,无范畴号。只有在必要时才编制)辅助索引(范畴索引:是一种按照词汇所属学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具,亦称分类索引。词族索引:词族,指一组具有属分关系的叙词结合。词族索引是一种以词族为款目单元,按照款目词的字顺排列,可以从等级关系的角度查找叙词的索引)叙词表的编制程序总体合计(需求分析:

12、调查现有词表满足需要的程度、明确拟编词表的用途。明确学科范围,明确标引对象。确定词汇特点:确定收词的专制度和先组度。规定词表结构:确定宏观和微观结构。明确编表条件:编表所需的人力、财力、设备和时间,合理安排资源)制定编制规范(对编表中涉及的理论和技术问题作出具体规定;参考叙词表编制的国家标准和国际标准;选词的原则和范围;词汇控制的内容和原则;参照项目的设立,参照项目符号含义;词汇数量及词汇先组度和专指度;主表、附表、辅助表的著录项目、格式和排列规则;注释的类型及撰写方法)拟定类表收集词汇(经验法:收集该学科的百科全书、字(辞)典、刊物及其他权威性出版品,将出現的词记录于作业表格,而后再进行属性

13、划分。小组汇编法:汇编法则是聚集一群学科专家,进行头脑风暴,列出相关词汇,确定族首词,再行分族编排)整理词汇(对词汇进行分类,按照学科、专业集中;同一学科、专业类目下,按照基本范畴或分面分类;对各范畴或分面下的词汇进行比较分析,剔除重复,确定词间关系,形成叙词表的基础)建立词间关系(等同关系:又称用代关系,参照符号是USE 及 UF等级关系:又称属分、上下或层级关系,参照符号是 BT及 NT相关关系:又称亲缘、类缘或联想关系,參照符號是RT)编表(生成完整的词表,包括字顺表和各种索引要求排列正确,相关参照完整,等级显示明确)审核和试标引(审核要对词表的所有步骤和元素进行审查,自查或专家审查。对

14、保证词表质量非常重要;待标引的测试文献要有足够的数量以及涵盖词表的各个主题;试标引后,可以对词表进行进一步修改、补充和完善)定稿出版(要有编制说明和使用方法说明)等同率指非叙词与叙词的比率。这是衡量入口词汇丰富程度的一项重要指标,也是表明词表对同义词、近义词等有效控制的程度。等同率高,检索入口就多,可以提高检索效率。国外叙词表的等同率一般在40到 50以上,甚至有些词表的等同率大于1,即入口词比叙词还多。我国叙词表的词汇等同率在 15左右叙饲表的词汇等同率呈增长趋势。参照度是指叙词表中每个叙词接受参照项(包括分项、属项和参项)的平均数。参照度理想值在2-5 之间。关联比是指词表中至少设有一个分

15、项、属项或参项参照的叙词与词表中总词数的比率。关联比和参照度可用于测试词表中词汇之间的连接性能。词表中无关联词越少,关联比就越高,词表的性能就越好。汉语主题词表的意义结构完备。词汇控制严格,整体功能完备,是传统词表编制的一种典型模式;词汇丰富。首次为我国文献情报单位提供了一个权威的词汇集合;探索了词表编制方法;探索了叙词表的实际使用方法;成为国内文献单位通用的综合性主题标引工具。汉语主题词表的不足结构上,篇幅巨大,组成分散,编排不紧凑,整体性较差;收词数量不平衡;专指度过高;词间关系处理上,等同率低于国内外同期专业词表平均值,基本上不设与组代词的等同关系项,无关联词数量大等,是影响词表易用性的

16、比较突出的不足;汉表没有设置统一的管理机构,未确定明确的修订方针,缺乏健全的管理机制:共而影响了词表的发展和使用。分类法主题法联系分类法中采取的主题法的技术和手段:编制分类表字顺索引、在分类表中按主题事物集中列类、对类名的词形或词义的控制。主题法中引进的分类法的技术和措施:设置隐蔽的分类体系参照系统、在主题词表中引入概念成族和字面成族的方法、编制范畴索引、词族索引和轮排索引等。分类主题一体化词表实质上就是一种实现了分类语言和主题语言兼容互换的系统。具体地说,是指在一个检索语言系统中(或由两种原来独立的检索语言合成的系统),对它们的分类表部分与主题词表部分的术语、参照、标识、索引四部分实施统一的

17、控制,从而能够满足分类标引与主题标引的需要,简称一体化检索语言或一体化词表,国外称为分类法叙词表系统。分类法和主题法在构成原理上是相同的,二者的基本构件分类号和主题词本质上都是主题概念的标识,只不过标识的形式不同,通过一定方式,二者是可以实现转换的。二者类集的内容是相同的,处理的对象都是语义单元或称为文献主题概念,都能够提供概念检索的功能,差异仅在于类集的方式方法有所不同。分面叙词表名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 5 页 -是最典型的一体化词表。这种一体化词表结构新颖、性能优异、适应性广。如教育主题词表、社会科学检索词表、音像资料叙词表等。通常由一部分面或半分面的

18、分类表和一部字顺叙词表成,有的还附有轮排索引及英汉对照索引。这两部分的类目和主题词一一对应,等值兼容。字顺主题词表起着分类表字顺索引的作用。分类表起着传统主题词表范畴索引和词族索引的作用,可直接用于主题标引与分类标引。分类主题词表通常由分类号与主题词对应表、主题词与分类号对应表两部分组成。前者为每个类目列出其对应的一个或多个主题词或词串,后者为每个主题词列出其对应的一个或多个分类号。功能上超过分类表主题词表的总和,成为不同检索语言兼容互换的重要工具。从兼容水平来看,分类主题词表不如分面叙词表。从其实际的工作和影响来看,分类主题词表已远远超过了分面叙词表,更受到图书情报界的欢迎。集成词表将某些特

19、定主题领域的若干叙词表和分类法汇编而成的一种词表,可以用于联合分类标引和主题标引,用于实现分类法和叙词表之间的兼容及互换。中国医学科学院编制的R 类与医学主题词表、中医药学主题词表对照表山西省图书馆主编的“对照标引系统”,包括中图法、汉表)、科图法、人大法的大型集成词表。美国医学图书馆主持开发的一体化医学语言系统(UMLS),包括 15 部生物医学词表的集成词表。分面叙词表宏观结构分面叙词表把传统的分类法和叙词表合二为一,删除了重复冗余的部分,形成了新型的宏观结构。详细的分类表代替了以往叙词表的范畴索引和词族索引,用字顺叙词表取代了分类法的字顺索引,简化了词表结构,强化了分类显示功能。分类表包

20、含了所收全都叙词的全部信息,已经成为一体化词表的主体,字顺表成了分类表的派生物。分类表中的类目与字顺叙词表的主题词一一对应,用分类号联系,相互辅助。改变了以往传统叙词表一组词设一范畴号的做法,为每一类目(主题词)均配备一个独立的分类号,使分类标记个别化,便于检索。分类主题词表的原理基于分类表和主题词表之间的兼容性的转换系统,为分类标引数据与主题标引数据之间的转换提供桥梁。分类主题词表与分面叙词表的差别:前者是一部分等值兼容,一部分在不同程度的兼容,还有一小部分无法兼容;后者等值兼容;前者是对已经出版的分类表和主题词表寻找兼容关系,后者是编制一部新表,可以根据需要进行词汇控制。分类主题词表的结构

21、中分表第1 卷为分类号主题词对应表一部按照中图法分类体系组织的体系分类表式的汉表范畴索引。一部用汉表主题词对类目进行详细注释的新版中图法。第二卷为主题词分类号对应表汉表的修订版,增加新词、删除旧词、调整词间关系;分类号代替范畴号,成为一部叙词表式的分类表索引;族首词下的词族全显示,取消了F项和 S项;按照主题词汉语拼音音节排序。中分表的功能优于国外编制的分类主题词表,功能更强大;整体功能强于中图法和汉表之和;降低标引难度,提高标引质量和速度;核心的兼容体系;为中图法和汉表修订提供依据;术语学研究和术语库建立提供参考工具。主题标引用语词(即标题词、叙词、单元词、关键词)来表达文献主题的操作过程。

22、是依据文献内容和价值,赋予文献检索标识的信息表示的过程。按照是否依据词表分为受控标引和自由标引。整体标引也称浅标引,是一种概括文献基本主题内容的标引。适用于手工检索,一般赋予2-8 个主题词。全面标引也称深标引,是一种充分揭示文献论及的所有有检索价值的主题概念的标引。一般使用5-20 个主题词,组成3-5 条检索款目。标引深度最大,适用于机检的图书情报部门标引信息价值大的文献,如论文、科技报告等。重点标引也称对口标引,是一种只揭示文献中适合本专业需要的主题内容的标引。针对性强,不利于文献共享,适用于专业图书情报机构处理相邻专业文献。补充标引是一种辅助标引方式,在整体标引的同时,根据特定需要,对

23、文献中部分重要的局部主题进行标引。可以提高整体标引或重点标引的深度。主题分析根据文献标引和检索的需要,对文献主题内容进行分析,提炼主题概念的过程。要求掌握对文献主题类型、主题结构的基本分析方法。在充分把握文献主题对象及其构成因素的基础上,对主题概念进行提炼和取舍,确定待标概念。单主题和多主题只论述一个中心问题或事物,还是同时论述两个以上。单元主题和复合主题:文献主题只含有一个主题因素还是两名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 5 页 -个以上。如:“事物部分”,计算机存储器“事物方面”,如大黄鱼养殖“事物比较事物”,如中美文化比较“事物应用事物”,如数学在农业中的应用主

24、题结构主题结构是构成文献的各因素及相互关系。存在多种引用次序。我国文献标引规则规定使用刘湘生的主题分面公式:主体面、通用面、位置面、时间面、文献类型面。6XX字段中相同子字段说明$2 主题标引体系(可选用,不可重复)以代码形式标识主题标目所用的主题标引体系或叙词表,汉语主题词表的代码为 ct。Calis联合目录规定,当所用的主题标引体系为ct 时,本子字段可省略。$3 规范记录号(有则必备,不可重复)名称规范记录在名称规范档中的控制号。600 个人名称主题$a 款目要素不重复$b 名称的其余部分不重复$c 名称附加(不包括年代)可重复$d 罗马数字不重复$f 年代(包括朝代)不重复$j 形式复分可重复$x 学科主题复分可重复$y 地区复分可重复$z 年代复分可重复601 团体/会议名称主题$a 款目要素不重复$b 次级部分$c 名称附加或修饰词$d 会议届次不重复$e 会议地点不重复$f 会议日期不重复$g 倒置部分不重复$h 名称其他部分不重复$j 形式复分$x 学科主题复分$y 地区复分不重复$z 年代复分不重复名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 5 页 -

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!