信息著录和标引.PPT

上传人:仙*** 文档编号:167430169 上传时间:2022-11-03 格式:PPT 页数:96 大小:2.24MB
收藏 版权申诉 举报 下载
信息著录和标引.PPT_第1页
第1页 / 共96页
信息著录和标引.PPT_第2页
第2页 / 共96页
信息著录和标引.PPT_第3页
第3页 / 共96页
资源描述:

《信息著录和标引.PPT》由会员分享,可在线阅读,更多相关《信息著录和标引.PPT(96页珍藏版)》请在装配图网上搜索。

1、信息信息组织与检组织与检索索第第3 3章章 信息著录和标引信息著录和标引本章主要内容:本章主要内容:n 3.1 3.1 信息著录的含义和标准信息著录的含义和标准n 3.2 3.2 机读目录与元数据机读目录与元数据n 3.3 3.3 信息标引的含义与步骤信息标引的含义与步骤n 3.4 3.4 分类标引与主题标引分类标引与主题标引n 3.5 3.5 自动标引自动标引3.1著录的含义和标准3.1.1 含含义及作义及作用用 3.1.2 标准标准关键词:关键词:著录、著录、对象、对象、款目、基本要求、款目、基本要求、作用作用l3.1.2.1 什么是著录法什么是著录法l著录标准的发展(略)著录标准的发展(

2、略)l3.1.2.2 文献著录总则文献著录总则l著录项目著录项目l著录项目的特点著录项目的特点l著录等级著录等级l著录格式著录格式3.23.2.1 机读目录机读目录 3.2.2 元数据元数据n机读目录概述:机读目录概述:概念概念、产生与发展、产生与发展n格式特点格式特点nCNMARC的记录结构的记录结构nMARC的发展的发展n元数据的作用元数据的作用n都柏林核心元数据都柏林核心元数据DCn DC的修饰词的修饰词nDC实例实例n其他元数据规范其他元数据规范nDC与与MARC的比较的比较n内容描述内容描述n外形描述外形描述n知识产权知识产权机读目录与元数据机读目录与元数据n头标区头标区n目次区目次

3、区n数据区数据区n实例实例n修饰词的含义修饰词的含义n类型:元素修饰词和编码类型:元素修饰词和编码体系修饰词体系修饰词3.33.3.1 含义与质量含义与质量控制控制3.3.2 步骤步骤n3.3.1.1 含义含义n3.3.1.2 标引的标引的不同方式不同方式n3.3.1.3 质量控制质量控制n3.3.2.1 主题分析主题分析n3.3.2.2 概念转换概念转换n主题的类型与结构主题的类型与结构n主题分析的方法主题分析的方法信息标引的含义与步骤信息标引的含义与步骤3.4n3.4.1.1 基本原则(基本原则(5个原则)个原则)n3.4.1.2 不同类型主题的分类标引的规则不同类型主题的分类标引的规则n

4、3.4.2.1 选词规则选词规则n3.4.2.2 组配规则组配规则n3.4.2.3 主题词组配标引的形式主题词组配标引的形式分类标引与主题标引分类标引与主题标引3.4.1 分类标引分类标引3.4.2 主题标引主题标引3.53.5.1 自动标引概述自动标引概述3.5.2 自动标引的原理自动标引的原理3.5.3 自动标引方法自动标引方法3.5.4 自动分类自动分类n3.5.3.1 统计标引法统计标引法n3.5.3.2 语言分析标引法语言分析标引法n3.5.3.3 人工智能标引法(略)人工智能标引法(略)n3.5.3.4.自动赋词标引法自动赋词标引法自动标引自动标引n3.5.4.1 自动归类自动归类

5、n3.5.4.2 自动聚类自动聚类83.1 3.1 信息著录的含义和标准信息著录的含义和标准 3.1.1 信息著录的含义和作用信息著录的含义和作用著录:著录:在组织检索系统时,对具体信息的各种形式特征、内容在组织检索系统时,对具体信息的各种形式特征、内容特征及物质形态等进行分析、选择和记录的过程。特征及物质形态等进行分析、选择和记录的过程。款目款目/记录:记录:按照一定的方法和规则对某一信息的内容和特征所按照一定的方法和规则对某一信息的内容和特征所作的描绘结果。作的描绘结果。在逻辑上代表该信息。在逻辑上代表该信息。款目由一条条著录项目组成。款目由一条条著录项目组成。著录项目是用于揭示信息内容和

6、形式特征的记录事项。著录项目是用于揭示信息内容和形式特征的记录事项。9 注:(以下注:(以下“_”表示空格)表示空格)000 01103nam 2200313 4500(头标区)(头标区)001 0000212192005 20020703085900.0010 _$a 7-111-09692-4$d CNY58.00(含光盘含光盘)010 _$a 7-980007-34-4$b 光盘光盘100 _$a 20020524d2002 emky0chiy0121 ea101 1_$a chi$c eng102 _$a CN$b 110000105 _$a a z 000yy106 _$a r200

7、 1_$a 中文中文Office XP专家专家$A zhong wenO ffice XP zhuan jia$f(美美)StepHen L.Nelson,Julia Kelly$g 智慧东方工作室译智慧东方工作室译210 _$a 北京北京$c 机械工业出版社机械工业出版社$d 2002一条著录记录的实例:一条著录记录的实例:10215 _$a 532页页$c 图图$d 24cm$e 光盘光盘1片片314 _$a 责任者规范汉译姓:尼尔森责任者规范汉译姓:尼尔森314 _$a 责任者规范汉译姓:凯莉责任者规范汉译姓:凯莉454 _1$1 2001$a Office XP:The complet

8、e reference$1 701 1$a Nelson,$b StepHen L.$1 701 1$a Kelly,$b Julia606 0_$a 软件包软件包$A ruan jian bao610 0_$a Office XP$A Office XP690 _$a TP317.1$v 4701 _1$a 尼尔森尼尔森,$A ni er sen,$b S.L.$g(Nelson,StepHen L.)701 _1$a 凯莉凯莉,$A kai li,$b J.$g(Kelly,Julia)712 02$a 智慧东方工作室智慧东方工作室$A zhi hui dong fang gong zuo

9、 shi$4 译译801 _0$a CN$b XMU$c 20020527801 _2$a CN$b JUSTLib$c 20020701905 _$a JUSTLib$d TP317.1/N28 113.1 3.1 信息著录的含义和标准信息著录的含义和标准 3.1.1 信息著录的含义和作用信息著录的含义和作用著录的基本要求:著录的基本要求:准确化:准确化:著录的结果要全面、客观、准确地揭示信息著录的结果要全面、客观、准确地揭示信息资源的内容特征和形式特征;资源的内容特征和形式特征;规范化:规范化:要求信息著录坚持标准化著录原则,按照统要求信息著录坚持标准化著录原则,按照统一的著录项目、著录格

10、式、标识符号等进行著录。一的著录项目、著录格式、标识符号等进行著录。3.1 3.1 信息著录的含义和标准信息著录的含义和标准 3.1.1 信息著录的含义和作用信息著录的含义和作用著录的作用著录的作用文本 组 织 揭 示 检 索 133.1 3.1(续)(续)3.1.2 信息著录的标准信息著录的标准著录法:著录法:关于如何进行著录的具体规定和具体做法。关于如何进行著录的具体规定和具体做法。通常包括著录原则、适用范围、著录项目、著录格式、通常包括著录原则、适用范围、著录项目、著录格式、著录来源、著录文字、标识符号以及各个著录项目的著录来源、著录文字、标识符号以及各个著录项目的具体细则规定。具体细则

11、规定。常用著录标准:常用著录标准:英英-美编目条例美编目条例 第第2 2版版(AACRAACR2 2)、)、国际标准书目著录国际标准书目著录(International Standard Bibliographic DescriptionInternational Standard Bibliographic Description)中国的中国的文献著录总则文献著录总则(GB3972.1GB3972.18383)、)、西文文献著录西文文献著录条例条例、连续出版物著录规则连续出版物著录规则 (GB3792.385)MARC MARC、USMARCUSMARC、CNMARCCNMARC143.1

12、3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则国际标准书目著录国际标准书目著录(即(即ISBDISBD)文献著录总则文献著录总则(GB3972.1GB3972.18383)普通图书著录规则普通图书著录规则档案著录规则档案著录规则连续出版物著录规则连续出版物著录规则非书资料著录规则非书资料著录规则地图资料著录规则地图资料著录规则古籍著录规则古籍著录规则 153.1 3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则题名与责任者项题名与责任者项

13、版本项版本项文献特殊细节项文献特殊细节项出版发行项出版发行项载体形态项载体形态项丛编项丛编项附注项附注项文献标准编号及有关记载项文献标准编号及有关记载项提要项提要项1.著录项目著录项目163.1 3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则2.著录项目的特点著录项目的特点(1)规定性。)规定性。著录项目的名称、数量、顺序等是明确规定著录项目的名称、数量、顺序等是明确规定下来的,是相对稳定的,不能凭主观意志随便更改。下来的,是相对稳定的,不能凭主观意志随便更改。(2)兼容性。)兼容性。著录项目既基本概括了各类型文献

14、内容和形著录项目既基本概括了各类型文献内容和形式特征的共性,又兼容了它们各自的内容和形式特征的个性。式特征的共性,又兼容了它们各自的内容和形式特征的个性。(3)伸缩性。伸缩性。各类型文献著录,可以根据自身的特点和单各类型文献著录,可以根据自身的特点和单位的实际情况,在不违反规定性的前提下,增加或减少著录位的实际情况,在不违反规定性的前提下,增加或减少著录项目。项目。(4)客观性。客观性。著录项目遵循客观著录的基本原则。著录项目遵循客观著录的基本原则。173.1 3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则3.著录

15、级次著录级次著录级次指著录的详细程度。所有著录项目被分为主要项目著录级次指著录的详细程度。所有著录项目被分为主要项目和选择项目。和选择项目。n简要级次:只著录主要项目简要级次:只著录主要项目n基本级次:主要项目部分选择项目基本级次:主要项目部分选择项目n详细级次:主要项目全面选择项目详细级次:主要项目全面选择项目183.1 3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则4.著录格式著录格式著录标识符:著录标识符:为了在款目上识别不同的著录项目,特别是为了书目交流,为了在款目上识别不同的著录项目,特别是为了书目交流,

16、使一种语言使用者所编的记录,能被其他的语言使用者所理使一种语言使用者所编的记录,能被其他的语言使用者所理解,就需要使用彼此相同的符号系统,因此在编目工作实践解,就需要使用彼此相同的符号系统,因此在编目工作实践中就产生了中就产生了著录项目识别符著录项目识别符和和著录内容识别符著录内容识别符两种符号两种符号 。193.1 3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则4.著录格式著录格式(1)项目标识符)项目标识符 各大项(每段起首除外)各大项(每段起首除外)并列题名、并列丛编名并列题名、并列丛编名 :副题名及说明题名

17、文字、出版发行者、图、副丛编名、价格(或其副题名及说明题名文字、出版发行者、图、副丛编名、价格(或其它获得方式)它获得方式)第一责任者、与本版有关的责任者第一责任者、与本版有关的责任者 ;不同著作方式的责任者、同责任者的第二合订题名、第二出版地或不同著作方式的责任者、同责任者的第二合订题名、第二出版地或发行地、发行地、尺寸或开本、丛编编号尺寸或开本、丛编编号 相同著作方式的其他责任者、出版发行年、国际标准连续出版物编相同著作方式的其他责任者、出版发行年、国际标准连续出版物编号、分段页码号、分段页码 附属丛编名附属丛编名 附件附件 /标出文献出处标出文献出处 203.1 3.1(续)(续)3.1

18、.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则4.著录格式著录格式(2)内容识别符)内容识别符 是用来进一步说明一些著录项目的特定内容,或补充著录内容。一般用是用来进一步说明一些著录项目的特定内容,或补充著录内容。一般用在项目的外部、中间或末尾。主要有:在项目的外部、中间或末尾。主要有:()()责任者所属机构名称;中国责任者时代;外国责任者国别及姓名原责任者所属机构名称;中国责任者时代;外国责任者国别及姓名原文;印刷地、印刷者、印刷日期;载体形态的补充说明;丛编项等。文;印刷地、印刷者、印刷日期;载体形态的补充说明;丛编项等。文献类型标识

19、、自拟著录内容。文献类型标识、自拟著录内容。省略著录内容。省略著录内容。?推测附注及不能确定的年代,一般与推测附注及不能确定的年代,一般与“”结合使用。结合使用。大项目结尾、第一合订题名与责任者结尾、外文缩写。大项目结尾、第一合订题名与责任者结尾、外文缩写。起迄连接。起迄连接。213.1 3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则4.著录格式著录格式(3)普通图书卡片式款目著录格式)普通图书卡片式款目著录格式 正题名并列题名:副题名及说明题名文字文献类型标识正题名并列题名:副题名及说明题名文字文献类型标识第一责

20、任者;其他责任者第一责任者;其他责任者.-版次及其它版本形式与本版有关的责任版次及其它版本形式与本版有关的责任者者-文献特殊细节文献特殊细节-出版发行地出版发行地:出版发行者,出版发行日期(印刷:出版发行者,出版发行日期(印刷地:印刷者,印刷日期)地:印刷者,印刷日期)页数及卷册数页数及卷册数:图:图;尺寸或开本附件;尺寸或开本附件-(丛编名责任者,国(丛编名责任者,国际标准连续出版物编号;丛编编号际标准连续出版物编号;丛编编号附属丛编)附属丛编)附注附注 国际标准书号;中国标准书号(装订):获得方式国际标准书号;中国标准书号(装订):获得方式 提要提要 .题名题名.责任者责任者 .主题词主题

21、词 .分类号分类号 223.1 3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则4.著录格式著录格式(4)连续出版物卡片式款目著录格式)连续出版物卡片式款目著录格式 正题名正题名.分册标识,分册题名并列题名分册标识,分册题名并列题名.并列分册题名:其他并列分册题名:其他题名信息第一责任者,其他责任者题名信息第一责任者,其他责任者.-版本版本.-卷期年月标识卷期年月标识.-出版地:出版地:出版者,出版年出版者,出版年.-文献数量;其他形态细节;尺寸附件文献数量;其他形态细节;尺寸附件.-(丛刊题(丛刊题名;丛刊标识)名

22、;丛刊标识)出版周期出版周期 附注附注 其他题名其他题名 分类号分类号 主题词主题词 ISSN识别题名识别题名233.1 3.1(续)(续)3.1.2 3.1.2 信息著录的标准信息著录的标准3.1.2.2 3.1.2.2 文献著录总则文献著录总则4.著录格式著录格式(5)普通图书卡片式款目著录实例)普通图书卡片式款目著录实例 乱世佳人乱世佳人Gone with the wind(美)米切尔(美)米切尔(Mitchell,M.)著;)著;黄怀仁,朱攸若译黄怀仁,朱攸若译.-杭州杭州:浙江文艺出版社,:浙江文艺出版社,1991.4 1034页;页;20cm 本书另有译名:飘本书另有译名:飘 IS

23、BN 7-5339-0367-6:¥:¥10.70 .乱乱.米米 Mitchell黄黄朱朱.长篇小说长篇小说 .I712.45 返返 回回3.2 3.2 机读目录与元数据机读目录与元数据 机读目录:机读目录:Machine-Readable Catalogue,简称MARC,指任指任何形式的计算机可以阅读或识别的目录,其格式规定书目在数据机读介何形式的计算机可以阅读或识别的目录,其格式规定书目在数据机读介质上的表示和标识方法,包括机读记录的构成、各数据字段在机读介质质上的表示和标识方法,包括机读记录的构成、各数据字段在机读介质上的总体安排与内容结构。上的总体安排与内容结构。机读目录通用通信格式

24、:机读目录通用通信格式:包括标准化的记录结构、内容标识符、记录内容以及字符集与代码表。记录结构:书目记录在机读介质上总体安排。内容标识符:是标识数据元素并为其提供附加信息的一套符号。记录内容:是编目条例规定的具体书目信息。3.2.1 机读目录概述机读目录概述3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录概述概述MARC的诞生与发展:于于19651965年由美国国会图书馆提出年由美国国会图书馆提出,称标准机器可读目录记录款式的称标准机器可读目录记录款式的建议建议;1966;1966年年1 1月,产生月,产生MARC1MARC1。19671967年年MARC2MAR

25、C2正式研究出台正式研究出台,就是目前的就是目前的USMARCUSMARC。根据根据MARCMARC经验而起草的经验而起草的文献工作文献工作文献目录信息交换用磁带文献目录信息交换用磁带格式格式19731973年被年被ISOISO审定为国际标准,即著名的审定为国际标准,即著名的ISO2709ISO27091973(E)1973(E)。随后各个国家相继推出了其随后各个国家相继推出了其MARCMARC格式格式,如英国的如英国的UKMARC,UKMARC,日本的日本的JMARC,JMARC,中国的中国的CNMARCCNMARC等。等。3.2 3.2 机读目录与元数据机读目录与元数据 CNMARC的诞生

26、和发展:中国在中国在19791979年成立北京地区机读目录研制小组;在年成立北京地区机读目录研制小组;在UNIMARCUNIMARC和和文文献目录信息交换磁带格式(献目录信息交换磁带格式(GB290182GB290182)的基础上研究)的基础上研究中国机读目中国机读目录通讯格式录通讯格式。19921992年,正式出版年,正式出版中国机读目录通讯格式中国机读目录通讯格式即即CNMARCCNMARC等。等。19951995年年1212月又出版了月又出版了中国机读目录格式使用手册中国机读目录格式使用手册。19961996年年2 2月月6 6日日,中华人民共和国文化行业标准中华人民共和国文化行业标准中

27、国机读目录格中国机读目录格式式CNMARC)WH/T0503CNMARC)WH/T05039696作为国家标准诞生作为国家标准诞生,并于并于19961996年年7 7月月1 1日予以日予以实施。实施。3.2.1 机读目录机读目录概述概述3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录格式特点格式特点(1)字段设置:在MARC记录中字段的设置包含了书目数据的实际内容。主要特征表现在三个方面:字段数量多字段数量多,并有空白(子)字段供用户扩充使用并有空白(子)字段供用户扩充使用,共有共有001-999001-999个字段个字段,其中第其中第999999字段为用户自己规

28、定字段含义字段为用户自己规定字段含义;字段内容著录详尽字段内容著录详尽,字段下设子字段以及重复字段字段下设子字段以及重复字段;字段作用强化字段作用强化,可检索的字段多。可检索的字段多。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录格式特点格式特点(2 2)标记符号:)标记符号:字段标识,用字段标识,用3 3位数字表示,从位数字表示,从001-999001-999。子字段代码,用两个字符表示,第一个是定义符,表示为子字段子字段代码,用两个字符表示,第一个是定义符,表示为子字段(如(如$),第二个字符用小写字母,第二个字符用小写字母a a,b b,cc表示子字段顺序

29、。表示子字段顺序。指示符号指示符号:用以描述或指示可变长字段代码。指示符号用两个数字用以描述或指示可变长字段代码。指示符号用两个数字表示。在每个字段说明中都有指示符号的使用和表示的含义。如果表示。在每个字段说明中都有指示符号的使用和表示的含义。如果某个字段指示符号不用,则用空白符号表示。某个字段指示符号不用,则用空白符号表示。字段和记录分隔符。字段和记录分隔符。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 3.2.1 机读目录机读目录CNCNMARC的记录格式结构记录格式结构记录格式:由记录格式:由记录头标区、地址目次区、数据字段区记录头标区、地址目次区、数据字段区3个部分组成

30、,每个字段的末尾有字段分隔符。记录最后一个部分组成,每个字段的末尾有字段分隔符。记录最后一个字段的末尾有记录结束符。个字段的末尾有记录结束符。结构如下结构如下:每个字段的末尾有每个字段的末尾有字段分隔符字段分隔符头标区头标区 目次区目次区 数据字段区数据字段区 记录结束符记录结束符 3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录CNCNMARC的记录结构记录结构1.1.记录头标区记录头标区是按照国际标准是按照国际标准ISO2709-1981的规定,的规定,固定为固定为24个字符长个字符长,由定,由定长数据元素构成,包含记录处理所需数据。字符位置规定从长数据元素构

31、成,包含记录处理所需数据。字符位置规定从023。为记录提供某些基本参数。它含有为记录提供某些基本参数。它含有ISO 2709定义的关于记录定义的关于记录结构的数据和为结构的数据和为ISO 2709的特定形式而定义的几项数据元素。见的特定形式而定义的几项数据元素。见表表32。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录CNCNMARC的记录结构记录结构2.地址目次区地址目次区l列出记录中有哪些数据字段及其在记录中的位置,由计算机在输入列出记录中有哪些数据字段及其在记录中的位置,由计算机在输入时根据数据的实际情况自动生成。包括时根据数据的实际情况自动生成。包括若干

32、若干个个固定长固定长的的目次字段目次字段,每,每个目次字段个目次字段1212个字符个字符。l字段起始字符位置是指该字段第一个字符处于字段起始字符位置是指该字段第一个字符处于数据字段区数据字段区中的位置,中的位置,每一个数据字段的第一个字符的位置为每一个数据字段的第一个字符的位置为0 0。目次目次2结束符结束符字段起始地址字段起始地址(5位)位)字段长度字段长度(4位)位)字段号字段号(3位)位)目次目次1目次目次33.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录CNCNMARC的记录结构记录结构3.CNMARC的数据字段区的数据字段区指示符指示符1指示符指示符2$

33、a数据数据字段分隔符字段分隔符指示符指示符 子子字字段段数据数据其他其他子字子字段段数据数据字段分隔符字段分隔符u数据(控制)字段数据(控制)字段00X的结构:的结构:u数据字段数据字段01X999的结构为:的结构为:$是子字段标识符号,是子字段标识符号,a表示子字段的顺序表示子字段的顺序 3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录CNCNMARC的记录结构记录结构4.CNMARC的样例分析的样例分析注:(以下注:(以下“_”标识空格)标识空格)000 01103nam 2200313 4500 (头标区)(头标区)001 0000212192 (记录控制号

34、)(记录控制号)005 20020703085900.0 (记录版本标识)(记录版本标识)010 _$a 7-111-09692-4$d CNY58.00(含光盘含光盘)010 _$a 7-980007-34-4$b 光盘光盘100 _$a 20020524d2002 emky0chiy0121 ea101 1_$a chi$c eng102 _$a CN$b 110000105 _$a a z 000yy106 _$a r数据控制区数据控制区字段指示符字段指示符3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录CNCNMARC的记录结构记录结构4.CNMARC4.

35、CNMARC的样例分析的样例分析200 1_$a 中文中文Office XP专家专家$A zhong wenO ffice XP zhuan jia$f(美美)StepHen L.Nelson,Julia Kelly$g 智慧东方工作室译智慧东方工作室译210 _$a 北京北京$c 机械工业出版社机械工业出版社$d 2002215 _$a 532页页$c 图图$d 24cm$e 光盘光盘1片片314 _$a 责任者规范汉译姓:尼尔森责任者规范汉译姓:尼尔森314 _$a 责任者规范汉译姓:凯莉责任者规范汉译姓:凯莉454 _1$1 2001$a Office XP:The complete r

36、eference$1 701 1$a Nelson,$b StepHen L.$1 701 1$a Kelly,$b Julia3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录在网络环境中的发展在网络环境中的发展MARCMARC的的856856字段字段l 1993年开始研究。年开始研究。l 主要包含网上电子数据资源的地址信息,相应地读取该数据所要求主要包含网上电子数据资源的地址信息,相应地读取该数据所要求的软件环境等。该字段两个字段指示符,第一指示符描述访问方法。的软件环境等。该字段两个字段指示符,第一指示符描述访问方法。该指示符定义了网上资源的访问方法,如果有多

37、于一种的方法时,该该指示符定义了网上资源的访问方法,如果有多于一种的方法时,该字段可以重复。当前所定义的方法主要基于字段可以重复。当前所定义的方法主要基于TCP/IP协议。协议。u#无信息提供。主要用于子字段有无信息提供。主要用于子字段有g(统一资源名统一资源名URN)、而无、而无u(统一资源定位器统一资源定位器URL)时。时。u0Email。1FTP。2远程登录远程登录(Telnet)。3拨号上网拨号上网(Dial-up)。4HTTP。u7访问方法在子字段访问方法在子字段2中说明。当访问方法不是上述指明的五种方中说明。当访问方法不是上述指明的五种方法时法时,由本字段的由本字段的2子字段说明。

38、子字段说明。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.1 机读目录机读目录在网络环境中的发展在网络环境中的发展MARCMARC的的856856字段字段l第二指示符描述了本字段所标引的电子数据资源与本记录所描述的书目、第二指示符描述了本字段所标引的电子数据资源与本记录所描述的书目、期刊或文献资料的关系。当这种关系不是一对一时,子字段期刊或文献资料的关系。当这种关系不是一对一时,子字段3进一步提供进一步提供更详细的信息。更详细的信息。l各指示符定义如下各指示符定义如下:l0原资源。原资源。1原资源的一个版本。原资源的一个版本。2与原资源有一定的关系。该指示符表与原资源有一定的关系。

39、该指示符表明本记录所标引的资源的目录并不是电子版,而本明本记录所标引的资源的目录并不是电子版,而本856字段所描述的网上电子数字段所描述的网上电子数据资源与其有一定的关系,此时可在子字段据资源与其有一定的关系,此时可在子字段3中对这一关系做进一步的说明。中对这一关系做进一步的说明。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据元数据(元数据(Metadata):关于数据的数据,是关于数据的结构化):关于数据的数据,是关于数据的结构化的数据。的数据。起源:起源于计算机科学,原先主要指网络信息资源的描述,起源:起源于计算机科学,原先主要指网络信息资源的描述,后逐步扩大到

40、各种以电子形式存在的信息资源的描述。后逐步扩大到各种以电子形式存在的信息资源的描述。描述的对象:图书、期刊、磁带、录像带、缩微品、论文、科描述的对象:图书、期刊、磁带、录像带、缩微品、论文、科技报告及技报告及各种形式的网络信息资源各种形式的网络信息资源。描述的成分:通常从信息资源中抽取出来的用于说明其特征、描述的成分:通常从信息资源中抽取出来的用于说明其特征、内容的数据。如题名、版本、出版数据、相关说明等。内容的数据。如题名、版本、出版数据、相关说明等。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据1.作用作用 定位和检索定位和检索著录和描述著录和描述资源管理:资源

41、管理:权利管理、数字签名、存取管理权利管理、数字签名、存取管理资源保护与长期保存资源保护与长期保存3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 2.2.都柏林核心元数据集都柏林核心元数据集 Dublin Core Element Set Dublin Core Element Set(http:/dublincore.org/http:/dublincore.org/)是一种跨)是一种跨领域的信息资源描述规范。这里的资源是领域的信息资源描述规范。这里的资源是“任何具有标识的东西任何具有标识的东西”。于于19951995年年3 3月在美国俄亥俄州都柏林市召开的元数据

42、讲习班,由美月在美国俄亥俄州都柏林市召开的元数据讲习班,由美国的国的OCLC(Online Computer Library CenterOCLC(Online Computer Library Center)和)和NCSANCSA(国家超级计(国家超级计算机应用中心,算机应用中心,National Center for Supercomputing ApplicationsNational Center for Supercomputing Applications)联合发起。目的在于建立一套简单的非图书情报专业人员也能够了解联合发起。目的在于建立一套简单的非图书情报专业人员也能够了解和使用

43、的描述网络信息资源的方法,以实现网络信息资源的辨识、查和使用的描述网络信息资源的方法,以实现网络信息资源的辨识、查询和检索。询和检索。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 2.2.都柏林核心元数据集都柏林核心元数据集内容描述内容描述 知识产权知识产权 外形描述外形描述 DC 的元素修饰词的元素修饰词 DC 的元素修饰词的元素修饰词 DC的的编编码码体体系系修修饰饰词词 DC的的编编码码体体系系修修饰饰词词3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 2.2.都柏林核心元数据集都柏林核心元数据集(1 1)内容描述部分)内容描述部

44、分 题名项题名项Title:由创建者或出版者给定资源的名称。:由创建者或出版者给定资源的名称。主题词项主题词项Subject:能够揭示资源对象主题内容或学科内容的关:能够揭示资源对象主题内容或学科内容的关键词、词组短语或分类号。键词、词组短语或分类号。描述项描述项Description:资源内容的文本描述,包括文献类对象的:资源内容的文本描述,包括文献类对象的文摘或视觉作品的内容描述等。文摘或视觉作品的内容描述等。来源项来源项Source:二次资源的出处信息。当前资源可能源自资源:二次资源的出处信息。当前资源可能源自资源的一部分或全部。的一部分或全部。3.2 3.2 机读目录与元数据机读目录与

45、元数据 3.2.2 元数据元数据 2.2.都柏林核心元数据集都柏林核心元数据集(1 1)内容描述部分)内容描述部分 语言项语言项Language:资源对象所用的语言类型。:资源对象所用的语言类型。关联项关联项Relation:二次资源及其与当前资源关系的标识。该元素的:二次资源及其与当前资源关系的标识。该元素的值应当从值应当从Relation的列表中选取。的列表中选取。覆盖范围项覆盖范围项Coverage:资源知识内容的时空特征。空间范围指物理:资源知识内容的时空特征。空间范围指物理区域,如经度纬度、规范的地名等;时间范围指资源内容区域,如经度纬度、规范的地名等;时间范围指资源内容(时间段时间

46、段)而非资源产生的时间而非资源产生的时间(时间点时间点)。时间描述采用与日期项。时间描述采用与日期项(Date)相同的相同的格式。该元素要使用受控词表。格式。该元素要使用受控词表。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 2.2.都柏林核心元数据集都柏林核心元数据集(2 2)知识产权部分)知识产权部分 著者项著者项Creator:对创造资源知识内容负主要责任的个人或机构、甚:对创造资源知识内容负主要责任的个人或机构、甚至某个服务系统。至某个服务系统。出版者项出版者项Publisher:负责使资源成为当前可获取和利用的形态的责:负责使资源成为当前可获取和利用的形

47、态的责任者,可以是某个个人、团体或某项服务。例如出版社、大学的系任者,可以是某个个人、团体或某项服务。例如出版社、大学的系科或者公司实体等。科或者公司实体等。合作者项合作者项Contributor:指没有在:指没有在Creator元素中列出的对资源的知元素中列出的对资源的知识内容具有重要贡献的个人或组织,其贡献次于创建者识内容具有重要贡献的个人或组织,其贡献次于创建者(如编辑、誊如编辑、誊写员、插图作者等写员、插图作者等)。权限项权限项Rights:一个权限管理的陈述,或者是指向一个权限管理陈:一个权限管理的陈述,或者是指向一个权限管理陈述的标识,或者是指向提供资源权限管理信息内容的服务的标识

48、。述的标识,或者是指向提供资源权限管理信息内容的服务的标识。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 2.2.都柏林核心元数据集都柏林核心元数据集(3 3)外形描述部分)外形描述部分 日期项日期项Date:指与创建或使资源成为现有状态的相关日期。(建议:指与创建或使资源成为现有状态的相关日期。(建议遵循遵循ISO 8601规范)规范)类型项类型项Type:有关资源内容的特征类别,它包括描述资源内容的分:有关资源内容的特征类别,它包括描述资源内容的分类范畴、功能、特性或集合层次的术语。其值应从资源类型类表中类范畴、功能、特性或集合层次的术语。其值应从资源类型类表

49、中选取。例如小说、诗歌、报告、论文、词典等。选取。例如小说、诗歌、报告、论文、词典等。格式项格式项Format:资源的数据格式,用于注明需要什么软件或硬件来:资源的数据格式,用于注明需要什么软件或硬件来显示和执行这一资源。如文本、显示和执行这一资源。如文本、JPG图像、应用程序等。其值应从图像、应用程序等。其值应从Format的列表中选取。的列表中选取。识别符识别符Identifier:唯一标识资源的字符串或数字。例如网络资源标:唯一标识资源的字符串或数字。例如网络资源标识中的识中的URL和和URN,其他通用唯一性标识如国际标准书号,其他通用唯一性标识如国际标准书号ISBN或其或其他规范名称皆

50、可作为标识值。他规范名称皆可作为标识值。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 3.3.都柏林核心元数据的修饰词都柏林核心元数据的修饰词(1 1)DCDC的修饰词的含义的修饰词的含义l DCDC修饰词(修饰词(DC QualifiersDC Qualifiers,简称,简称DCQDCQ):对):对DCDC的未修饰词的未修饰词(即即1515个核心元素个核心元素)的语义进行限定和修饰的词,并具有未的语义进行限定和修饰的词,并具有未修饰词的含义和对具体资源描述的专指性特点。修饰词的含义和对具体资源描述的专指性特点。l DCQDCQ分为分为元素修饰词元素修饰词(El

51、ement RefinementElement Refinement)和)和编码体系编码体系修饰词修饰词(Encoding SchemaEncoding Schema)两类。)两类。l 每个修饰词都有它的名称、标签、定义和注释。如:每个修饰词都有它的名称、标签、定义和注释。如:Title元素:元素:Alternative(交替题名)交替题名)名称名称:alternative(交替题名)(交替题名)标签标签:Alternative(交替题名)(交替题名)定义定义:任何一种可代替正式资源名的其它名称。任何一种可代替正式资源名的其它名称。注释注释:该修饰词可以包括缩写的资源名称和翻译的资源名称。该修

52、饰词可以包括缩写的资源名称和翻译的资源名称。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 3.3.都柏林核心元数据的修饰词都柏林核心元数据的修饰词(2 2)DCDC修饰词的类型修饰词的类型元元素素修修饰饰词词lTitle元素:元素:交替题名(交替题名(Alternative)lDescription元素元素:目录(目录(Table Of Contents),摘要(),摘要(Abstract)lDate:创建日期(创建日期(Created),生效日期(),生效日期(Valid),可获得日期),可获得日期(Available),发布日期(),发布日期(Issued),

53、修改日期(),修改日期(Modified)lFormat:范围(范围(Extent),媒体(),媒体(Medium)lCoverage:空间空间(Spatial),时间,时间(Temporal)lRelation元素元素:版本继承版本继承(Is Version Of),版本关联,版本关联(Has Version),被替代,被替代(Is Replaced By),替代,替代(Replaces),被需求,被需求(Is Required By),需求,需求(Requires),部分于,部分于(Is Part Of),部分,部分为为(Has Part),被参照,被参照(Is Referenced By

54、),参照,参照(References),格式转换于格式转换于(Is Format Of),格式转换为,格式转换为(Has Format)。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 3.3.都柏林核心元数据的修饰词都柏林核心元数据的修饰词(2 2)DCDC修饰词的类型修饰词的类型编编码码体体系系的的修修饰饰词词lSubject元素元素:LCSH(Library of Congress Heading,国会图,国会图书馆主题词表),书馆主题词表),MeSH(Medecial Subject Headings,医学主,医学主题词表),题词表),DDC(Dewey D

55、ecimal Classification,杜威十进分类,杜威十进分类法),法),LCC(Library Congress Classification,国会图书馆分类,国会图书馆分类法法),),UDC(Universal Decimal Classification,国际十进分类,国际十进分类法)。法)。lDate元素元素:DCMI Type Vocabulary(DCMI类型列表)类型列表)lFormat元素:元素:IMT(因特网媒体类型)(因特网媒体类型)lIdentifier元素:元素:URI(统一资源标识符)(统一资源标识符)lSource元素:元素:URI3.2 3.2 机读目录与

56、元数据机读目录与元数据 3.2.2 元数据元数据 3.3.都柏林核心元数据的修饰词都柏林核心元数据的修饰词(2 2)DCDC修饰词的类型修饰词的类型编编码码体体系系的的修修饰饰词词lLanguage元素元素:ISO 639-2(语种名称代码),(语种名称代码),RFC 1766(语(语言身份标签)言身份标签)lRelation元素:元素:URIlCoverage元素的空间元素的空间(Spatial)修饰词修饰词:DCMI Point(DCMI地理地理位置),位置),ISO3166(标识国家名称的(标识国家名称的ISO3166代码),代码),DCMI Box(DCMI框图),框图),TGN(地理

57、名称词表)。(地理名称词表)。lCoverage元素的时间元素的时间(Temporal)修饰词修饰词:DCMI Period(DCMI时间范围),时间范围),W3C-DTF(基于(基于ISO 8601 的的W3C的日期和时间编码的日期和时间编码规则)。规则)。注:以上各修饰词的名称、标签、注释等属性可参见课后阅注:以上各修饰词的名称、标签、注释等属性可参见课后阅读材料教师社区读材料教师社区DCDC修饰词修饰词一文。一文。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 4.4.用用DCDC描述资源的实例描述资源的实例什么是什么是namespacenamespace(命

58、名空间)?(命名空间)?目前目前DC的名称空间(命名域)有的名称空间(命名域)有3个:个:1.15个基本元素的命名空间:个基本元素的命名空间:“http:/purl.org/dc/elements/1.1”域名为域名为dc:2.除除15个基本元素以外的所有元素的命名空间:个基本元素以外的所有元素的命名空间:“http:/purl.org/dc/terms/”域名为域名为dcterms:3.DC类型词表的命名空间:类型词表的命名空间:“http:/purl.org/dc/dcmitype/”域名为域名为dctype:中国高等教育文献保障系统中国高等教育文献保障系统 Dave Beckett IL

59、RT,University of Bristol 2002-07-31 3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 5.5.其他常见的元数据规范其他常见的元数据规范其他常见的元数据规范(Metadata Schema):RFC1807RFC1807:描述技术报告和:描述技术报告和FTPFTP文件等网络资源的著录格式。文件等网络资源的著录格式。MOA 2MOA 2(The Making Of America The Making Of America)和)和CDLCDL(California California Digital LibraryDigital Li

60、brary):描述数字图像的元数据规范。):描述数字图像的元数据规范。IEEE LOMIEEE LOM、GEM GEM、DCDCEducationEducation:描述教育资源的元数据规:描述教育资源的元数据规范。范。GILSGILS:政府信息资源元数据规范。:政府信息资源元数据规范。FGDC/CSDGMFGDC/CSDGM:描述地理空间信息的元数据规范。:描述地理空间信息的元数据规范。MEPGMEPG7 7:描述音像资料的元数据规范。:描述音像资料的元数据规范。3.2 3.2 机读目录与元数据机读目录与元数据 3.2.2 元数据元数据 6.DC6.DC与与MARCMARC的比较的比较(1

61、1)著录的对象不同)著录的对象不同(2 2)数据的形式不同)数据的形式不同(3 3)著录的主体不同)著录的主体不同(4 4)著录的详简程度不同)著录的详简程度不同(5 5)标识的方法不同)标识的方法不同返返 回回3.3 3.3 信息标引的含义与步骤信息标引的含义与步骤v3.3.1 信息标引的含义与质量控制信息标引的含义与质量控制n1.含义含义 通过对信息资源的分析,选用确切的检索标识,如分类号、主题词、关键词、人名、地名等,用以反映该信息资源内容的过程。是内容的内容分析和用词表达(转换标识)两个步骤的结合。n内容分析内容分析:在了解和确定信息的内容属性以及能够帮助揭示内:在了解和确定信息的内容

62、属性以及能够帮助揭示内容的某些外部属性后,将这些属性概括为主题并用自然语言表容的某些外部属性后,将这些属性概括为主题并用自然语言表述,同时分析主题概念之间或概念因素之间的结构关系。述,同时分析主题概念之间或概念因素之间的结构关系。n转换标识:转换标识:用专门的标引语言中的标识表达概括信息内容的主用专门的标引语言中的标识表达概括信息内容的主题概念或概念因素,构成一定形式的检索标识。题概念或概念因素,构成一定形式的检索标识。返返 回回v3.3.1 信息标引的含义与质量控制信息标引的含义与质量控制n2.标引的方式(标引的方式(信息组织信息组织P7378)(1)依内容单元选择的方式分 整体标引:对信息

63、整体内容或主要内容予以标引的方式。尽可能用一个主题概括信息整体内容或主要内容,赋予一个检索标识。当时,当无法将整体内容或主要内容概括为一个主题时,也可以标引出一个以上的主题。可单独使用,也可与其他方式结合使用。主要用于手工检索系统。例如:对例如:对中国大陆鸟类六种趋极疟原虫的记述中国大陆鸟类六种趋极疟原虫的记述进行整体标引,进行整体标引,只需标引只需标引“中国鸟类的趋极疟原虫中国鸟类的趋极疟原虫”这个整体主题。这个整体主题。对对岩石与矿物的物理性质岩石与矿物的物理性质进行整体标引,只得标引出进行整体标引,只得标引出“岩石的物理性质岩石的物理性质”和和“矿物的物理性质矿物的物理性质”两个主题。两

64、个主题。v3.3.1 信息标引的含义与质量控制信息标引的含义与质量控制n2.标引的方式标引的方式(1)依内容单元选择方式分v 全面标引:深入揭示信息的各部分内容,全面提取局部主全面标引:深入揭示信息的各部分内容,全面提取局部主题予以标引的方式。是最充分揭示信息内容的标引方式,题予以标引的方式。是最充分揭示信息内容的标引方式,能提高检索效率,尤其是检全率,但增加标引的工作量、能提高检索效率,尤其是检全率,但增加标引的工作量、成本及检索系统的规模成本及检索系统的规模。主要适用与计算机检索系统,尤其是计算机检索系统中学术论文、主要适用与计算机检索系统,尤其是计算机检索系统中学术论文、科技报告等的主题

65、标引。科技报告等的主题标引。v3.3.1 信息标引的含义与质量控制信息标引的含义与质量控制n2.标引的方式标引的方式(1)依内容单元选择方式分v 对口标引:只选择信息中对本系统用户有检索和参考价值的部分内容,提取个别局部主题予以标引的方式,也称重点标引。主要适合专业单位或检索系统对部分内容与本专业相主要适合专业单位或检索系统对部分内容与本专业相关的信息进行标引。关的信息进行标引。例如例如电子养花养鱼电子养花养鱼,在水产专业单位可采用对口标引的,在水产专业单位可采用对口标引的方式,只标引方式,只标引“电子养鱼电子养鱼”这个主题。这个主题。v3.3.1 信息标引的含义与质量控制信息标引的含义与质量

66、控制n2.标引的方式标引的方式(1)依内容单元选择方式分v 分析标引:在整体标引基础上,进一步将信息中部分内容析分析标引:在整体标引基础上,进一步将信息中部分内容析出,提取个别局部主题予以标引的方式。也称为补充标引。出,提取个别局部主题予以标引的方式。也称为补充标引。分析标引可在概括揭示整体内容的同事,突出信息中有较大分析标引可在概括揭示整体内容的同事,突出信息中有较大检索和参考价值的内容,特别是那些独立信息不多的主题。检索和参考价值的内容,特别是那些独立信息不多的主题。例如:例如:科技文献检索科技文献检索,除了对整体主题,除了对整体主题“科技文献检索科技文献检索”进行标进行标引外,还可将其中的引外,还可将其中的“索引法索引法”内容析出,做分析标引。内容析出,做分析标引。v3.3.1 信息标引的含义与质量控制信息标引的含义与质量控制n2.标引的方式标引的方式(1)依内容单元选择方式分 互见标引:对已经从一个角度或学科标引了的信息再从其他角度和学科出发,提取主题予以标引的方式。目的是从不同的学科或角度揭示同一内容,以便多途径检索。例如例如列宁论图书馆列宁论图书馆,按照主题,按照主题“列宁

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!