数据库基本概念在专利检索中的运用陈卫明

上传人:san****019 文档编号:23740099 上传时间:2021-06-10 格式:PPT 页数:81 大小:563.01KB
收藏 版权申诉 举报 下载
数据库基本概念在专利检索中的运用陈卫明_第1页
第1页 / 共81页
数据库基本概念在专利检索中的运用陈卫明_第2页
第2页 / 共81页
数据库基本概念在专利检索中的运用陈卫明_第3页
第3页 / 共81页
资源描述:

《数据库基本概念在专利检索中的运用陈卫明》由会员分享,可在线阅读,更多相关《数据库基本概念在专利检索中的运用陈卫明(81页珍藏版)》请在装配图网上搜索。

1、1 数据库基本概念在专利检索中 的运用 陈卫明 许瑛 姚文 闫小苏 2007.7.23 2 目录 1、数据、信息和数据处理 2、数据库系统概述 3、关系型数据库的三种操作 4、布尔逻辑运算(集合运算) 5、三种字段类型 3 1、 数据、信息和数据处理 1.1、 三个世界 按照数据库理论 , 有现实世界 、 信息世界 、 计 算机世界等三个世界 。 现实世界的 “ 客观事物 ” ( 事实 、 事件 ) 在信 息世界中抽象为 “ 实体 ” , 并定义了各种 “ 属 性 ” 来描述 “ 实体 ” 。 “ 实体 ” 在计算机世界被描述成一条 “ 记录 ” 。 客观事物 -实体 -记录 4 1、数据、信

2、息和数据处理 1.2、 数据 ( data) 是一些符号 , 用来描 述客观事物的特征 。 这些符号可以是数字形式 、 文字形式 ( 以及图形 、 图像和声音等 ) 。 例如 学生成绩 、 飞机班次 、 测量温度 、 ( CPRS中的 ) 发明人姓名 、 发明名称 、 文摘 、 优先权项 、 文献号 、 申请号 、 分 类号 、 申请日 、 公开日等 。 5 1、数据、信息和数据处理 1.3、 信息 ( information) 信息是经过加工 ( 记载 、 分类 、 组织 、 关联 、 解释 、 提炼 、 消化理解 ) 而具有使用价值的数 据 。 ( 信息 =数据 +数据处理 ) 有的信息由

3、一个数据构成 , 比如分类号;有的 信息由几个数据构成 , 比如优先权项 、 CPRS中 的一条记录 。 数据和信息在形式上往往并无区别 , 尤其是那 些由一个数据构成的信息 。 例如分类号 。 6 一、数据、信息和数据处理 1.4、 数据和信息的关系 ( 信息是数据的内涵 、 二者是形与质的关系 。 ) ( 数据是信息的载体 , 信息的表现形式仍是数据 。 ) ( 信息是经过加工而具有使用价值的数据 , 信息 =数据 +数据处理 。 ) 数据只是把客观事物记录下来 , 并没有特定目的;而 信息是有针对性的 ( 某一问题 、 某一论点 、 某一特定 目的 ) 来收集 、 处理数据 , 用来作为

4、决策或参考的依 据 。 所以两者的差别在于是否存在某一 特定目的 。 7 1、数据、信息和数据处理 1.5、 数据处理 数据处理是指对各种类型的数据进行加工 ( 收集 、 存储 、 分类 、 计算 、 检索 、 传输 ) 的过程 。 数据处理的目的使之成为信息 。 数据处理通常也称为信息处理 。 8 2、数据库系统概述 2.1、 数据库 ( Datebase, DB) 长期存放在外部存储设备 ( 外存储器 、 外存介质 ) 上 、 可以以各种方式进行组 织 、 可以共享的数据 ( 包括这些数据之 间的联系 ) 集合 。 ( 这些数据与应用程序 例如 VB相互独 立 ) 9 2、数据库系统概述

5、2.2、 数据库系统 ( Database System, DBS) 数据库不能独立存在 , 是数据库系统的一部 分 。 在实际应用中 , 人们所面对的其实是数据库 系统 。 数据库系统具有管理和控制数据库的能力 ( 输入 、 输出 、 组织数据 ) 。 10 2、数据库系统概述 数据库系统包括: 硬件 ( 计算机 ) 数据库 ( DB) 数据库管理系统 ( DBMS, 常用的数据库管理系 统有 FoxPro、 Oracle、 SYBASE、 INFORMIX等 , 用来建立 、 管理 、 控制数据库 ) 数据库管理员 用户和应用程序 11 2、数据库系统概述 2.3、 信息世界的术语 实体

6、( Entity) 对应于现实世界中的 “ 客观事物 ” 。 实体 可以指代具体事物 , 如一个学生 , 一本 书 ( 一件专利文献 ) ;也可以指代抽象 事件 , 如一场足球比赛 。 12 2、数据库系统概述 属性 ( attribute) 属性用来描述实体的特性。 如学生实体可以用若干属性(学号、姓名、年 龄、性别、出生日期、班级)来描述。 属性的具体值称为属性值,如 CN2745142Y ( 授权 公告号)、马林(申请 专利权 人)、 2004年 9月 16日 2004.9.16(申请日)是属性 值。 13 2、数据库系统概述 2.4、 计算机世界的术语 记录 ( record) 、 元

7、组 对应于信息世界的 “ 实体 ” , 二维表中的一行 。 字段 ( field) 对应于信息世界的 “ 属性 ” , 二维表中的一列 。 每个字 段有字段名 ( 标头 ) , 例如 “ 发明人 ” 、 “ 申请号 ” 等等 。 字段值 ( value) 、 数据项 对应于信息世界的 “ 属性值 ” , 二维表中的一格 。 关系 ( relation) 、 数据库文件 14 2、数据库系统概述 一个关系就是一个二维表 , 每个关系有 一个关系名 。 一个关系可以存储为一个 数据库文件 。 例如某专利文献数据库可以有专利号的 表 , 发明名称的表 , 专利权人的表等 。 下面是一个模拟数据库 ,

8、 该表是由一个 以上的表 ( 关系 ) 通过 “ 关联 ” 而成 。 15 PN(字段名 ) TI PA IC PD 5000000 (5000000) car G&M B60j31/0 0 10/25/1998 ( 一行表示 一条记录 ) ( 5000001) computer IBM G06f3/00 01/02/2000 模拟数据库(不是真的) (一列表示一 个属性) 2、数据库系统概述 16 2、数据库系统概述 2.5、 关系的三种类型 一对一的关系 ( 例如一个学生只有一个学号; 再例如一件专利只有一个申请号 ) 一对多的关系 ( 例如某班主任老师可以有多个 学生 , 再例如一个发明

9、人可以有多件专利 ) 多对多的关系 ( 例如一个学生可以选修多门课 , 一门课可以供多名学生选修;再例如一个分类 号之下可以有多件专利文献 , 一件专利也可以 有多个分类号 ) 17 2、数据库系统概述 2.6、 数据库的三种类型 数据模型是数据库结构的组织形式 , 目前数据 库系统中常用的数据模型有三种: 层次模型 ( Hierarchical Model) :用树形结 构表示数据及其联系的数据模型 , 树形结构只 能表示一对多联系 : 18 班主任 ( 微 机 871班 ) 王小艳 李峰 张勇 2、数据库系统概述 19 2、数据库系统概述 网状模型 ( Network Model) :用网

10、络结 构表示数据及其联系的数据模型 。 网状模型可以直接表示多对多联系 , 但 其中的结点间连线或指针更加复杂 , 因 而数据结构更加复杂: 20 dl001( 刑法 ) 王小艳 李峰 张勇 dl002( 声乐 ) dl003( 绘画 ) 2、数据库系统概述 21 2、数据库系统概述 关系模型 ( Relational Model) :用关 系表示的数据模型 。 关系是指由行与列构成的二维表 , 关系 不但可以表示实体间一对多的联系 , 通 过关系间的连接 , 也可以表示多对多的 联系 ( 见连接 ) : 22 学号 姓名 年龄 性别 班级 870101 王小艳 18 女 微机 871 870

11、102 李峰 18 男 微机 871 870103 张勇 19 男 微机 871 微机 871班学生表( A) 2、数据库系统概述 23 学号 课程编号 870101( 王 ) dl001( 刑 ) 870101( 王 ) dl002( 声 ) 870102( 李 ) dl001( 刑 ) 870102( 李 ) Dl002( 声 ) 870103( 张 ) Dl002( 声 ) 870103( 张 ) dl003( 画 ) 选修表( B) 2、数据库系统概述 24 课程编号 课程名 授课教师 授课地点 dl001 刑法 周火 主楼 102教室 dl002 声乐 刘琴 主楼 102教室 dl0

12、03 绘画 任安 主楼 504教室 课程表( C) 2、数据库系统概述 25 3、关系型数据库的三种操作 3.1、 选择:从关系中找出满足给定条件的记 录 ( 元组 ) , 即在二维表中选行 。 ( 例 ( 例如: 对表 A中李峰的选择 ) 3.2、 投影:从关系中找出若干字段 ( 属性 ) 组成新的关系 , 即在二维表中选列 。 ( 例如: 对表 B课程编号的投影 ) 3.3、 连接:将两个关系按某种条件提取部分 ( 或全部 ) 记录及部分 ( 或全部 ) 字段组合成 新的关系 。 ( 例如:表 B、 表 C按照课程编号 关键字 连接 ) 26 课程编 号 课程 名 授课教师 授课地点 学号

13、 dl001 刑法 周火 主楼 102教室 870101 、 870102 dl002 声乐 刘琴 主楼 102教室 870101 、 870102 、 870103 dl003 绘画 任安 主楼 504教室 870103 连接而成的新表( D) 3、关系型数据库的三种操作 27 4、布尔逻辑运算(集合运算) 4.1、并(或、 or)( AB ) A集合和 B集合所有元组合并 , 再删去重复的元组 ,这种运算称为 “ 并 ” (或);所组成新的 C集合,称为 A、 B的并集 4.2、 差 ( 非 、 not) ( A-B) A集合中删去 ( A集合中 ) 与 B集合相同 ( 重复 ) 的元组

14、, 这种运算 称为 “ 差 ” ( 非 ) ;所组成新的 C集合称为 A、 B的差集 4.3、 交 ( 与 、 and) ( AB ) 既属于 A集合又属于 B集合的元组 , 这种运算称为 “ 交 ” ( 与 ) ; 所组成新的 C集合 , 称为 A、 B的交集 28 交( ,与, and) 属于集合 A且属于集合 B 的元素组成的集合 C,叫 做 A, B的交集 (属于 A 又属于 B的元素组成的集 合, A and B=C) 例: A-汽车, B- 发动机, C-即有 汽车 也有 发动机 的记录集 caps中两词间空格, “ and”, “ +” 集合 B 集合 A 集合 C 29 并(

15、,或 , or) 属于集合 A或属于集合 B 的元素组成的集合 C,叫 做 A, B的并集 ( A, B所 有元素合并,删除重复 元素组成的集合, A or B=C) 。 例: A-汽车, B-发动机, C-仅 有 汽车 的记录集,仅有 发动机 的记录集,即有 汽车 也有 发动机 的 记录集 。 caps中用 “ or”, “ , ” 集合 A 集合 B 集合 C 30 差( -,非, NOT,与非, ANDNOT) 属于集合 A而不属于集合 B的元素组成的集合 C, 叫做 A, B的差集 (在 A 中排除属于 B的元素后组 成的集合, A not B=C) 例: A-汽车, B-发动机, C

16、-从所有含 汽车 的 记录集中去掉含 发动 机 的记录集 caps中用 “ without”, “ not”, “ #” 集合 A 集合 B 集合 C 31 4、布尔逻辑运算(集合运算) 4.4、 差并 ( ornot、 或非 ) 从总集合排除 B,再与 A集合合并。 三种情况 4.4.1、 A集合的所有元素都是 B集合的元素时 , 还要考虑 A集合与 B集合哪个更大: 4.4.1.1、 如果 A集合更大 , 或非结果 =总集合; 4.4.1.2、 如果 B集合更大 , 总集合被挖去部分 B只填入了局部 , 有 “ 空区 ” ) 32 4、布尔逻辑运算(集合运算) 4.4.2、 A集合的所有元

17、素都不是 B集合的 元素 , 或非结果 =总集合 not B 4.4.3、 A集合的部分元素是 B集合的元素 , 总集合被挖去部分 B只填入局部 , 有 “ 空区 ” ) 33 总 B A 或非( 4.1.1.1、 A所有元素都是 B的元 素,且 AB) 34 总 或非( 4.1.1.1、 A所有元素都是 B的元 素,且 AB) 35 或非( 4.1.1.2、 A所有元素都是 B的元 素,且 AB) 总 B A 36 总 或非( 4.1.1.2、 A所有元素都是 B的元 素,且 A”; 必须输入完整的年月日( YYMMDDYYMMDD), 例如: 850101020831;可用 YYYY和 Y

18、Y;年月 日格式;连续输入时可用 “ +” 79 5、三种字段类型 情形 3: USPTO的 “ patent search”( ISD授权日 PD公 开日 /APD申请日 /PRIR优先权日) ,输入值间不能用 or, “ 日 ” 可用 “ $”,时间区间用 “ -”。授权专利数据库 日期型输入值有多种输入格式: 20030403、 4-30-2003 (月日年)、 4/30/2003(月日年)、 20030327- 20030403(时间区间) 情形 4:欧洲局的 “ espacenet”只有公开日检索框 , 不 能使用范围检索 , 而且只能是 YYYYMMDD 情形 5: EPOQUE(OPD、 ORDPD), 年月日中间用 “ -”, 范围检索更为精确 80 算符 意义 举例 = 等于 PD=1987-10-20 小于 PD 大于 PD1993-12 = 小于等于 ORD= 大于等于 ORD=1994-10-30 : 范围 PD=1994-01:1994-08 5、三种字段类型 81 结束语 主要参考目录: 数据库原理与应用 李春葆著 清华大学出版社 数据库的基本概念 许瑛 讲稿 谢谢大家!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!