分布式数据库系统中的查询优化

上传人:daj****de 文档编号:170175977 上传时间:2022-11-19 格式:DOCX 页数:5 大小:12.73KB
收藏 版权申诉 举报 下载
分布式数据库系统中的查询优化_第1页
第1页 / 共5页
分布式数据库系统中的查询优化_第2页
第2页 / 共5页
分布式数据库系统中的查询优化_第3页
第3页 / 共5页
资源描述:

《分布式数据库系统中的查询优化》由会员分享,可在线阅读,更多相关《分布式数据库系统中的查询优化(5页珍藏版)》请在装配图网上搜索。

1、分布式数据库系统中的查询优化金正淑1,訾华亮2,吕东方3(东北电力学院信息工程系,吉林吉林1320摘要:分布式数据库系统由于数据的分布和冗于使得分布式查询处理增加 了许多新的内容和复杂性,不同的查询处理方法,其查询的费用和并行处理程度 是大不一样的,因此,分布式数据库系统的查询优化较集中式数据库系统更重要, 效果更显著。根据分布式数据库系统的特点,简要介绍分布式查询优化的目标、 策略及查询优化的基本方法。关键词:分布式数据库;分布式查询;查询优化分布式数据库系统是计算机网络技术与数据库技术互相渗透和有机结合的 产物。具有数据独立性、集中与自制相结合的控制机制、适当增加数据冗于、事 务管理的分布

2、性等特点。在分布式数据库系统中,数据独立性除了数据的逻辑独 立性与物理独立性外,还有数据分布独立性亦称分布透明性。分布透明性指用户 不必关心数据的逻辑分片,不必关心数据物理位置分布的细节,也不必关心重复 副本的一致性问题,同时也不必关于局部场地上数据库支持哪咱数据模型。有了 分布透明性,用户的查询程序书写起来就如同数据没有分布一样,使系统使用起 来更简单、有效。在集中式数据库系统中,为减少空间的浪费和保证数据的一致性,要尽量减 少数据的冗余,而分布式数据库系统却希望增加数据的冗于来提高系统的可靠 性、可用性和改善系统性能。但是由于数据的分布和冗于,使得分布式数据库系 统查询处理增加了许多新的内

3、容和复杂性,因此分布式查询处理的优化显得更为 重要。1分布式查询优化的目标无论是在集中式数据库系统中还是在分布式数据库系统中,一个查询策略的 选择都是以执行查询的预期代价为依据的,不同的只是构成一个查询代价的主要 因素在这两类系统中不完全一样。在集中式数据库中,由于系统大都运行在单个 处理器的计算机上,所以查询执行总代价为CPU代价+1/0代价。而在分布式数 据库系统中,由于数据的分布式数据库系统中,由于数据的分布和冗于,使得查 询处理中需要考虑站点间传输数据的通信费用,所以除了考虑 CPU 代价和 I/0 代价之外,还应该包括数据在网络上的传输代价。即总代价为CPU代价+1/0代 价+通信代

4、价。分布式数据库系统的查询优化有两种不同的目标。一种目标是以总代价最小 为标准,另一种目标是以查询响应时间最短为标准,这一点在分布式数据库系统 中具有重要的意义。因为分布式数据库系统是由多台计算机组成的系统,数据的 分布和冗余地增加查询的并行处理的可能性,从而可以缩减查询处理的响应时 间,加快查询处理速度。由此可见,与集中式查询相比,分布式查询处理增加了 不少新的内容和复杂性。虽然在分布式查询处理中也使用某些集中式查询处理中 的技术和方法,但就其问题的规模和优化的因素都与集中式查询处理有质的不同。2分布式查询策略的重要性在分布式数据库系统中,查询优化包括两个内容;查询策略优化和局部处理 优化,

5、而查询策略优化和局部处理优化,而查询策略优化尤为重要。即使是集中 式数据库,查询执行也有很多途径,而在分布式数据库中,同一查询则有更多的 执行策略。查询的执行策略不同,其系统资源耗费及响应时间也不相同,因此查 询策略的优化是查询优化的一项重要内容。下面我们以一个简单的分布式药品采 购数据库系统为例,通过对两个站点上的三个关系进行简单的连接操作,说明查 询策略优化的重要性。两个站点上的关系分配见表1。现要查询的是所有采购产地为天津且剂别为片剂的药品品号和名称。假设:每个元组的长度均为100?bi t;通信系统的传输速度为10f4?bi t/ 秒;通信延迟时间为1秒;产地为天津的元组有10个。解:

6、在分片透明DDBMS的支持下:SQL语句是:SELET 品号,品名 FROMYP, CG, GYWHEREYP品号=CG品号AND CG药厂编号=6丫药厂编号AND剂别=“片剂” AND产地=“天津”; 现在,根据通信代价的计算公式:T二总传输延迟+总数据量/数据传输速度, 对6种可能的查询存取策略分别进行计算。计算结果见表2。上表只给出了查询处理中的通信时间,查询总代价中还应包括某一站点上的 处理时间即I/O时间CPU时间。由于分布数据库中通信时间是最主要的开销,这 里仅仅是为了说明问题而忽略了处理时间,只比较了查询处理中的通信时间。由此可见,不同的查询策略通信时间相差很大,达多个数量级,因

7、此查询策 略的优化非常重要。一个好的查询策略应该使数据的传输量和通信次数量少,以 减少数据传输和通信的时间,从而减少查询的总代价。3分布式查询优化的基本方法在分布式查询处理技术中,查询优化的基本类型通常包括两类:针对查询执 行代价的优化和针对查询响应时间的优化。针对查询执行时间代价进行优化的目 标是,使查询执行所行使用的系统资源尽量地少,从而降低整个系统开销。针对 查询响应时间优化的目标是尽量减少查询的响应时间,而不计较系统资源的耗 费。查询的执行方式不同,其系统资源耗费及响应时间也不相同,因此需要查询 优化器选择最好的查询执行方式,即尽量使冗余、不必要的操作减为最少,选择 最便宜和最快的方法

8、执行数据库操作,选择最好的调度执行顺序,并尽可能地采 用标准的可共享的子方法。查询优化有两种基本方法:第一是查询转化,即以不同的顺序执行关系操作, 如连接和投影操作。第二是查询映射,即使用一系列高效的算法来存取各种设备 和实现关系操作。即查询映射是针对关系的存取方法和操作的执行算法进行决 策,而查询转化则是针对操作执行的顺序及不同站点之间数据流动的顺序进行决 策。目前,对于分布式数据库系统的查询处理有许多优化算法,如基于关系代数 等价变换的优化算法,以及适于多站点连接操作的基于半连接操作的优化算法和 基于直接连接操作的优化算法。基于关系代数等价变换规则的倨化算法的基本思想是,把查询问题转变为关

9、 系代数表达式,分析得到的查询语法树,按等价变换规则优化。算法首先利用关 系代数等价变换规则,把查询树中的连接和合并操作尽可能上提,选择和投影操 作尽可能下移到片段的定义处,然后判断是水平分片还是垂直分片,若为水平分 片,则把分片条件与选择条件进行比较,去掉存在矛盾的片段,如果只剩下一个 片段,就可以去掉一个“并”操作。若为垂直分片,则把片段的属性集与投影操 作所涉及的属性集进行比较,去掉无关的所有片段。如果只剩下一个垂直片段, 就可以去掉一个连接操作,从而达到优化查询的目的。下面仍以分布式药品采购 数据库系统为例,简要介绍基于关系代数等价变换的优化算法。现已知全局关系药品YP(品号,品名,剂

10、别,规格和采购关系CG(品号,药 厂编号,数量)已被水平分片,如图1所示:现要查找针剂中药品的采购数量在100件以上的药品名称。查询的SQL语句 为:SELE DISTING 品名 FROM YP,CGWHERE YP品号=CG品号AND剂别=“针剂” AND数量100:其关系代数表达式是:n品名(o剂别二“针剂” A数量100 YP品号=CG品片(YPXCG)其查询树见图2。图中已把YP品号=CG品号(YPXCG)中的选择和笛卡儿乘 积两个操作合并成一个自然连接操作了。图 3 为转换成相应片段上的查询树。现 在,把图 3 的查询树,按等价变换标准继续变换成图 4 和图 5。图 5 即为最终的

11、 优化结果。由图4可看出,YP2的分片条件与查询选择条件矛盾,故去掉YP2片段,也 就去掉了一个合并的操作,同时还去掉了对 YP1 的一个选择操作,从崦达到了优 化的目的。4结束语分布式数据库系统的查询处理是用户与分布式数据库系统的接口,也是分布 式数据库系统主要研究问题之一。由于它的建立环境复杂,技术内容丰富,对于 查询优化技术,还有许多问题有待进一步研究和解决。随着计算机网络计术的飞 速发展,相信分布式数据库技术也必将得到迅速发展,并日趋完善。参考文献1 贾焰,王志英分布式数据库技术M 国防工业出版社,2000.72 萨师煊,王珊数据库系统概论M 高等教育出版社,2000,2.3 郑振楣,于戈分布式数据库M 科学出版社,1999.4 网络管理与技术丛书,分布式数据库M 中华人民大学出版社,2001.11.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!