与关系数据无缝集成的XML事务关键技术分析

上传人:卷*** 文档编号:127440253 上传时间:2022-07-30 格式:DOCX 页数:135 大小:325.77KB
收藏 版权申诉 举报 下载
与关系数据无缝集成的XML事务关键技术分析_第1页
第1页 / 共135页
与关系数据无缝集成的XML事务关键技术分析_第2页
第2页 / 共135页
与关系数据无缝集成的XML事务关键技术分析_第3页
第3页 / 共135页
资源描述:

《与关系数据无缝集成的XML事务关键技术分析》由会员分享,可在线阅读,更多相关《与关系数据无缝集成的XML事务关键技术分析(135页珍藏版)》请在装配图网上搜索。

1、摘要摘要随着XML有关原则的推广和应用,如何有效管理大规模的XML数据成 为数据库领域的一种研究热点。为尽量重用关系数据库领域已有的众多成熟 理论和技术,如事务管理、存储管理、锁管理、安全性管理等,将XML数据 管理功能嵌入到老式的关系型数据库中成为目前流行的研究趋势。作为一种功能完善的数据库,为有效支持XML数据上的联机事务解决, DBMS在提供XML查询解决操作的同步,还必须可以执行多种XML数据更新 操作。这种更新不仅涉及XML文档的整体更新,还涉及对XML文档中某一部 分构造或者内容进行更新。由于XML的半构造化数据模型有别于关系数据库 中基于元组的构造化数据模型,XML数据在进行更新

2、时,需要对关系数据库的 事务解决和并发控制技术进行调节和加强。目前有关XML事务解决的研究尚 处在起步阶段,虽然有研究人员已经提出了某些事务模型和并发控制合同,但 是这些模型都是针对于原生XML数据库系统,而针对与关系数据无缝集成的 XML事务管理仍然缺少一种通用的解决架构。此外,在执行关系数据和XML 数据混合更新的基本上,如何保证更新后的XML文档仍然符合定义在其上的 构造约束和属性约束也是需要研究的一类问题。为弥补目前关系数据库在XML数据更新事务解决方面的缺陷,论文探讨 了一种与关系数据无缝集成的XML事务解决方案,提出了XML与关系数据混 合更新的层次架构;在此基本上,提出了多类型事

3、务调度模型和一整套针对 XML事务的并发控制管理方略。论文的重要内容涉及:(1)兼顾到XML数据和关系型数据逻辑构造的差别性,本文将XML数据 更新纳入到关系型数据事务的解决黎构卞,提出了与关系数据库无缝集成的 XML更新的层次模型XR-Update,构建了XML数据和关系型数据的混合更新引擎UE,将XML数据更新和关系型数据更新融为一体,并在此基本上提出了XML数据和关系数据的混合更新算法i (2)嵌入XML事务解决引擎的关系数据库系统构成了一种集成系统,在集成系统的事务执行过程中,XML数据与关系型数据不同的加锁粒度导致了系统 整体事务并发度下降。本文基于混合更新框架,提出了多类型事务概念

4、,具体摘要分析了多类型事务中的操作类型;并根据操作类型,将关系事务和XML事务 进行辨别,建立了与各自事务并发控制方略无关的调度模型,提出了调度算法; 并针对XML文档替代操作,提出理解决此类冲突的并发控制合同。(3)多种XML事务同步执行各自的更新序列会引出XML并发控制问题。 本文兼顾到XML数据和关系型数据逻辑构造的差别性,基于二层表模型,将 XML事务的并发控制方略有机地纳入到关系数据库的并发控制体系中,针对只 读事务之间以及读写事务之间的冲突,提出了基于元组的多版本时间戳合同一 MVXR;针对更新事务之间的写写冲突,提出了基于局部途径加锁方略的XML 数据并发控制合同P。该合同减少了

5、事务对锁的频繁祈求,提高了事务的 并发度和执行效率。(4)使用XML文档存储和互换信息,需要定义XML模式对XML数据施 加特有的构造约束和属性约束。对一篇有效的XML文档执行一系列更新操作 后,保证得到的文档仍然有效是XML数据更新领域一种重要的问题。已有的 XML文档纠错算法的时间复杂度很高,为指数级别。本文提出了一种基于更新 操作冲突检测方略的XML文档自动纠错算法,在算法中,提出了基于途径的 数据模型,该模型将XML文档片段和XML模式的树状构造扁平化为与之等价 的途径集合;针对于不符合模式约束的XML文档,采用动态规划算法实现了 一次一途径的纠错,并通过更新操作冲突检测方略获取所有合

6、法候选途径,实 验表白本文提出的自动纠错算法大大减少了纠错算法的时间复杂度。核心词:关系数据,XML,事务,无缝集成,并发控制,自动纠错AbstractAbstractWith the promotaon and appliealaon of XML standards,how to effectively manage the large-scale XML data has become the research hotspot m database domainIn order to reuse SO many mature theories and technologies in th

7、e relational database domain,such as transactmn management,storage management,lockmanagement,secunty management,and SO on,there lS a popular research trend thatembeds the XML management functaons into traditional ralational databaseAs a database with the perfect functmns,in order to effectively supp

8、ort the online transacuon processing based on XML data,m providing XML query processing funclaons,DBMS must also be able to perform various XML data update operatmns at the same timeThis kind ofupdate includes not only the replacement of XML document,but also the update on the part of structure or c

9、ontents in XML documentBecause the semistructured data model of XML is different fiom thetuple-structured data model of relational data,in processing the XML update,the transaction technology and concurrency control technology based 011 the relational database have to be adjusted and strengthenedAt

10、present the research of XML trailsa施on processing is in irrfaney,although some researchers have proposed some transactaon models and concurrency control protocols,but these models are proposed based on XML natwe database,and there lack the general management fiamework which integrete the XML transac

11、hon processing with the relational data transactaonprocessmg seamlesslyIn addition,based on the mixed update framework of relational data and XML data,how to guarantee the updated XML data to satisfy thesh僦aral constraint and attribute-coastramts which defined on血e X砌L data is alsoa kind of problem

12、need to be researchedIn order to make up the imperfection of XML transactaon processmg based on the relational database,in this thesis,an XML transaction processing architecture is discussed which is seamlessly integrated wim the relational data,and a hierarchymodel of mixed updating framework is pr

13、oposedOn this basis,the thesis presents aschedule model of multi-type transactions processing and a set of concurrent controlHIAbstractmanagement strategy for XML transactionsThe Illalll contributions and innovalaons 弱follows:(1)In this thesis,We pay attention to the logical structure difference bet

14、ween XML data and relational data,embed the XML update funelaon into the relational data transaction processing structure,present all XML update hierarchical model XR-Update which seamlessly integrated谢m relational database,construct the mixed update engme-XRUE,thus XML update and relational data up

15、date ale harmomously fused together,and based Oil this foundation,propose the mixed updating algorithms of XML and relational data(2)The relational database embedded XML transactton processing engine constttutes觚integrated systemIn the integrated system,the lock granularity difference between XML an

16、d relational data CaUSeS the systems transaction concurrency declineBased 013 the mixed update framework,We put forward the concept of multi-type tratlsactlons,and analyze the operatxon types of multitype transactionsAccording to the operatxon type,we make distinctions betweenrelational transaction

17、and XML transactaon,establish the schedule model which isindependent of the concurrent control strategy of XML and relational transactaons OWn,and then propose the scheduling algorithm,and present the concurrent control strategy by which solve the eontliets caused by the XML document replacement ope

18、rataons(3)In the integrated system,multiple XML Irnsactlons simultaneously execute their respective update sequence,which incites XML concurrency control problem In this thesis,We pay attention to the difference between XML logical structure and relational data logical structure,based 0n the bilevel

19、 table model,embed XML transaction concurrency control into relational database system organicallyAimingat solving conflicts among read-only transacttons and eonfilets between-read-only transactions and update transactions,we propose multi-vcrSlOll timestamp concurrency control protocolmMVXRAiming a

20、t solving conflicts among update laansactlons,we propose砸XML data concurrency control protocol based 011 local path locking-XLPThis protocol reduces the frequent lock request and increases the transaction cureurreneyIVAbstract(4)To USe XML document storage and exchange informalaon need to define the

21、 XML schema which exerts peculiar structure eonstramts and attribute constramts on XML documentsA valid XML document,after being performed a variety of update operations,should still be a valid XML documentThe time complexity of existing XML document correction algorithm is exponentialThis thesis pr

22、esents all XML automatic correction algorithm based on the conflict detection strategy among update operatmns,the algorithm propose a path data model,which faltten the tree structure ofXML document fragment and XML schema into the equivalent paths set Aiming at correcting the XML doeument which does

23、nt accord with the schema constraints,a dynatme programming algorithm 1S presented which can correct all error path in each execution of algorithm,and through the update operation conflictdetection strategy,algorithm obtains the enttre valid paths candidate,the experiments show that the proposed aut

24、omatic correctton algorithm can greatly reduce the ttme complexityKey words:relational data,XML,transaction,seamlessly integration,concurrencycontrol,automatic correctionVAbstractVl第一章绪论第一章绪论随着互联网技术的发展,XML已经成为数据体现和互换的新原则。各行各 业都积极采用XML格式表达其数据和信息,针对于大规模XML数据管理的研 究应运而生。老式关系数据库和原生XML数据库在XML事务管理方面均存在 着某些

25、缺陷,与关系型数据无缝集成的XML数据事务解决,既可以复用关系数 据库业已成熟的核心功能,又可以将XML数据更新纳入到关系型数据更新的事 务解决框架中,在这个框架中可以制定XML数据和关系数据的混合事务解决的 调度模型和并发控制方略。本章一方面简介论文的研究背景,阐明与关系数据无 缝集成的XML事务解决的必要性,另一方面描述论文研究内容和基本思路,最后给 出论文的组织构造。第一节研究背景可扩展标记语言(eXtensible Markup LanguageXML)【1】【2】是由国际万维网 联盟(W3C)制定的原则通用标记语言。XML语言的重要设计目的是在不同系 统(特别是通过Internet连

26、接的系统)之间实现数据共享。)口L语言的制定与使用得到了信息技术领域各大公司(如Microsoft、Sun Mi凹osystems、IBM、Oracle 等)的有力支持,从而获得了迅猛发展。XML凭借其通用性强、可自描述、扩 展性高等特点,已经成为Web上表达和互换数据的原则格式,例如5月 发布的XML Schemd31、以及6月发布的XLinkt41和XML Base5】等。此 外,XML的浮现为程序可以自动地解决Web数据信息以及Web服务(如 WSDL【61、SOAPt71、UDDI规范【8】)提供了一种公共基本。XPa,m 20于1月成为W3C推荐原则。XPath 20是-VJ由XPa

27、th 10和XQuery衍生而来的语言。XPath 20和XQuery 10的产生是同源的, 它们拥有不少相似的语法,并且不少文本也是一致的。xQue别是专门用于从XML文档中查找和提取数据的语言,xQuery 10在1月被确立为W3C推荐原则。XQuery相对于XML的关系,等同1本文的项目支持背景为国家“863”高技术发展筹划基金项目。无缝集成关系数据库系统的纯XML引擎 研制与核心技术研究”(项目编号:AA012152)1第一章绪论于SQL相对于数据库表的关系。XQuery被设计用来查询XML数据,不仅仅 限于XML文献,还涉及任何以XML形态呈现的数据,涉及数据库。XQuery 被构建

28、在XPath体现式之上,可以被所有重要的数据库引擎支持(如mM、 Oracle、Microsoft等)。同XML数据查询方面的研究相比较,有关XML数据更新方面始终缺少一 个公认的原则,尽管ISO SQL 组织在其SQLXML原则中【10】定义了更新语 法的基本构造框架。但是该原则没有明确规定XML数据更新的种类、更新的语 法形式等。在这种状况下,各个主流数据库提出了各自XML数据更新的语法、 语义。8月,W3C发布了有关XQuery更新扩展机制的候选规范XQuery Update Facilityl0t11】。它的发布无疑为XML数据更新语言的实现提供了语法和 语义上的参照原则。该规范提出的

29、XML更新语法可以做到与XQuery之间的无 缝对接,指明了下一代具有更新功能的XQuery语言原则的发展方向。为了有效地管理大规模的XML数据,研究者采用了两大类措施。一方面, 主流的数据库厂商纷纷提供多种支持XML数据的扩展和插件,通过这些扩展将 XML数据存储和检索集成到既有的关系型数据库中;另一方面,原生XML数 据库系统也不断涌现,这种数据库以XML数据模型为中心,具有为XML数据 量身定做的存储方案和查询引擎,在解决层次关系丰富、构造化限度不高的应 用时具有独特的优势。但是,原生XML数据库系统面临的最大问题是必须重新 实现关系数据库领域已经研究和实践了三十余年的众多成熟理论和技术

30、,如事 务管理,存储管理,锁管理,安全性管理等。如此大规模的反复开发工作显然 会挥霍巨大的人力和物力;并且同关系数据库相比j原生XML数据库在功能和 性能方面也没有优势可言。因此,运用老式的关系型数据库将XML数据管理和 关系型数据管理进行整合成为了耳前的研究趋势。作为一种功能完善的数据库,为了有效地支持XML数据上的联机事务解决, DBMS在提供XML查询解决操作的同步,还必须可以执行多种XML数据更新 操作。这种更新不仅仅涉及XML文档的整体更新,还涉及对XML文档中的某 一部分构造或者内容进行更新。由于XML数据的半构造化数据模型有别于老式 关系型数据库的基于元组的构造化数据模型,XML

31、数据在进行更新的时候,需 要对老式的关系型数据库的事务解决和并发控制技术进行调节和加强。目前关 于XML事务解决的研究尚处在起步阶段。虽然有研究人员已经提出了某些事务2第一章绪论模型和并发控制合同,但是这些模型都是针对于原生XML数据库系统,而针对 与关系型数据无缝集成的XML数据事务管理缺少一种通用的解决架构。此外, 在进行关系型数据和XML数据混合更新的基本上,如何保证事务提交后,更新 后的数据符合定义在XML数据上的构造约束和属性约束,也是需要研究的一类 问题。开始实行的国家863高技术发展筹划项目无缝集成关系数据库系 统的纯XML引擎的研制与核心技术研究,针对老式基于关系数据库管理XM

32、L 数据所导致的语义丢失以及性能下降问题,研究纯XML引擎技术及其与关系数 据库无缝集成的实现措施,研制一种与关系数据引擎无缝集成的纯XML数据引 擎,以增强数据库系统的功能和合用范畴。本文以该项目子课题“无缝集成关 系数据库系统的XML数据更新的设计与实现为依托,研究将XML数据更新 与关系数据更新无缝集成以及XML事务的调度与并发控制。此外,XML数据 更新所引起的XML验证与自动纠错也是本文的研究工作之一。第二节研究内容和基本思路目前有关XML更新事务解决的研究尚处在起步阶段。虽然有研究人员已经 提出了某些事务模型和并发控制合同,但是这些模型都是针对于原生XML数据 库系统,而针对与关系

33、型数据无缝集成的XML数据事务管理缺少一种通用的处 理架构。本文将在关系型数据和XML数据混合更新架构设计,多类型事务调度 模型设计,XML事务并发控制方略设计,XML更新后的增量验证与自动纠错算 法设计等方面进行研究。121论文研究内容本文以与关系数据无缝集成的XML数据更新、事务调度、并发控制为主线, 研究XML数据和关系数据的混合更新的语法语义,研究XML数据更新与关系 数据更新无缝集成的措施,研究多类型事务调度模型及有关算法,研究XML事 务的并发控制方略,研究XML更新后的模式验证与自动纠错算法。本文的具体 研究内容涉及:(1)设计与关系型数据库无缝集成的XML数据更新方案。XML数

34、据更新 方案的设计目的一方面是保证既有的关系数据库可以辨认)aL数据更新的语法语第一章绪论义。因此,需要研究目前针对XML更新的有关规范,并设计关系数据和XML 数据混合更新的语法语义;另一方面,需要研究XML更新流程与关系数据库中原有 的关系事务解决流程无缝耦合的方式;最后,要研究如何重用关系数据库数据 存储层的原子操作机制实现XML数据更新的原子操作。此外,要保证嵌入了 XML更新框架的关系数据库系统保持原有的关系数据解决性能。(2)研究集成系统下多类型事务的调度方略。嵌入了XML数据解决引擎 的关系数据库系统不再是老式意义上的关系型数据库,而是一种集成系统。在 集成系统中,由于XML数据

35、与关系型数据加锁粒度不同,导致了系统整体事务 并发度下降。因此,需要研究一种新的调度模型,保证可以对关系事务和XML 事务所构成的混合事务进行合理调度:保证该调度模型与既有的关系型事务并 发控制方案和XML事务并发控制方案兼容;同步,需要研究基于此模型的调度 规则和调度算法。(3)研究XML事务并发控制方案。多种XML事务同步执行各自的更新序 列会引出XML并发控制问题。由于既有的XML并发控制合同普遍并发度不高, 因此,需要研究高效的XML事务并发控制方案;研究多类型事务的操作性质, 并基于此,研究XML事务加锁方略和有关合同规则与算法;研究如何将XML 事务并发控制方略有机地纳入到关系数据

36、库系统的并发控制体系中。(4)研究XML文档增量验证与自动纠错措施。对一篇有效的XML文档执 行一系列更新操作后,如何保证得到的文档仍然满足定义在其上的模式约束是 XML数据更新领域一种重要的问题。既有的XML文档纠错算法复杂度高,因 此需要研究采用关系表存储XML模式约束的措施,研究高效的XML文档自动 纠错措施。122研究工作的基本思路本文将对XML数据更新、事务调度、并发控制和XML文档自动纠错问题 进行系统研究,针对上述的研究内容,拟采用的研究思路如下:(1)拟采用框架模型将XML数据更新与关系数据库原有的更新机制无缝 集成。框架模型的设计目的不仅要实现关系型数据的更新,并且要保证XM

37、L数 据和关系型数据的混合更新。因此,在架构的设计思路上需要考虑几种方面的 内容:一方面,在XML存储管理方面,要设计将XML逻辑数据模型映射为关系 模型的措施,运用关系表持久化XML逻辑数据模型,并且要设计一套针对XML4第一章绪论节点的动态id编码方案,以支持节点上的所有更新操作。另一方面,在XML更新的语法语义设计方面,要按照W3C制定的X姗更新机制扩展规范,定义XML和关系数据混合更新的语法、语义。最后,在XML更新与关系数据更新无缝集 成的具体实现过程中,要构建XML数据和关系型数据的混合更新引擎,从而将 XML数据更新和关系型数据更新融为一体,并在此基本上提出XML数据和关 系数据

38、的混合更新算法。(2)拟提出集成系统下的多类型事务调度模型,以解决该系统下整体事务 并发度下降的问题。在多类型事务调度模型中一方面要定义集成系统中的多类型 事务,具体分析事务中操作的性质;另一方面,要根据操作性质,将关系事务和XML 事务进行辨别,建立与各自事务并发控制方案无关的通用型多事务调度模型, 并提出调度算法。最后,要针对XML文档的替代操作,提出解决该类冲突的并 发控制合同。(3)拟提出一套集成系统下的XML事务并发控制方略,以系统地保障XML 数据更新所引起的数据库一致性问题。一方面定义XML事务之间应当遵守的加锁 合同,另一方面要将XML事务并发控制有机地纳入到关系数据库系统的并

39、发控制体 系中。因此,要针对只读事务之间以及读写事务之间的冲突,提出基于时间戳 的多版本并发控制合同;要针对更新事务之间浮现的写写冲突,提出一套新的 XML事务并发控制合同。该合同要充足运用本文所提出的XML智能节点编码 和多类型调度模型的性质,力图在事务的并发度和执行效率方面优于目前通用 的XML事务并发控制方略。(3)拟设计一种基于更新操作冲突检测方略的自动纠错算法,以实现高效 的XML文档自动纠错。已有的XML文档纠错算法将XML模式约束表达为树 自动机,通过对树自动机状态空间进行遍历来验证XML数据的有效性并进行纠 错,时间复杂度为指数级别。为了减少XML文档自动纠错算法的时间复杂度。

40、本文拟采用一种基于途径的数据模型,将XML文档片段和儿模式的树状结 构扁平化为与之等价的途径集合,通过途径匹配算法对XML文档进行模式约束 验证。此外,针对不符合模式约束的XML文档,拟采用基于更新操作冲突检测方略的自动纠错算法。这种算法的核心思想是将不符合模式约束节点的途径作 为待纠错对象,采用动态规划算法进行XML文档途径纠错,从而得到符合模式 约束并且与顾客输入的XML片段尽量接近的候选。第一章绪论第三节论文构造本文分为六章,文章构造及各章重要内容组织如下: 第一章是全文的总述。一方面简介与关系数据无缝集成的XML数据更新的研究背景;另一方面描述本文重要的研究工作内容、研究工作的基本思路

41、;最后给出本文的整体组织构造。 第二章简介与关系数据无缝集成的XML数据更新方案。一方面给出与关系数据库无缝集成的XML数据更新架构的层次模型0Update;另一方面按照由高至低的层次给出XML数据和关系型数据混合更新的语法语义;提出与关系数据事务解决耦合的XML数据事务解决引擎-I TE以及有关的更新算法;提出通过模 型映射的措施将XML逻辑数据模型映射为关系模型的措施;最后通过实验验证 更新方案的性能。第三章简介集成系统下多类型事务调度模型xRTS。一方面定义集成系统的 概念;另一方面分析集成系统下XML数据事务和关系事务并存所导致的原有系统整体事务并发度下降问题;提出与关系事务耦合的XM

42、L事务调度模型嘲TS;提出与各自事务并发控制方案无关的通用型多类型事务调度方案,并提出调度 算法;提出针对XML文档的替代操作冲突的并发控制方案;最后通过实验验证 XRTS的性能。第四章简介解决XML事务冲突的XML事务并发控制合同。一方面,针对XML 事务的只读事务之间以及读写事务之间的冲突,提出符合XML数据更新特点 的多版本并发控制合同MV)皿;针对XML更新事务之间的冲突,提出基于局 部途径加锁方略的并发控制合同-XI,P,该合同根据事务操作性质的不同仅仅对 目的节点或者其父节点加锁,提高了事务的并发度和执行效率;最后通过与 Node2PL合同的实验对比,验证XLP合同的性能。第五章简

43、介XML文档自动纠错措施。一方面提出使用元组模型存储XML模 式约束的措施;另一方面定义XML文档和XML模式约束的途径体现,将XML文 档片段和XML模式的树状构造转化为与之等价的途径集合;再次提出基于更新 操作冲突检测方略的自动纠错算法;最后通过实验验证算法的性能。第六章总结全文的研究工作,并对此后的研究做出分析和展望。6第二章与关系数据无缝集成的XML数据更新架构第二章与关系数据无缝集成的NML数据更新方案XML数据更新是XML数据管理中非常重要的构成部分。这种更新不仅仅 涉及XML文档的整体更新还涉及对XML文档中的某一部分构造或者内容进行 频繁地、大规模地更新。因此将XML更新功能系

44、统地纳入到数据库系统中势 在必行。本章一方面简介XML数据更新问题的研究背景,简介关系数据库中执 行数据管理的事务的概念及特点、XML数据模型。另一方面简介XML数据更新的 研究现状,并分析其优缺陷。最后提出与关系数据无缝集成的XML数据更新 方案。该方案定义XML数据和关系型数据混合更新的语法、语义。采用模型 映射的措施将XML逻辑数据模型映射为关系模型,并且将XML更新功能无缝 集成到关系数据的事务解决流程中。实验表白,集成XML更新功能的关系数 据库系统在具有关系数据和XML数据混合更新功能的基本上维持了原有关系 数据库系统的数据解决性能水平。第一节舳数据更新的研究背景在关系数据库领域中

45、,对数据进行查询和更新是通过事务的执行来实现的。 以事务的形式实现XML更新是数据库系统必须具有的功能。本节一方面对关系 型数据的事务进行简述,另一方面对XML数据模型进行简介,最后给出XML数据 更新的特点。211关系数据库的事务概念事务【121314】是一种或者多种必须被原子执行的数据库操作的集合。这些操 作要么全做,要么全不做,因此,事务是一种不可分割的工作单位。在使用基 本的SQL操作语言时,每一条语句自身就是一种事务。如果要显式地控制事务,则需要使用SQL命令START TRANSACTION来启动事务执行,并且以COMMIT或ROLLBACK来结束一种事务。COMMIT表达事务成功

46、地结束,在 这个事务中的所有操作对数据库的任何变化都被永远地建立在数据库中;7第二章与关系数据无缝集成的XML数据更新架构ROU卫ACK表达事务夭折或者不成功结束。该事务中的任何操作对数据库的 修改都被撤销。数据库系统中同步也许有诸多事务要执行,这些事务要么互不相干,要么 访问相似的数据项。为了保证数据库的完整性,数据库系统必须维护如下特性:原子性(Atomic):事务是数据库的逻辑工作单位,事务中的所有操作要 么所有执行,要么都不执行。只有保证事务的原子性,才可以保证数据库的一 致性状态。一致性(Consistency):事务的一致性指的是在一种事务执行之前和执行之 后数据库都必须处在一致性

47、状态。该状态是由数据库的完整性约束来保障的。 而事务的执行,就是使得数据库从一种一致性状态转化为此外一种一致性状态。 而事务自身不损害数据库的完整性约束。当多种事务同步执行时,数据库也许 会处在不一致的状态,这时就需要DBMS提供并发控制机制来保证数据库的一 致性。隔离性(Isolation):当多种事务并发执行时,每个事务都感觉不到系统中 有其她的事务在执行,从而保证了数据库的一致性。持久性(Durability):一旦事务成功执行后,该事务对数据库的修改就是 永久的,虽然系统浮现故障也不受影响。事务的ACID特性揭示了一种对的执行的事务所应具有的特性。而保证事 务的ACID特性是事务解决的

48、首要任务。本章后续内容中所论述的XML更新实现、多类型事务调度、XML并发控 制合同均是环绕着保证数据库一致性,维护事务的ACID特性展开的。212 XML数据模型针对XML数据模型,W3C推出了系列规范,其中最为重要的是DOM模型【15】和XDM模型161。DOM(文档对象模型,Document Object Model)定义TXML 文献的逻辑构造以及访问和解决XML文献的一系列原则措施,从面向对象的角度看,DOM给出了XML文档的对象模型。XML文档的DOM模型定义如下: 定义21 XML文档的DOM模型定义一篇XML文档可以当作为一颗有根树丁=(乃E,root(r),We(D),且Ec

49、 V玎root(13Vo其中:第二章与关系数据无缝集成的XML数据更新架构腥舭节点的有穷非空集合;E是XML文档中边的集合。如果“是1,的父节点,则“v)V阢root(乃为定义在趾的函数,其值为獭根节点;设1,是XML文档中的任意一种节点,则卸口Document,Element, Attribute,Value。如果type(roD攻乃)=Document,则表白该文档为一棵 XML文档树;如果巧pP(加D攻D)=Element,则表白该文档为一种XML文 档片断。定义21将XML文档表达为一种分层的树状构造(一般称为DOM树)。由于XML文献自身就具有层次构造,因而这种描糊L文献的措施是相称

50、自然且有效的。运用DOM提供的原则接口,应用程序可以以便地实现对任意DOM树节点的存取,从而达到对XML文献的访问的目的。 图2i表达一篇XML文档bibxml的DOM树,根据定义21,得到其DOM树如图22所示:图21简朴的XML文档示例bibxml9第二章与关系数据无缝集成的XML数据更新架构口Document OElementAttributeValue图22 bibxml的DOM树与DOM这种面向对象的数据模型不同,W3C还定义了此外一种XML数据模型,aPXQuery查询语言所操作的舭数据模型一如M。XDM是XPath171、X咖和XSU【18】共同的数据模型。根据该模型,一篇XML

51、文档可以表达为一种序列,如定义22所示:定义22 XML文档的序列模型 一篇XML文档D可以表达为一种序列(Sequence)S:S=slS2一 si -sd,其中一一表达Ji与鼯l之间的顺序,在本文中,该顺序是对XML树中节点进行中序遍历后的成果。一Si为XML中的某个节点,表达为-二个四元组:sc-(id,tag,type,value) 其中,耐为此节点的编号,并且是该节点的唯一标记。typeDocument,Element,Attribute,Value表达该节点的类型;熘为节点的名称;value为节点的值;觉得XML节点的个数,定义为以=ISl。在定义22中,节点谢的编码方案可以拟定一

52、篇XML文档中任意两个节点之 间的构造关系(例如,祖先后裔、父子、前后、左右兄弟等),具有这样性质的 节点耐称为智能节点耐。有关智能节点编码方案的具体讨论请参见本章第三节。lO第二章与关系数据无缝集成的XML数据更新架构本文按照定义22所定义的XML数据模型,并且采用最基本的D洲研编码作为智能节点谢的编码方案。将图21中的bibxml表达为如下的序列: XML=f(1,bin,Document,Null)一(11,publisher,Element,”Addison”)一(12,book,Element,Null)-(13,book,Element,Null)一(121,year,Attrib

53、ute,”竹)一(122,title,Element,”XML)一(123,author,Element,Null)一(124, pncc,Element,6595)一(131,year,Attribute,”)4(132,title,Element, ”CSharp”)一(133,editor,Element,Nllll)一(134,pnc岔,Element,2985)一(1231, last,Element,”Stevens”)一(1232,first,Element,”Tom”)一(1331,last,Element, ”Oerbarg”)一(1332,first,Element,”Da

54、rcy”)一(1333,address,Element,”CITI”)XML数据的序列模型提供了XML数据的元组表达措施。这种表达措施涉及 了所有XML的节点信息以及节点间的构造关系,并且与关系数据库的元组表达 措施在逻辑体现上保持一致。因此,完全可以使用关系表来存储XML文档。213 XML数据更新的特性由于XML的大量涌现,顾客对XML数据管理的需求越来越大。其中XML数 据的更新是其重要的构成部分。以数据库系统作为载体实现XML更新是目前通 用的一种措施。这种XML数据更新的特性是:事务性:XML更新的执行环境是面向多顾客的联机事务解决(OLTP) 环境。顾客需要面对一种支持XML更新功

55、能的系统,输入XML更新的 语句,实现对存储在数据库中的XML数据的持久性更新。要实现这样的 功能,就必须将XML的更新操作封装在事务中,并且要在事务的执行过 程中保证事务的ACID特性。动态性:XML更新的功能不仅仅涉及XML文档的整体更新,还涉及对 XML文档中的某一部分构造或者内容进行更新。在OLTP环境下,这种 更新不是偶尔的、针对某个节点的更新,而是一种频繁的、针对大规模 节点的更新,是一种动态更新。要维护动态更新的特性,就需要XML 数据自身的存储方式具有支持动态更新的功能;此外,事务的具体实现 措施也要可以支持动态更新方式。一致性:与关系数据库的事务类似,以事务形式浮现的XML更

56、新也必须 保证数据库的一致性。多种事务同步执行时,要定义相应的并发控制机 制来维护数据库的完整性约束。此外,由于XML文档自身具有与之相应第二章与关系数据无缝集成的XML数据更新架构的模式约束,当XML文档被更新后,也必须要保证XML文档与定义其 上的模式约束保持一致。第二节XML数据更新的研究现状在XML数据管理发展之初,业界对于XML数据管理的重点在于XML数 据的查询及优化。但是,随着XML作为数据载体的广泛应用。为了有效地支持XML数据上的联机事务解决(Om),XML数据管理系统在提供XML查询解决操作的同步,还必须可以执行多种XML数据更新操作。本节从XML数 据存储方案、节点编码方

57、案、XML更新实现三个方面分析目前XML数据更新 的研究现状。221 XML数据存储方案的研究现状XML数据存储方案涉及两大类:一类是基于关系的XML数据存储方案, 此外一类是原生XML数据库存储方案。基于关系的XML数据存储方案重要涉及基于大对象方式和基于模式映射 方式。基于大对象的措施【191【20】直接将整篇XML文档存储为一种文本或者二进 制大对象(CLOB或者aLoa),技术简朴,容易实现;该措施可以迅速地装载和提取整篇XML文档,但是任何XML文档片段或节点级的更新操作都需要解析整篇XML文档,当系统存储规模和并发访问量比较大的时候,系统的性能 将非常低。基于模式映射的方式【241

58、1251是在关系数据库内核的基本之上,将 XML文档数据按照该文档模式定义的逻辑构造拆散、重新组装成关系数据存储 到若干张关系表中;在提取XML数据时,XML查询一方面转换为SQL查询,利 用SQL查询的优化机制提取出关系数据,然后再将关系数据还原成XML树形构造数据。可见,基于模式映射的方式管理XML数据时,在存储、查询和发 布过程中,会波及XML文档与关系表、XML查询与SQL的多重转换,从而导 致语义丢失和性能下降。原生XML数据库存储方案是以XML数据模型(XDM、XPath、XQuery) 为中心,底层存储是专门为XML数据设计的,可以以更加自然的方式解决XML12第二章与关系数据无

59、缝集成的XML数据更新架构数据。在存储层上可以建立各类XML索引以加速XML查询解决,以及引入传 统关系型数据库中的日记、事务机制来完善原生XML数据库。目前已经浮现 了某些原生XML数据库的原型系统,例如Natix261、TIMBER27、exist281、 OrierltX293031】等。分别简介如下:NatixNafix是德国曼海姆大学数据库研究组开发的XML管理系统,它采用 基于物理划分的子树存储数据,并可设立参数控制子树规模。装载数据时, Natix需要把XML文档的逻辑模型分割为若干子树,再将子树作为记录存 储到磁盘页中【32】。更新数据时,Nafix使用额外的算法维护子树的分裂

60、,确 保每棵子树都能被磁盘页所容纳【331。如需要访问单个XML节点,Natix必 须读取并解析该节点所属的整棵子树。T蚴ERTIMBER是美国密歇根大学数据库研究组开发的一种纯XML数据库管 理系统。她们的研究焦点重要集中在XML查询代数和查询解决,仅从编 程接口角度实现了支持更新的存取措施,没有提供完整的更新语言支持。eXistexist是由德国人W|0lfgang所领导的小组开发的开源纯舭数据库系统。它在设计之初,彻底摒弃了原有关系数据库系统的设计思想。而是遵 照XML数据模型存储XML数据,具有高效的基于索引的XQuery查询处 理机制。但是,像eXist这样的纯XML数据库系统需要重

61、新开发存储管理、 并发控制、备份恢复等一系列原则部件。这些原则部件在XML数据模型 上的测试还需要一种较长的过程,因此,目前eXist的发布版本对于XML 数据密集的多顾客大型应用尚不成熟。,OrientX中国人民大学的数据库研究组是国内最早开展XML数据管理研究的科 研团队。OrientX是她们开发的纯XML数据库管理系统。OrientX建立了 一种以XML数据为中心的数据管理系统,支持对XML数据的存储、查询、 更新等操作。OrientX支持描述化查询语言XQuery的一种子集,具有一次一集合的查询解决能力。基于代价估计的查询优化措施分析不同的查询方案,选择代价最小的执行。基于模式的途径索引根据模式和数据的编码迅速判断父子或祖先后裔关系。OrientX支持采用多种粒度的树形构造存储数第二章与关系数据无缝集成的XML数据更新架构据,系统根据数据模式特点等提供不同的物理存储措施,拥有统一的逻辑目,石。上述四个系统从底层存储设计、索引建立、事务机制等都是为XML单独 设计的,虽然比较适合XML数据的管理,但是总体来说,这些系统还不成熟。222 XML节点编码方案的研究现状为了使XML数据存储可以支持在联机解决(Om)环

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!