基于XML的数据库分析

上传人:小*** 文档编号:121641859 上传时间:2022-07-19 格式:DOC 页数:12 大小:48KB
收藏 版权申诉 举报 下载
基于XML的数据库分析_第1页
第1页 / 共12页
基于XML的数据库分析_第2页
第2页 / 共12页
基于XML的数据库分析_第3页
第3页 / 共12页
资源描述:

《基于XML的数据库分析》由会员分享,可在线阅读,更多相关《基于XML的数据库分析(12页珍藏版)》请在装配图网上搜索。

1、北华大学计算机科学技术学院数据库原理课程论文基于XML的数据库分析班级:软件08-2班小组成员:国娟 李阿雪 王丹 张雪 李国婧指导教师:胡晓宏2010年12月1日基于XML的数据库分析摘要:数据库提供了扩展的功能,能够在XML文档和数据库之间进行数据的传输。通常是设计成为能够存储和提取以数据为中心的文档。一般来说是把XML文档进行解析以后,存储到相应的表格中,当然,也可以存储以文档为中心的文档,也就是说把整个文档作为一个单一的表中的一个字段,然后通过文本检索机制进行查询。因为许多数据库现在能够把内容发布到网站上,基于XML的数据库和XML效劳器之间的差异就变得很模糊。XML本身是不是数据库,

2、从严格的意义上来说,XML仅仅意味着XML文档。因为尽管一个XML文档包含数据,但是如果不通过其他的软件的软件来进行数据处理的话,它本身只不过是一个文本文件。所以XML本身不不能和数据库挂上钩,但是加上一些其他的辅助工具,我们可以把整个XML看成是一个数据库系统,XML文本本身可以看成是数据库中的数据区,DTD或者Schemas可以看成是数据库模式设计,XQL可以看成是数据库查询语言,SAX或DOM可以看成是数据库处理工具。Abstract: The database provides expanded capabilities to the XML documents and databas

3、es for data transmission. Usually designed to be able to store and retrieve data-centric document. Generally it is to parse XML documents after the storage to the appropriate form, of course, can be stored in the document-centric document, which means the entire document as a single table in a field

4、, then the text retrieval mechanism to search. Because many databases are now able to publish to the site, based on the XML database and XML server becomes very blurred the difference. XML itself is not a database, from the strict sense, XML simply means that the XML document. Because, despite an XM

5、L document containing the data, but if not through other software for data processing software, then it itself is just a text file. XML itself does not and so the database process is linked, but with a number of other auxiliary tools, we can put the entire XML as a database system, XML text itself c

6、an be seen as data in the database area, DTD or Schemas can be seen as is a database schema design, XQL can be seen as a database query language, SAX or DOM processing tools can be viewed as a database. 关键字:XML 关系型数据库 XML效劳器 中间件Keywords: XML relational database XML server middleware 引言:我们知道当存在大量数据需要

7、处理分析的话,最好是把这些数据放到数据库中,所以几乎所有大型的商业应用系统都是和数据库相关联的,所以如果XML需要在商业领域大展宏图的话,也必须要和数据库相联系。作为一种“数据库格式,XML有一些优势:例如,它是自描述的所用的标记描述了数据的结构和类型,尽管缺乏语义,可交换的(portable)Unicode,能够以树型或图形结构描述数据。同样它也有缺点,例如,它显得有些繁琐,由于要对它进行解析和文本转换,所以数据访问速度较慢。一个更有用的问题就是在较为宽松的意义上,XML及其周边技术是否可以算作“数据库 - 数据库管理系统(DBMS)。答案是“在某种程度上是(sort of)。从正面来说,X

8、ML提供了许多数据库所具备的东西:存储(XML文档), 模式(DTD, XML schema,RElAX NG 等等), 查询语言(XQuery, XPath, XQL, XML-QL, QUILT等等,编程接口(SAX, DOM,JDOM)等等。从反面来说,它缺少一些作为实用的数据库所应具备的特性:高效的存储,索引,平安,事务和数据一致性,多用户访问,触发器,在查询多个文件等等。1 XML数据库的开展从早期将XML转换为关系型数据表或大型对象,到今日转向原生XML数据型态,关系型数据库与XML之间的合作日益紧密。 10年前XML开始起草并向W3C提案,而在1998年后成为W3C的标准。事隔1

9、0年之后,XML已经随着网络应用日益普及,更在Web Services和SOA推波助澜下,可以预见XML的角色将会更形重要。 观察XML的重要开展趋势之一,是XML和关系型数据库的合流。IBM甫于6月在美国发表的新版本数据库DB2 9.0,便以原生XML数据型态和存取技术作为改版重点之一。事实上,微软于去年年底推出的SQL Server 2022同样也在XML上下了一番功夫,改变过去将XML转换成关系型数据表的存放方式,让开发人员可以用XML的方法使用储存在数据库中的XML文件或 片段。其它如Oracle或Sybase等数据库也都具备在数据库中处理XML的技术和工具。由于XML局部技术仍在审议

10、,因此每家数据库厂商除对标准的 规格支持外,也各自开展不同的实作方式。 2 XML数据库介绍如果仅按数据库这个术语的本质来看,XML文件就是数据库,它是数据的集合。在许多方面看起来它和其他文件没什么区别 - 无论如何,每个文件都含有某种类型的数据。目前XML数据库有三种类型: (1)XMLEnabledDatabase(XEDB),即能处理XML的数据库。其特点是在原有的数据库系统上扩充对XML数据的处理功能,使之能适应XML数据存储和查询的需要。一般的做法是在数据库系统之上增加XML映射层,这可以由数据库供给商提供,也可以由第三方厂商提供。映射层管理XML数据的存储和检索,但原始的XML元数

11、据和结构可能会丧失,而且数据检索的结果不能保证是原始的XML形式。XEDB的根本存储单位与具体的实现紧密相关。 (2)NativeXMLDatabase(NXD),即纯XML数据库。其特点是以自然的方式处理XML数据,以XML文档作为根本的逻辑存储单位,针对XML的数据存储和查询特点专门设计适用的数据模型和处理方法。 (3)HybridXMLDatabase(HXD),即混合XML数据库。根据应用的需求,可以视其为XEDB或NXD的数据库,典型的例子是Ozone。 XML数据库是一个能够在应用中管理XML数据和文档的集合的数据库系统。XML数据库是XML文档及其部件的集合,并通过一个具有能力管

12、理和控制这个文档集合本身及其所表示信息的系统来维护。XML数据库不仅是结构化数据和半结构化数据的存储库,像管理其它数据一样,持久的XML数据管理包括数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。这些文档是持久的并且是可以操作的。 当前着重于页面显示格式的HTML标记语言和基于它的关键词检索等技术已经不能满足用户日益增长的信息需求。近年来的研究致力于将数据库技术应用于网上数据的管理和查询,使查询可以在更细的粒度上进行,并集成多个数据源的数据。但困难在于网上数据缺乏统一的、固定的模式,数据往往是不规那么且经常变动的。因此,XML数据作为一种自描述的半结构化数据为Web

13、的数据管理提供了新的数据模型,如果将XML标记数据放入一定的结构中,对数据的检索、分析、更新和输出就能够在更加容易管理的、系统的和较为熟悉的环境下进行,因而我们将数据库技术应用于XML数据处理领域,通过XML数据模型与数据库模型的映射来存储、提取、综合和分析XML文档的内容。这为数据库研究开拓了一个新的方向,将数据库技术的研究扩展到对Web数据的管理。3 XML数据库优势与传统数据库相比,XML数据库具有以下优势: 1、XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。 2、提供对标签和路径

14、的操作。传统数据库语言允许对数据元素的值进行操作,不能对元素名称操作,半结构化数据库提供了对标签名称的操作,还包括了对路径的操作。 3、当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集,如果己经以XML格式存储信息,那么XML数据库利于文档存储和检索;可以用方便实用的方式检索文档,并能够提供高质量的全文搜索引擎。另外XML数据库能够存储和查询异种的文档结构,提供对异种信息存取的支持。4 基于XML的数据库产品分类根据Ronald Bourret在XML Database Products

15、一文中的描述,XML Database中包含有七种类型的产品,分别为: 中间件Middleware 1、 与XML相结合能驱动XML的数据库XML-Enabled Databases,比方Oralce和微软都宣称在它们最新的数据库产品都都能够和XML进行无缝的衔接。2、 原始的XML数据库Native XML Database3、 XML效劳器XML Servers4、 XML应用效劳器,比方IBM的WebSphere 5、 内容管理系统Content Management Systems下面我们对每一种产品做一个具体的说明和介绍中间件:所谓中间件就是用来在XML文档和数据库之间进行处理和转化

16、的软件。主要应用于以数据为中心的应用里面,它可以用各种各样的语言编写,一般来说它需要用到ODBC, JDBC,或者是 OLE DB. 尽管它可以通过Internet进行是数据的传输,但是一般它都是通过Web效劳器来实现数据的传输。下面我们需要考虑当把XML文档存储到数据库中,如何选择适合你应用程序的中间件。实际上,在我们选择中间件的时候,我们要考虑下面一些因素 1 数据类型: XML不支持数据类型,也就是说,在XML文档中的所有数据都是文本,即使数据它本身代表了另外一种数据类型,比方日期或者整数。通常,数据传输中间件将把数据转化为其他类型。 2 二进制数据处理:有两种通常的方法存储XML文档中

17、的二进制数据:未经过解析的实体(unparsed entities)和Base64编码。 3 Null类型处理:在关系数据库世界中,NULL表示该数据不存在,它和0或者是空字符串当然是不一样的。当然,XML也支持NULL的概念。如果一个可选择的元素类型或者属性是NULL的话,它就不包括在这个文档里面。当映射一个XML文档的结构到数据库或者根据数据库内容生成XML文档的时候,你需要考虑可选元素类型和属性跟可NULL的列之间的映射。 4 字符集:一个XML文档可以包含任何Unicode字符,而不幸的是,许多数据库并不支持Unicode。因此如果你的数据包括非ASCII字符的时候,需要注意数据库和中

18、间件对这些字符的处理。 5 关于XML中的处理指令:处理指令并不是XML文档中的数据,因此中间件就很难决定如何存储它们。所以在选择中间件的时候,要看它们对处理指令的处理情况。 6 标记存储:注意不同的中间件对标记的处理是不一样的。而且在数据库中的存储模式也不同典型的中间件有:ADO:它可以实现数据库和XML文档之间的双向转换。XML支持把一个记录集合对象保存为一个XML文档,它也能够把一个XML文档作为一个记录集合进行处理,这样就在XML文档和数据库之间提供了一个桥梁。这种映射实际上是模型驱动的,数据可以被看成是一棵对象树,一个具有嵌套结构的树可以作为一个嵌套的记录结果集被显示,反之也是如此。

19、另外,如果记录集合数据有变化的话,可以反映到相应的XML文档中,而XML文档中内容的变化也可以导致数据库内容的变化。 ASP2XML:主要是通过一个COM对象实现XML文档和基于ODBC或者是OLE DB的数据库之间数据的传递。该产品实际上是基于模型驱动的,把XML文档看成是一个单一的表,当把数据从数据库传递到XML文档的时候,用户指定一个SELECT语句,输出包含了ASP2XML专用的标签。当把XML文档的数据传递到数据库的时候,XML文档必须包含ASP2XML专用的标签。该COM对象是支持自动化的,也就是说它能够在剧本语言中使用,比方ASP。5 XML效劳器一般认为,XML效劳器是一个提供

20、数据效劳的平台,而这里的数据就是以XML形式出现的,而这些数据主要是为分布式应用程序效劳的,比方电子商务和B2B应用等。XML效劳器通常包括了一个完整的应用开发环境,并通过各种数据存储方式来使应用程序可以方便的获取和使用这些数据。存储的数据包括传统的数据库数据、电子邮件信息和文件系统等等。我们知道传统的Web效劳器都是基于HTML文本进行信息传送的,随着XML技术的出现,对于基于XML的Web效劳器的需求也就产生了。那么到底什么是XML效劳器呢?准确定义XML Server这个概念是困难的,因为这实在是一个比拟新,而且概念很广泛的东西,虽然已经有许多的产品称自己为XML Server,比方Da

21、taChannel公司的DataChannel Server 4.1;Software AG公司的Tamino;Excelon公司的excelon,但在应用的范围上以及功能上,每种产品都各不相同,因此这里也就不为XML Server进行定义,而是归纳这几种产品的共同拥有的一些特点,以说明的方式来向大家解释XML Server这个概念。 简单地讲,XML Server是一个提供数据的平台,它能够以XML文档的形式与分布式的应用进行数据交互。比方电子商务这一类的应用。这听上去和传统的数据库非常的相似,它和数据库一样提供数据的存贮与提取功能,但数据的格式的是基于XML的,因此在数据的处理方面,所用的

22、是和传统数据库完全不同的技术了。 所以XML Server被认为是XML Database其中的一种,XML-enabled Server那么相对来讲比拟容易理解,因为它本质上就是一个Web Server,对于客户端而言,浏览Web,客户端不会感觉它和传统Web Server有什么太大的区别,但实际上Server端在对请求REQUEST处理方法上,XML-enabled Web Server和传统Web Server是完全两种不同的方式,这是由于XML文档与HTML文档本身的特性所决定的。我们大家都知道,XML文档是一种以数据为中心的文档,XML文档本身没有表示格式化的信息,而是通过特定的XS

23、L或者CSS来表现,也就是说数据和表现是别离的。而在客户端提交需求后由XML-enabled Web Server将内容与形式结合后把最终结果发布给客户端的Web Server。因此这是一种胖效劳器,瘦客户的模式。这种模式同微软将XSL Parser集成到IE中的设计思想是完全不同的。它的优点是能够对不同的设备浏览Web的提供各自相应的格式的文档,而不需要人工的干预。 从另外一个角度讲,XML Server可以提供比单纯XML文档更强的管理XMl格式数据的能力,而且可以防止用传统数据库时需要进行数据转换的过程因为XML是标准的扩展标记语言,并不是各个公司专属的技术,而数据库厂家对自己的数据库都

24、有不同的格式,所以必须通过一些中间件进行转换,而获得高效。 当然,任何技术都不是尽良尽美的,任何一项新的技术在没有完全成熟以前都会存在许多的缺点,XML Server同XML-enabled Server也不会例外,它们分别存在下面一些缺点或问题: 对于XML Server而言:XML Server的性能如何还没有得到验证,因为它采用的是一种全新的数据组织方式,而这种方式在过去还没有得到过广泛的应用。正如我们有理由看好XML Server开展前景的同时,我们也有理由对这种没有经过大范围使用的产品持疑心态度。我们可以看一下几种典型XML Server产品的配置需求。 DataChannel Se

25、rver 4.1 在Windows环境下的硬件要求: 500MHz or faster Pentium III processor with at least 256MB of RAM DataChannel Server 4.1 在Windows环境下的硬件要求: Sun Ultra 10 or equivalent. At least 256MB of RAM Tamino 在Windows环境下的硬件要求: At least 300MHZ or faster. At least 256MB of RAM 对于XML-enabled Web Server而言:最大的问题是XML-enabl

26、ed Web Server太复杂了,比拟起原来用Html和传统Web Server建设Web,懂得使用XML这些先进技术的人还是太少了,而且Server的安装也显得太复杂,而开发工具那么又太专业了。如何使电脑的初级用户能很快的学会使用它,是它需要解决的另外一个问题。 基于XML的Web效劳器体系结构如下所示:最后,我们看一下微软对基于XML的Web效劳器的支持,它的实际实现方法是通过IIS的ISAPI扩展用以提供通过 直接访问SQL Server并将查询结果形成XML返回到客户端而完成的。最简单的访问方法是直接 的URL中使用SQL语句: :/IISServer/VirtualRoot?sql

27、=SELECT+*+FROM+Customers+FOR+XML+AUTO 同时需要注意的,我们可以在URL中执行存储过程和使用xml文档模板。6 结束语XML 已经取得了稳固的地位。大多数行业和政府组织都对他们的 XML 模式做了标准化,并要求电子文档必须符合这些模式。既然通过线路交换的 B2B 数据已经采用了 XML 格式,为什么不在数据库中按原样pureXML存储这些数据呢?将数据存储为 XML 之后,可以使用 XQuery 和标准的 SQL/XML 对它进行编制索引、查询、检验、操作、转换和更新。随着越来越多的应用程序逻辑被放在查询中,数据库可以以 Web 效劳和 feed 的形式公开

28、它的存储过程,从而成为面向效劳体系结构SOA环境中活泼的参与者。参考文献1.李德有;基于XML电子病历数据存贮与转换的研究D;哈尔滨理工大学;2022年2.瞿裕忠,张剑锋,陈峥,王丛刚;XML语言及相关技术综述J;计算机工程;2000年12期3.张璞,庄成三;XML查询语言技术与实例分析J;计算机应用研究;2000年05期4.宋庆美;基于XML的图书目录查询的实现方法及其比拟J;情报杂志;2002年09期5.郭锋,戴向华;XML新一代页面标记语言的特性及应用前景J;计算机时代;1999年05期6.王焱;郑俊辉;范锐;XML技术及其在电子商务中的应用A;全国第十五届计算机科学与技术应用学术会议论

29、文集C;2022年several group number, then with b a, =c,c is is methyl b two vertical box between of accurate size. Per-23 measurement, such as proceeds of c values are equal and equal to the design value, then the vertical installation accurate. For example a, b, and c valueswhile on horizontal vertical errors for measurement, General in iron angle code bit at measurement level points grid errors, specific method is from baseline to methyl vertical box center line distance for a, to b vertical box distance for b, list can measured- 11 -

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!