异构环境下面向语义的主动信息服务系统

上传人:1777****777 文档编号:36390929 上传时间:2021-10-30 格式:DOC 页数:6 大小:357KB
收藏 版权申诉 举报 下载
异构环境下面向语义的主动信息服务系统_第1页
第1页 / 共6页
异构环境下面向语义的主动信息服务系统_第2页
第2页 / 共6页
异构环境下面向语义的主动信息服务系统_第3页
第3页 / 共6页
资源描述:

《异构环境下面向语义的主动信息服务系统》由会员分享,可在线阅读,更多相关《异构环境下面向语义的主动信息服务系统(6页珍藏版)》请在装配图网上搜索。

1、精品论文推荐异构环境下面向语义的主动信息服务系统任柏青 北京邮电大学智能通信软件与多媒体北京市重点实验室,北京(100876) E-mail:rbq10829摘要: 目前随着信息资源的快速增长,各个领域信息资源都存在数字化、网络化、异质 异构、难以规范、数量爆炸性剧增的特点,为了更好的对信息整合和有效控制并能提供良好 的个性化、主动性的信息服务,各国科研人员对网络基础信息共享服务标准体系的建立进行了深入的研究,它是网络基础信息全面共享的前提。主动性和个性化是目前分布式环境中的信息服务系统的两个重要特征,两者的结合有助于提高系统的服务质量。本文给出了一种在 分布式异构环境下支持语义的个性化主动服

2、务模型,通过提取分布式异构数据源的语义元数 据模型来解决异构性问题,并在此基础上提供个性化的主动服务功能。关键词:主动服务,本体,元数据1.引言企业在信息化建设过程中,各个部门往往根据自身对信息的要求和特定应用系统的需求 而采用不同的数据组织形式,因而产生了大量的异构环境下的异构系统和异构信息。导致难 以实现数据的共享、数据的交换,难以保证数据的一致性。在这种分布式异构环境下难以为 用户提供良好的主动服务。另外,在信息检索、信息过滤、信息分类等个性化服务方面,主要还集中在根据关键字 来描述用户和资源的特征,并通过关键字匹配方法实现用户和资源信息的对应关系,很少考 虑到语义层面上来,因此丢失很多

3、语义方面的信息。元数据作为“数据的数据”,可以有效的解决分布环境的异构性的问题。而本体作为一种 知识的表示方式,将知识表示扩展到语义层次上,能实现语义上的信息的表示。本体也被认 为是解决语义层次的信息集成的有效方法1。2.相关知识2.1 本体本体最早是哲学领域的一个概念。从哲学范畴来说,本体是客观存在的一个系统的解释 或说明,关心的是客观事物存在的抽象本质。自上世纪 90 年代以来,本体被广泛应用于人 工智能、计算机等领域。关于本体的定义有许多,目前获得较多认同的是 1998 年 Studer R 的解释2:“本体是对 概念体系的明确、形式化、可共享的规范说明”。由此定义我们可以看出,本体具有

4、以下特 征:1)本体是一个概念模型,是通过抽象出客观世界中的一些现象的相关概念而得到的模 型。这个概念模型可以被理解和表示为概念的集合(如实体、属性等) ,以及它们 的定义和相互间的关系。2)本体所使用的概念的约束条件都有明确的定义。3)本体所体现的知识是获得共同认可的知识,反映的是相关领域中公认的概念集。4)本体作为一种能在语义层次上共享知识的概念模型,具有良好的概念层次结构和对 逻辑的支持能力。- 6 -在知识工程领域,本体是由用于描述某种确定现实情况的特定术语集,加上一组关于术语内涵意义的显式假定集合构成。在最简单的情况下,本体只描述概念的分类层次结构;在 复杂的情况下,本体可以在概念分

5、类层次的基础上加入一组合适的关系、公理、规则来表示 概念之间的其它关系,约束概念的内涵解释。2.2 元数据模型元数据作为描述某种类型资源属性、提供信息资源定位、管理和精确检索服务的结构化 数据,是一种可以被机器理解和处理的信息。规范、标准的信息资源元数据结构是构建信息 资源共享与服务平台的基础3 。元数据模型是抽象化的元数据,从更高层次上规定了元数据 的功能、数据结构、格式、设计方法、语义语法规则等多方面内容。2.3 推送技术传统的网络资源对于所有用户都是具有相同内容的,但同样的信息内容在不同的个体手 中表现出各不相同的价值来。现在的网络为用户带来了空前丰富的信息资源,使得获取具有 个性特色的

6、信息更为不易。信息推送技术是信息个性化服务的解决方案。推送技术是一种信息发布技术,意指信息服务机构依据一定的技术标准或协议,主动从 网上的信息源或信息制造商选择并获取信息,并以一定的方式(如电子邮件,手机短信等) 有 规律地将信息传递给用户的一种技术。Push 技术最早于 1996 年由美国 Point Cast 公司提出, 它也因而成为第一个在 Internet 上使用 Push 技术发布信息的公司4。Push 技术与传统的使用浏览器查找信息的 Pull 技术不同之处在于:后者由客户机发送 服务请求,服务器根据请求进行处理并返回用户所需的结果,在这里用户是数据传输操作的 发起者,它从服务器中

7、把信息拉出来。这样,网络上传输的只是用户的请求和服务器针对该 请求所作的内应,但是服务器所提供的服务是被动的。在 Push 技术系统中,要求用户事先选择所需信息频道,服务器根据用户预先设定好的触发事件和发送内容(不是用户的即时要 求) ,在条件满足时将用户感兴趣的信息推送给客户机系统;虽然数据传输的方向仍然是从 服务器流向用户,但操作的发起者却成了服务器,而不是用户,这样服务器所提供的服务是 主动的,即在客户端没有请求的情况下主动把数据发送给客户端。Push 本质上是一种智能化的信息获取技术,它不仅能主动从网上搜寻信息,还能了解、 推导、发现用户的兴趣,形成用户知识库,将获取的信息按照用户需求

8、特征进行匹配,经过筛选、分类、排序后再 Push 到客户端上,用户可在任何时候浏览,从而有效减小了网络信 息过载给用户带来的困扰。3.支持语义的分布式主动服务系统3.1 主动服务系统架构图 1 基于本体的异构环境下主动信息定制服务系统结构图3.2 信息服务层3.2.1个性化信息定制服务 信息的定制是主动信息服务的重要环节。系统通过用户的定制行为,去理解用户的信息需求、生成主动推送规则,最后,在条件满足时为用户及时的推送正确的信息。采用基于本体指导的信息定制能够以半自动化的方式指导用户进行信息和知识的定制,在方便用户的同 时也使系统能够更加准确的理解用户需求,便于进行系统建模。3.2.2事件监控

9、服务 事件监控服务负责监控指定事件的发生,如时间事件和用户事件。当用户定制了此类事件触发的信息推送服务时,激活事件监控服务,并向其传递参数,根据事件类型不同,该参数可以是时刻值、用户状态等。事件监控服务被激活并接受参数后,开始对指定事件源进行 监控,当发生与指定事件参数匹配的事件时,事件监控服务产生输出。在此,事件监控服务 的输出为触发另一个服务。根据用户兴趣模型,此处触发的另一个服务可能是数据源监控服 务或者目标信息推送服务。3.2.3信息检索服务 信息检索服务负责查询本体语义库,并转而间接的查询元数据库及异构源数据库。根据用户定制的敏感信息源本体语义概念,及相关定制信息,查询相关数据,并把

10、相关查询结果送至条件判断服务进行条件判断。一旦条件满足则将查询结果以用户定制的方式、时间及事件推送给用户。3.2.4条件判断服务 条件判断服务由数据源监控服务触发,负责对指定条件的判断。条件一般为一个布尔表达式,为真则条件满足,否则条件不满足。当条件判断的结果为真时,条件判断服务根据用户兴趣模型进一步触发目标信息推送服 务;当条件判断的结果为假时,条件判断服务重新激活数据源监控服务,使其在间隔一段时 间后重新开始运作。3.2.5目标信息推送服务 目标信息推送服务负责用户感兴趣的目标信息的推送。目标信息推送服务被触发后,根据用户兴趣模型中用户定制的感兴趣的目标信息本体语义概念,找到相应的信息,并

11、进行推送。推送信息包括推送方式、推送时间、推送内容和接收方式。推送方式包括电子邮件,及 时消息,手机短信,RSS 和页面等;推送时间包括准确时间和推送频率等;推送内容是用户 定制的感兴趣的信息;接收方式支持手机终端和 PC 机。目标信息推送服务进而触发相应的 信息展现服务来完成实际的信息展现工作,把目标信息通过用户指定的方式展现在用户面 前。3.2.6信息展现服务 信息展现服务包括定制信息的展现服务和推送结果的展现服务,主要负责用户目标信息内容的展现,支持用户的个性化定制展现界面、展现内容和接收终端。3.3 语义元数据层3.3.1元数据层 元数据模型设计包括:结构类元数据模型,内容类元数据模型

12、,访问类元数据模型和管理类元数据模型。其中,结构元模型用于统一描述各种异构数据库及数据库对象的基本信息和结构信息,内容元模型用于描述语义和语义映射信息,访问元模型描述能够对数据库数据 对象进行的操作,管理元模型描述基本管理信息。3.3.1.1 结构类元数据 结构类元数据主要描述了四个方面的信息:(1)数据库自身的结构信息;(2)数据库中各种数据和应用对象的结构信息;(3)数据库支持和不支持的功能;(4)数据库的各种使用限制。数据库中常见的数据和应用对象包括数据库模式、用户、数据表、视图、字段、 索引、键、函数和存储过程等。其中,数据库视图、存储过程、数据类型、约束、日志、规 则和索引可以直接采

13、用数据库本身提供的元数据及其模型。3.3.1.2 内容类元数据 内容类元数据包括两个部分:数据库对象的语义描述;数据库对象的语义映射;OWL语义本体描述。3.3.1.3 访问类元数据访问类元数据模型主要用于控制用户访问各种数据库数据对象时能够进行的操作。3.3.1.4 管理类元数据 管理类元数据模型主要用于:对数据库中的所有用户进行管理;对数据库中所有数据对象的变更进行追踪。3.3.2语义元数据模型3.3.2.1 语义映射方法 语义映射方法的核心思想是将关系数据库中的数据和关系实例映射成为本体的实例。如果本体是 OWL 或 RDF/RDFS 的表示,那么关系数据库中数据实例就可以转化成 RDF

14、 三元组的表示(S, P, O),即主体(Subject),属性(Property)和客体(Object)。它表达的语义为主 体 S 具有属性 P,其值为 O。关系数据库的数据实例与 RDF 数据的映射关系如下:数据库 中的一条记录映射成为一个 RDF 主体 S(或者说一个 RDF 节点),即本体中的一个概念对应 的实例;该记录的每一个字段名(列名)映射成一个 RDF 属性 P,即本体中的属性和关系;该 记录的每一个字段的值就是一个 RDF 客体 O,即本体实例的属性的值。3.3.2.2 基于关系数据库的语义模型生成方法 本体和关系模型都是一种组织知识的模型,两者之间存在一定的语义相关性。在关

15、系模型中,实体以及实体之间的联系都是用关系来描述,所以关系模型中的一个关系可能对应着一个本体的概念或关系。如果数据库中的两个关系存在继承关系,其对应的两个本体概念或 关系之间肯定存在层次关系。另外,数据库中的属性约束可以转化为本体中的公理,数据库 中的元组可以转化为本体中的实例。这种情况还只是关系数据库与本体之间最简单的语义关 系。事实上,还存在更复杂的语义关系,例如多个关系所描述的信息可以集成为一个本体中 的概念等。根据以上分析,可以看出关系数据库与本体之间存在一些语义相似性。因此利用关系数 据库与本体之间的语义相似性从关系数据库中获取本体应该是可行的。但是,本体与关系数 据库模式毕竟是不同

16、的,两者的主要区别如下:在本体的类型系统中,没有基本类型的概念, 所有事物都成为概念;本体描述概念时,没有区分概念的属性、联系,属性、联系都成为性 质;概念之间都可以组织为类与类之间的层次。从关系数据库中获取本体的方法不少,但是存在如下问题:仅能抽取关系数据库中小部 分语义信息;要求用户干预,如进行语义标注等,因此自动化程度不高。产生这些问题的根 源是目前这些方法关注的焦点仅仅是主键之间的相关性,对数据、属性之间的相关性考虑较 少。本文将关系数据库映射成本体结构的过程主要包括对关系、主键、属性、数据相关性分 析,抽取关系数据库的概念模式,再将概念模式转换成本体结构。对构建的关系数据库要求 至少

17、满足 3NF,1NF 和 2NF 可以通过算法转化成 3NF。具体操作过程为以下步骤:1)对实体关系进行分类;2)定义概念的抽取规则;3)定义属性的抽取规则;4)定义关系的抽取规则;5)定义约束的抽取规则;6)定义实例的抽取规则;4.结束语本文提出了一种在分布式环境下面向语义的主动信息服务系统框架, 未来的研究方向包括完善语义映射方法,优化语义元数据模型,构建基于语义的定制模型和信息分发模型,并在此基础上建立基于语义的用户兴趣模型,进行用户兴趣度分析,改 善主动信息服务系统的推荐性功能。参考文献1万 捷, 藤至阳. 本体论在基于内容信息检索中的应用. 计算机工程, 2003, 29(4):12

18、22Studer R,Renjiamins V R,Fensel D. Knowledge Engineering : Principles and Methods J . Data andKnowledge Engineering ,1998 ,25 (122) :16121973王洪伟. 基于本体的元数据模型及 DAM 工表示J . 情报学报,2004 ,23 (2) :131213. 4宋红. Push 技术在图书馆网络信息服务中的应用.情报杂志,2003:(12)5刘震,邓苏,罗雪山,等. 面向对等网信息语义共享的元数据模型框架研究J . 计算机科学,2006 ,33(1) :1021

19、3.6邓志鸿,唐世渭,张铭等. Ontology 研究综述. 北京大学学报,Volume 38, Number 5, pp. 730-738 (2002)7杜小勇, 李 曼, 王 珊. 本体学习研究综述. 软件学报.2006.98廖华明,程伯羽,刘新周等. 信息网格化元数据层次化结构模型的研究和应用. 计算机研究与发展,2003 年 12 月,第 40 卷,第 12 期Semantics-Oriented Active Information Service System inHeterogeneous EnvironmentsBaiqing RenBeijing Key Laboratory

20、 of Intelligent Telecommunications Software and Multimedia, School of Computer Science and Technology, Beijing University of Posts and Telecommunications, Beijing (100876)AbstractWith the rapid growth of information resources, all area of information resources is digital, networked, heterogeneous, i

21、rregular and explosive and so on. In order to integrate better and control effectively allthese resource, and to provide an active personalized information service, many researchers studied onnetwork-based Information sharing service standards, which is the prime of comprehensive sharing. Active and

22、 personalized services are important for information system in heterogeneous environments. They can help improve the quality of system service. This paper put forward an active and personalized service model, which can solve heterogeneous problems through extracting semantic metadata and provide active personalized service.Keywords: active Service;ontology;metadata

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!