欢迎来到装配图网! | 帮助中心 装配图网zhuangpeitu.com!
装配图网
ImageVerifierCode 换一换
首页 装配图网 > 资源分类 > DOCX文档下载
 

数据共享与交换平台解决方案

  • 资源ID:179981890       资源大小:59.17KB        全文页数:2页
  • 资源格式: DOCX        下载积分:10积分
快捷下载 游客一键下载
会员登录下载
微信登录下载
三方登录下载: 微信开放平台登录 支付宝登录   QQ登录   微博登录  
二维码
微信扫一扫登录
下载资源需要10积分
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

数据共享与交换平台解决方案

数据共享与交换平台解决方案方案概述 随着信息社会的到来,计算机网络环境和分布处理技术的深入发展。信息系统中的数据源所呈现的形式也日益繁多,在这些 数据中有模式固定的结构化数据,也有无模式的无序数据.这种无论是已知确定来自数据库的数据或是来自网络上的各式 各样结构不固定、不完全或不规则的数据,都给信息系统在向国民经济信息化发展的过程中产生了很大的障碍。因此,完 成不同数据的共享与交换成为各个企业与部门进行信息交换时所必须要解决的重要问题。主要原理如下图:至掲抽*主要工具1. 工具简介数据集成的目的就是要运用一定的技术手段将系统中的数据按一定的规则组织成为一个整体,使得用户能有效地对其 进行操作。数据处理的对象是系统中的各种异构数据库中的数据或者无格式数据,而数据集成的主要过程则是建立完善的数据仓库,以及采用数据挖掘技术获取更多数据信息。ETL作为数据库级的数据集成工具,擅长大量数据的迁移,能从多个数据源中抽取数据,然后进行数据转换和加载,最终得到统一的、完备的主题数据库或数据仓库,原来分散的应用仍独立运作。ETL中三个字母分别代表的是Extract、Transform、Load,即抽取、转换、加载。数据抽取:从源数据源系统抽取目的数据源系统需要的数据; 数据转换:将从源数据源获取的数据按照业务需求,转换成目的数据源要求的形式,并对错误、不一致的数据进行清 洗和加工.数据加载:将转换后的数据装载到目的数据源.ETL原本是作为构建数据仓库的一个环节,负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到 临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。一 个简单的ETL体系结构如图1.1所示。ETL体柬結构2. ETL 关键技术数据抽取 数据抽取是从数据源中抽取数据的过程。实际应用中,数据源较多采用的是关系数据库.从数据库中抽取数据一般 有以下几种方式:全量抽取:全量抽取类似于数据迁移或数据复制,它将数据源中的表或视图的数据原封不动的从数据库中抽 取出来,并转换成自己的ETL工具可以识别的格式.增量抽取:增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据在ETL使用过程中。 增量抽取较全量抽取应用更广。目前增量数据抽取中常用的捕获变化数据的方法有:触发器、时间戳、全表比 对、日志对比。数据转换和加工从数据源中抽取的数据不一定完全满足目的库的要求,例如数据格式的不一致、数据输入错误、数据不完整等等,因此有必要对抽取出的数据进行数据转换和加工。数据的转换和加工可以在ETL引擎中进行,也可以在数据抽取过程中利用关系数据库的特性同时进行.相比在ETL引擎中进行数据转换和加工,直接在SQL语句中进行转换和加工更加简单清晰,性能更高。对于SQL语句无法处理的可以交由ETL引擎处理。数据装载将转换和加工后的数据装载到目的库中通常是ETL过程的最后步骤。装载数据的最佳方法取决于所执行操作的类型以及需要装入多少数据。当目的库是关系数据库时,一般来说有两种装载方式:1)直接SQL语句进行inse rt、updat e、delete操作;2)采用批量装载方法,如bcp、bulk、关系数据库特有的批量装载工具或api。3.主流ETL 工具ETL工具从厂商来看分为两种,一种是数据库厂商自带的ETL工具,如Or acle warehouse build er、Oracle Data Integrator。另夕种是第三方工具提供商,如Kettle。Oracle Data Integrator (ODI): ODI主要定位于在ETL和数据集成的场景里使用,ODI能够检测事件,一个事件可以触发ODI的一个接口流程,从而完成近乎实时的数据集成.ODI的主要功能特点有:使用CDC作为变更数据捕获的捕获方式、代理支持并行处理和负载均衡、完善的权限控制、版本管理功能、支持数据质量检查,清洗和回收脏数据、支持与JMS消息中间件集成、支持Web Serv ice.KETTLE:说到ETL开源项目,Kettle当属翘首,项目名称很有意思,水壶。按项目负责人Ma tt的说法:把各种数 据放到一个壶里,然后呢,以一种你希望的格式流出。Kettle分为四大块:Chef工作(job)设计工具(GU I 方式)、Kitchen 工作(job)执行器(命令行方式)、Spoon 转换(tra nsform)设计工具(GUI方式)、Spa n 转换(tr as f orm)执行器(命令行方式)三、 数据集成工具选择1. 对平台的支持程度2. 对数据源的支持程度3. 抽取和装载的性能是不是较高,且对业务系统的性能影响大不大,倾入性高不高4. 数据转换和加工的功能强不强5. 是否具有管理和调度功能6. 是否具有良好的集成性和开放性

注意事项

本文(数据共享与交换平台解决方案)为本站会员(lis****211)主动上传,装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知装配图网(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!