微软数据仓库介绍



《微软数据仓库介绍》由会员分享,可在线阅读,更多相关《微软数据仓库介绍(16页珍藏版)》请在装配图网上搜索。
1、,Slide Title,Body Text,Second level,Third level,Fourth level,Fifth level,Module,1,Introduction to,D,ata Warehousing,Module Overview,数据仓库概述,考虑数据仓库解决方案,Lesson 1,:,数据仓库概述,商业难题,什么是数据仓库?,数据仓库架构,数据仓库解决方案组件,数据仓库项目,数据仓库项目角色,SQL,Server,作为数据仓库平台,业务难题,关键业务数据分布在多个业务系统,找到业务决策的信息是耗时的和容易出错的,基本的业务问题很难回答,?,What Is,a
2、,Data Warehouse?,一,个集中存放用于报表和数据的信息容器,通常,一个数据仓库,:,包含大量的历史数据,优化了数据查询,(,而,不是插入和更新,),定期加载新的业务数据,为企业商务智能解决方案提供依据,Data Warehouse,Architectures,Centralized Data Warehouse,Departmental Data Mart,Hub and,Spoke,Components of a Data,Warehousing,Solution,从业务系统和其他数据源抽取数据加载,数据通常最终加载到数据仓库,数据清洗和重复数据的删除,确保数据仓库中数据的质量
3、,MDM,提供确切的业务数据实体,Data Warehouse,Staging Database,ETL Load Process,ETL Staging Process,Master,D,ata Management,10,1,10,00110,Data Cleansing,Reporting and Analysis,Data Sources,Data,Warehousing Projects,首先确定数据仓库需要解决的业务问题,确定回答这些问题所需的数据,识别所需数据的数据源,评估关键业务目标价值可行性,从现在的数据回答每个问题,对大量数据的项目,使用增量更新比较有效,:,把项目分解为多
4、个子项目,每,个子项目处理一个特定的主题,Data,Warehousing Project,Roles,Project manager,Solution architect,Data modeler,Database,administrator,Infrastructure,specialist,ETL,developer,Business users/analyst,Testers,Data stewards,SQL Server As a Data Warehousing Platform,SQL Server,Analysis Services,SQL Server Database E
5、ngine,Microsoft SQL Server Integration Services,SQL Server Master,D,ata Services,10,1,10,00110,SQL Server Data Quality Services,Microsoft SQL Azure,and the Windows Azure,M,arketplace,Microsoft SharePoint Server,Microsoft PowerPivot Technologies,Microsoft Excel,Data Mining Add-In,PowerPivot Add-In,MD
6、S Add-In,Power View,SQL Server,Reporting Services,Reports,KPIs,and Dashboards,Interactive data visualizations,Interactive data analysis,Data Warehousing,Business Intelligence,Lesson,2,:Considerations for a,Data Warehouse Solution,Data Warehouse Database and Storage,Data Sources,Extract,Transform,and
7、 Load Processes,Data Quality,and Master,Data,Management,Data Warehouse Database,and Storage,考虑数据仓库包括,:,Database schema,Logical:typically denormalized,for optimal read performance,Physical:,often partitioned for performance and management,Hardware,Query processing and memory,Storage,Network,High,avai
8、lability,and,disaster recovery,Hardware redundancy,Backup strategy,Security,Server access,Data permissions,Data Sources,数据源连接类型,凭证和权限,数据格式,数据采集窗口,Extract,Transform,and Load,Processes,临时表:,存放,临时数据,所需的转换,:,提取数据时所需的数据转换和清洗,增量,ETL:,数据的变化加载,Data Quality,and Master Data Management,Data quality:,Cleansing
9、data:,Validating data values,Ensuring data consistency,Identifying missing values,Deduplicating data,Master data management:,Ensuring consistent business entity definitions across multiple systems,Applying business rules to ensure data validity,10,1,10,00110,Module Review and Takeaways,Why might you consider including a staging area in your ETL solution?,What options might you consider for performing data transformations in an ETL solution?,Why would you assign the data steward role to a business user rather than a database technology specialist?,
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。