上市公司财务数据多维联机分析设计

上传人:仙*** 文档编号:80571040 上传时间:2022-04-25 格式:DOC 页数:85 大小:1.43MB
收藏 版权申诉 举报 下载
上市公司财务数据多维联机分析设计_第1页
第1页 / 共85页
上市公司财务数据多维联机分析设计_第2页
第2页 / 共85页
上市公司财务数据多维联机分析设计_第3页
第3页 / 共85页
资源描述:

《上市公司财务数据多维联机分析设计》由会员分享,可在线阅读,更多相关《上市公司财务数据多维联机分析设计(85页珍藏版)》请在装配图网上搜索。

1、上海海运学院硕士论文 上市公司财务数据多维联机分析设计摘 要统计学是一门应用性很强的学科,它是研究如何有效地收集、整理、分析数据,并对所考察的问题作出推断或预测,甚至为制定决策和采取行动提供依据和建议的一门学科。凡是有大量数据出现的地方,都用到了统计学。另外,众所周知的是复杂的数据处理需要计算机来辅助完成。证券投资也毫不例外地用到了统计学的理论和方法,但是统计学在证券投资领域主要应用在证券投资技术分析上,而较少涉及基本分析。技术分析是研究股票的短期买卖行为,即何时买进、何时卖出;基本面分析则主要致力于研究股票的内在价值,它的研究范围包括宏观、中观和微观三个层面。宏观因素对具体的证券投资决策影响

2、很小,作为一个理性的投资者,首要关注的是基本面的行业和公司分析,其次才是宏观层面分析和技术分析。行业分析和公司分析的数据源都是上市公司的财务数据,包括财务报表和报表附注。上市公司财务数据多维联机分析(Multi-dimensional On-Line Financial Data Analysis, MOLFDA)以上市公司财务数据为分析对象,综合应用计算机数据处理技术、统计分析方法,用多维联机数据分析(Multi-dimensional On-Line Data Analysis, MOLDA)作为技术支持,不仅可以实现基本面的行业分析和公司分析,还可以对上市公司从地区、市场(深、沪)等多个

3、角度进行分析。全文由 “引言”、“正文”和“结论” 三部分组成;其中,“正文”部分由第一章至第四章构成,它们是论文的主体部分。“引言”部分,在现实需求和研究现状分析的基础上,指出上市公司财务数据分析是理性证券投资者的现实需求,而目前提供的相关信息存在量少、分析方法不够完善、大量的数据缺乏合理的联机组织等问题,最后提出多维联机数据分析(Multi-dimensional On-Line Data Analysis, MOLDA)技术是实现上市公司财务数据多维联机分析的理想技术。第一章:多维联机数据分析(MOLDA)技术。阐述与MOLDA相关的基本概念、特点和结构。指出“多维联机数据分析设计”的重

4、要性,它包括“多维业务空间设计”和“方法库设计”第二章:MOLFDA多维业务空间的设计。介绍了业务空间设计的基本理论,设计了上市公司财务数据分析的业务空间设计了“度量”和“维”;并构建了多维数据立方体。第三章:MOLFDA方法库的设计(一)。设计了总量分析、相对数分析、财务比率基本分析等较简单的计算分析方法。主要用了大量表格进行详细地说明。第四章:MOLFDA方法库设计(二)。设计了财务分析中较复杂的分析方法财务比率综合分析方法。首先,指出财务比率综合分析的核心问题是确定财务比率的加权权重系数;接着,从综合评价分析方法的基本理论着手,对基本理论进行了较全面的阐述;然后,以港口业上市公司为研究对

5、象,分别用“主观”、“客观”赋权法这两类常用的确定权重系数的方法对其进行了综合评价;最后,比较分析“主观”、“客观”赋权法的优劣,提出了集成赋权的综合评价方法,对集成赋权综合评价分析的结果进行了一致性检验,得出集成赋权综合评价比任何单一的赋权综合评价更合理的结论。在“多维业务空间”和“分析方法库”设计好之后,计算机人员能够非常轻松的开发实现上市公司财务数据多维联机分析系统。相信本文的研究对于普及上市公司财务分析知识、倡导理性证券投资、促进证券市场的良性发展有着重大的理论和现实意义。关键字:多维联机数据分析(MOLDA)、上市公司财务分析、业务空间设计、分析方法设计、集成多指标综合评价2ABST

6、ACTStatistics is a practical subject. It concerns the collecting, processing and analyzing of the related data, gives presumptions and predictions to its objects, and provides suggestions to decision-makers. Actually, where there is a great deal of data, there esists a chance for the utilized the fi

7、eld of statistics. In addition, as we all known its feasible to process the data by computer.Therefore, statistics can be unexceptionally utilized in the field of stock investmen. However, statistics is more often used in technical analysis than in elementary analysis. Technical analysis deals with

8、short-run transaction of stocks while elementary analysis concerns the evaluation of certain stocks; elementary analysis focus on the intrinsic value the stock, as a result, its concerns are the macro economy, the middle economy and the micro economy and so on. A rational stock investor should pay h

9、is attention to the stocks intrinsic value at first, then to the trend of its price. So, applying the theory and method of statistics to the elementary analysis of stocks investment is significant for the dissertation in the stock investments. The industry analysis or the company analysis is based o

10、n the financial data, which contain the financial report and their notes of the listed companies.The multi-dimensional on-line financial data analysis(MOLFDA) are based the financial data, applying the data process technology by computer and statistics methods, backed up the multi-dimensional on-lin

11、e data analysis(MOLDA). It can realize the elementary analysis, such as industry analysis and the company analysis; furthermre it can analysis the financial data from the area dimension and the market dimension, even any tow or all of them.This paper contains three parts: preface, text and conclusio

12、n. The text includes four chapters; they are the mains of the whole paper.In the preface part, based on the realistic requirements and the status quo of the study. It fingers out the financial data analysis of the listed companies is the realistic requirement of the stock investors. But the informat

13、ion concerning this aspect is little, deficient and not on-line at present. The MOLDA technology is able to improve these problems.Chapter one, the multi-dimensional on-line data analysis technology. Mainly introduces the concept, the characteristics and its construction. Point out the design of the

14、 multi-dimensional on-line data analysis is important. It includes the design of the “business space” and the design of the “analysis methods”.Chapter tow, the design of the “business space” of the MOLFDA. At first introduces the theory and the concepts, then it projects the “business space” of the

15、MOLFDA, projects the measures and the dimensions; at last build the multi-dimensional data clubes.Chapter three, the design(one) of “analysis methods” of the MOLFDA. Through a great deal of tables it explains some simple analysis methods, such as the inventory analysis, simple contrary analysis and

16、so on.Chapter four, the design(tow) of “analysis methods” of the MOLFDA. It mainly projects the comprehend evaluation of the multi-index for the financial analysis. The core of the comprehend evaluation is the determination of the weighting coefficients. After explaining the based theory overall, it

17、 determines the weighting coefficients by objective methodthe improved analytic hierarchy process (IAHP), and subjective methodthe primary component analysis(PCA), respectively. The comprhend evaluation for the companies of the harbor is studied in this chapter. Therefore, determining the weighting

18、coefficients by single method, either objiective method or subjective method is not perfect. The integration method of determining weighting coefficients in the comprehend evaluation which based on the IAHP and the PCA method has been pointed out in this chapter. At last, the comprehend evaluation r

19、esult by the integration method accords to that of the single method, by F test statistic. The result by using integration method has showed much more reasonable than any of the result by single method. After the disgning the “business space” and “analysis method”, the programmers can develop and re

20、alize the multi-dimensional on-line financial data analysis system easily. The study of this paper will help generalize the knowledge of financial analysis, initate rational investment in Chinas stock market, and therefore will demonstrate its great theoretical and pratical value for the development

21、 of Chinas stock market.Jin Congli(Industrial Economics)Directed by Professor Xiao ZhaoyuanKEY WORDS: multi-dimension on-line data analysis, financial analysis of the listed company, the design of “business space”, the design of “analysis methods”, the multi-index integration comprehend evaluation3目

22、 录引 言1第一章 多维联机数据分析(MOLDA)技术 5第一节 联机分析处理(OLAP)技术5第二节 多维联机数据分析(MOLDA)技术11第二章 MOLFDA多维业务空间设计14第一节 多维业务空间设计概述14第二节 MOLFDA多维业务空间设计 15第三章 MOLFDA方法库设计(一)32第一节 总量分析33第二节 相对数分析40第三节 财务比率基本分析47第四章 MOLFDA方法库设计(二)50第一节 财务比率综合分析方法概述50第二节 综合评价分析的基本理论54第三节 上市公司财务比率综合评价分析63结 论 74致 谢 76参考文献77引 言一、需求与现状证券投资是一个渐进过程,包含

23、证券投资的分析、决策、操作和管理等一系列阶段,其中证券投资分析是基础性的核心环节,它可以使投资者提高投资收益,降低风险损失。证券投资分析通常有“基本面分析和技术分析”。技术分析是研究股票的短期买卖行为,即何时买进、何时卖出;基本面分析则主要致力于研究股票的投资价值,它的研究范围是宏观经济分析、行业分析和上市公司分析等三个层面(宏观、中观、微观层面)。作为一个理性的投资者,首要关注的是股票的基本面分析,其次才是技术面。而诸如国家国民收入总值、通货膨胀问题、失业率、国际收支等宏观经济层面因素对具体的投资影响甚小,所以行业分析和公司分析越来越受到理性证券投资者的青睐。然而,一方面财务信息对公司来说是

24、保密的,加上投资者时间和精力的限制,使得投资者进行投资决策时不可能到各个公司去了解情况,而只能依据公司在公开传媒上披露的信息资料进行分析判断;另一方面,随着中国证券市场的不断壮大,目前在深、沪两市挂牌上市公司已达1200多家,这给投资者带来更多的选择空间,同时更增加了投资决策分析的复杂性。于是,帮助投资者提供这方面的信息具有相当的实际意义。提供这类信息越来越成为证券公司、网站以及其他研究机构研究的主要内容。中国证券监督委员会是披露该类信息权威性的、全面的机构,其网站公布了所有上市公司按规定上报的财务报告,但这些大量的原始财务数据没有进行深入地再加工,没有实现有机的联机、汇总、分析。虽然,有些证

25、券类网站(如证券之星等)开始作了些相关的研究,但总的说还存在如下一些缺陷和不足之处: 财务报表数据缺乏紧密的连接。在证监会网站中,各报表数据按原始的报送格式以PDF文件存储以供查询,通常一个报告长达50多页左右,其中包括资产负债表、损益表、现金流量表及报表相对应的详细附注信息缺乏紧密地联系;其他的证券网站虽然进行了其他存储格式的转换,但仅仅能提供三张财务报表数据,略去了附注信息。这样投资者不能在一个屏幕界面上同时看到多家上市公司的财务报告数据;同时,要想获得财务报表中某个项目的详细数据必须到财务报告附注中去找。 缺少汇总型的财务数据。比如我们要查询一个行业、一个地区、一个市场板块甚至它们的组合

26、性汇总财务数据,如整个工业行业的上市公司的资产总额、应收账款总额等汇总数据就很困难。 财务分析的力度显然不够,方法也不够完善。中国证监会网提供了各上市公司按时上报的财务报告(首季度报告、半年报、第三季度报告、年度报告),此外,该网站提供了简要的财务指标统计(比如按地区和行业分类计算上市公司的数目、总亏损额、主要的少数财务指标等),财务分析的力度显然不够;其他网站在财务分析的力度上有所加强,对沪深两地所有上市公司的财务状况进行分析,并对偿债能力、运营能力、盈利能力、成长能力等各方面分别进行评分,在此基础上得出一个总分反映公司的综合能力,但评价方法单一,比如仅仅运用“层次分析法”来确定权重系数进行

27、综合评价分析,等。二、研究目的和可行性上市公司财务数据多维联机分析(Multi-dimensional On-Line Financial Data Analysis, MOLFDA)能够能够弥补上述的不足。MOLFDA以上市公司财务报表、以及报表附注为数据源,用多维联机数据分析(Multi-dimensional On-Line Data Analysis, MOLDA)作为技术支持,实现对数据源多角度(时间角度、行业角度、地区角度、市场角度)、多种分析深度(原始数据、简单汇总、综合分析)的联机财务分析,以满足投资者多角度、不同层次的查询和观察上市公司信息的现实需求,倡导理性投资,减少他们投

28、资决策的不确定性,以期对中国的证券市场良性发展有所促进。即本文研究的MOLFDA不仅可以进行行业分析和公司分析,还可以进行地区、市场等方面的分析。按数据分析的深度层次不同,MOLFDA可以为投资者提供以下投资决策信息: 原始的总量财务数据。即资产负债表、损益表和现金流量表等财务报表中的会计报表项目及其数值、以及对应的报表附注信息。财务报表数据是通过会计科目对财务信息的汇总,具有相当的经济内涵,能够提供给报表使用者重要信息。通过分析财务报表原始数据,可以了解企业的经济规模和经营实力,例如资产负债表上的“资产总额”反映了企业实际控制的经济资源的数量,即资产规模,进而显示了企业获得经济利益的潜力和能

29、力;此外,甚至仅仅通过分析财务报表原始数值的正负,就可以得到企业一些基本情况的判断,例如为诸多财务报表使用者所关注的损益表“底线(bottom line)”“净收益”数额的正负情况等。对这些报表原始数据的解读,可获得对企业生产经营状况的初步了解,为今后进一步的分析指明一定的方向,成为后续分析的基础。 初步分析的相对财务数据。其方法是比较分析法,它是通过将两个或几个相关的可比数据进行简单的除法运算得出比值,实现初步的数据分析,通常以年增长率和结构百分比、财务比率表示。按比较对象(和谁比)分: “趋势分析”(纵向比较),也称“增减法”。它是本期数据与历史数据比,即不同时期的数据相比。通常是把毗连的

30、几个会计年度的报表数据并列,编制“比较财务报表”,对各年报表中项目逐一进行比较,查明变化原因及可能带来的影响。比较财务报表显示两期或两期以上财务报表各项目增减变动的百分比。 “结构分析”是一种横向比较,它是分析某一经济现象在总体中所占的比重,认识局部与总体的关系和影响,借以认识事物的本质和客观规律性。将这样的思路应用于财务报表分析中,就是以财务报表中某一关键项目的金额作为基数,而将其余各有关项目的金额分别换算成对该关键项目的结构百分比,从而简洁明了地揭示财务报表中各项目的相对地位以及总体结构分布的情况。在实务中通常借助于编制“结构百分比报表”来进行。 “财务比率分析”是将若干个财务报表数据联系

31、在一起,避免了孤立看问题的缺陷;此外,比率分析不仅局限于对某一张报表的内部分析,还是一种“跨表”的分析,将资产负债表、损益表、现金流量表有机地联系起来,计算各种财务比率指标,更深层面的反映了企业的经营管理和财务状况。 深层次分析的综合财务信息。初步分析得出的财务比率相对数只能分别反映公司经营活动中某时刻上市公司盈利能力、偿债能力、运营能力或成长能力等某个方面的部分情况,而上市公司的经营业绩需要一系列的财务比率指标来反映。投资者常常需要对企业的财务状况做出综合评价,以此作为投资决策的依据。这需要对多个财务比率指标进行深层次的综合评价分析。财务比率综合评价分析是将财务比率分为偿债能力、营运能力、盈

32、利能力和成长能力等四大类,通过专门的综合评价方法得出四个方面的得分、并将这四方面的得分再次汇总得到公司的综合财务能力得分反映经营主体的综合财务状况。MOLDA技术是解决上市公司财务数据多维联机分析问题的理想技术。MOLDA技术将联机分析处理(OLAP)与统计分析方法进行集成,在OLAP的基础上加强了数据分析的深度。MOLDA技术能够将各种数据联机组织,实现数据共享;除了具有汇总、合并和聚集等总量数据查询的简单功能以外,还能使用各种适当的统计分析方法解决各种复杂的数据分析问题。即它的主要特点的“多维性”、“联机性”和“数据分析能力强”。“多维性”体现在:MOLDA尤其着重从不同角度(维)观察问题

33、、查询数据,能够向用户快速提供各种可能的信息咨询;“联机性”体现在:分析数据源、加工后的信息都以联机的形式组织存储,能够为用户提供综合程度不同的数据或信息;“数据分析能力强”体现在:MOLDA能够根据研究问题的需要加载对应的统计分析方法,提供不同分析深度的信息,提供更有价值的决策支持信息。将MOLDA技术应用于上市公司财务数据分析,其“多维性”体现在:能够对上市公司财务数据进行时间、地区、行业、市场等多个角度的分析;“联机”性体现在:能够将数千家上市公司的财务报表数据、报表附注有机的联机组织存储,能够按不同的综合程度查询财务数据;“数据分析能力强”体现在:MOLDA中加载财务分析所需要的分析方

34、法,从而可以实现对上市公司财务数据进行不同层次的进一步加工,诸如计算财务报表中各项目的年增长率、结构百分比、财务比率等相对数,甚至是最高层次的财务分析综合财务评价分析,同样,MOLDA技术可以将用统计分析方法分析得出的信息进行“联机性”的存储,方便不同层次用户不同的查询需求。三、本文研究的内容本论文对MOLDA技术在上市公司财务分析中的应用进行了尝试性的研究。首先,对MOLDA技术进行了简单明了的概述性介绍,指出多维联机数据分析的设计是多维联机数据分析系统的重要组成部分。多维联机数据分析的设计包括“多维业务空间的设计”和“数据分析方法库的设计”。“多维业务空间的设计”主要是要设计出“度量” (

35、“指标维”或称“树”)、“维”,并构建“多维数据立方体”;“数据分析方法库的设计”是另一个关键问题,它需要详细的说明各种分析的分析对象、分析结果(指标值)的计算方法,、结果的屏幕显示等。于是,“业务空间的设计”和“财务分析方法的设计”是文章的研究内容。“业务空间的设计”是现实需求的一个反映,是整个多维联机数据分析系统的基础。它为数据的联机、多维组合打下了基础。“财务分析方法的设计”部分主要设计了财务分析中需要采用的分析方法。财务比率综合分析方法是难点,本文给出“集成赋权法”的财务综合评价分析方法这是对现实中采用单一分析方法的一大改进。“业务空间”和“分析方法”的设计后,计算机人员可以根据这些定

36、义设计很轻松地来开发和实现整个系统。79第一章 多维联机数据分析(MOLDA)技术多维联机数据分析(Multi-dimensional On-Line Data Analysis, MOLDA)模型是在联机分析处理(On-Line Analysis Process, OLAP)技术的基础上,增强了数据统计分析功能而开发的一种数据分析模型。第一节 联机分析处理(OLAP)技术OLAP是针对特定数据的多维联机访问和分析,通过对信息的很多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行多角度查询。这些信息是对原始的数据进行了清洗、转换、汇总的、反映用户所能理解的、与研究目

37、标有关的、多个角度的信息。根据OLAP产品的实际应用情况和用户对OLAP的产品需求,人们提出了一种对OLAP简单的、公认的定义:共享多维信息的快速分析(Fast Analysis of Shared Multi-dimension Information, FASMI)。其中,多维性是人们对OLAP广泛而热切关注的焦点之一,因为多维分析是最有效的数据分析方法。OLAP突破了物理的三维概念,它采用旋转、切片、钻取和高维可视化技术,将多数据在屏幕上展示。最终达到满足了人们多角度查询、观察认识数据的需要;使用户直观地理解数据,实现了有效地数据分析,即多维数据分析的现实需求。另外,OLAP系统在响应速

38、度上相对于传统的联机事务处理(On-Line Transaction Process ,OLTP)有了很大的改善。由于OLAP系统处理的数据量非常的庞大,并且根据各种不同的需求要进行很多计算,所以,OLAP系统根据用户的需求事先计算、存储一些多维数据,通常以数据立方体的形式存储。一、维的基本概念1.度量度量(Measure)是数据的实际意义,既描述数据“是什么”。例如, “销售量”、“销售金额”等都是度量。它是一个特殊的维,有的称之为“指标维”。2.维维(Dimension)是指观察数据的角度。它作为识别数据的索引,不同的维组合构成了访问数据的约束条件。多维(Multi-dimension)则

39、是指从多个角度去观察数据。需要指出的是,这里的“观察角度”应当是与研究目标相关的,或者说是对我们进行问题决策有用的,对于没有支持决策作用的应当忽略。维可以是多层次结构的,一个维由多个维成员组成。维的层次描述了同一维的不同聚合程度,并且通过映射链接。如一个典型的层次:国家地区省(市)。维的取值即是维成员。如果一个维是多层次的,那么,不同层次上的取值构成一个维成员。需要指出的是维成员不一定每个维层次都必须取值。例如,时间维具有年度、月份、日期这三个层次;可以分别在年度、月份、日期各层次上各取一个值组合起来,就得到了时间维的一个维成员,即“某年某月某日”;但是,时间维的维成员也可以是:“某年某月”、

40、“某月某日”、“某年”等等。二、多维数据1.多维数据库多维数据库(Multi-Dimensional Data Base,MDDB),就是以多维方式来组织数据,以多维方式来显示数据。多维数据库可以直观地表现现实世界中的“一对多”和“多对多”关系,例如,我们希望存放一张上市公司资产总额的情况表,假设有五个行业(工业、公用事业、服务业、农业和综合业),它们在四个地区(华东、华南、华北和华中)资产总额情况。用关系数据库(Relation Data Base,RDB)来组织这些数据如表1-1,而用多维数据库则如表1-2。可以看出,关系数据库采用关系表来表达某地区在各行业的资产分布情况,而多维数据库中的

41、数据组织形式采用了二维矩阵的形式。显然,二维矩阵比关系表更清晰且占用的存储空间少。此外,多维数据库的优势不仅在于多维概念表达清楚,占用存储空间少,更重要的是它有着高速的综合速度。如果查询“华东地区的所有行业总资产额是多少?”这类问题,它是涉及多个数据项求和的查询。在使用关系数据库的情况下,系统必须在大量的数据记录中选出地区为“华东”的记录,然后把它们的总资产额汇总在一起,这时系统效率必定大大降低。由于关系数据库统计数据方式是对记录进行扫描,而多维数据库对此类查询只要按行或列进行求和,因而具有极大的性能优势。表1-1 关系数据库的数据组织 表1-3 关系数据库中综合数据的存放地区行业资产总额(亿

42、元)地区行业资产总额(亿元)华东工业80华东工业80华东公用事业90华东公用事业90华东服务业120华东服务业120华东农业140华东农业140华东综合业350华东综合业350华南工业50华东总和780华南公用事业60华南工业50华南服务业100华南公用事业60华南农业40华南服务业100华南综合业70华南农业40华北工业34华南综合业70华北公用事业44华南总和320华北服务业84华北工业34华北农业24华北公用事业44华北综合业54华北服务业84华中工业43华北农业24华中公用事业53华北综合业54华中服务业93华北总和240华中农业33华中工业43华中综合业63华中公用事业53华中服务业

43、93华中农业33华中综合业63华中总和285总和工业207总和公用事业247总和服务业397总和农业237总和综合业537总和总和1625表1-2 多维数据库的数据组织 表1-4 多维数据库中综合数据的存放华东华南华北华中华东华南华北华中总和工业80503443工业80503443207公用事业90604453公用事业90604453247服务业1201008493服务业1201008493397农业140402433农业140402433237综合业350705463综合业350705463537总和7803202402851625为了获得一致的快速响应,决策分析人员所需的综合数据总是被预先

44、统计出来,存放在数据库中。例如,我们可以在关系数据库的表中加上一行总和的记录,如表1-3。在这张关系表中,由于已经预先对各地区在各行业的资产金额进行了求和(综合),查询时就不用再进行计算了。如果所求和的总和都已经被综合的话,只要读取单个记录就可以回答按地区求和的问题了。这样处理就可以得到快速一致的查询响应。当数据库不算太大时,这种综合效果较好,但当数据库太大时,预先计算这些总和就要花费很长时间。另外,“总和”项破坏了列定义的统一语言,例如表1-3中的地区中的值表示的是地区名称,而“总和”就成为了一个例外。查询时必须了解这种约定。在MDDB中,数据可以直接按行或列累加,并且由于MDDB中不像关系

45、表里那样重复地出现地区和行业信息,因此其统计速度远远超过RDB,数据库记录数目越多其效果越明显,如表1-4。2.多维数据立方体多维数据库有多种描述方式,比如:多维数据立方体(Multi-Dimensional Data cube)、多维数组等。多维数据立方体通常作为主要的逻辑层结构用来描述多维数据库,它是实现OLAP分析的数据对象。下面给出“多维数据立方体”的定义:定义:多维数据立方体是一个4-元组: 个维的集合,其中每个为从域中抽取的维名; 个度量的集合,其中每个为从域中抽取的度量名; 个属性的集合,其中每个为从域中抽取的属性名;每个属性名是对同一层次维成员的抽象;或就是维成员。 一个多映射

46、,即每个维存在一个对应的属性集合。约束条件如下: ,即维名集合与度量名集合是不相交的,这要求度量名应该具有高度的抽象性,对度量的约束条件在维上进行反映; ,即任意两个维的属性集是没有交集的,这要求各个维对度量的约束是不重复的;下面给出例子来说明这个定义。用一个三维的应收账款期末余额立方体来表示上市公司应收账款期末余额的多维数据。定义:应收账款期末余额数据立方体: 用户关心的是应收账款期末余额这个度量。即,M=应收账款期末余额; 用户习惯于用三维来分析应收账款,即“时间”、“账龄”和“上市公司”。即,D=时间,账龄,行业; “时间”维用“具体的年份”来描述的;“账龄”维用“账款自计算期起距到期日

47、的时间”来描述的;“上市公司”维用“具体的上市公司名称”来描述。于是,A=2002年,2001年,2000年,1年以下,1-3年,3年以上,上港集箱、天津港、招商局。 映射f为:f(时间)=2002年,2001年,2000年;f(账龄)=1年以下,1-3年,3年以上;f(上市公司)=上港集箱、天津港、招商局同时,我们注意到上面的“应收账款期末余额数据立方体”满足“维的集合与度量的集合是不相交的”、“三个属性集合是不相交的”,符合了前面给出的定义,其构成如图1-1所示。上述关于多维数据立方体的定义是一个抽象的定义,具体针对一个多维数据立方体实例,我们必须沿着各个维为每个度量赋值。“立方体实例”就

48、是所谓的“物化(赋值)的立方体”。“物化的立方体”可以用一个6-元组来定义。元素D、M、A和f是从它的“源立方体”,即“抽象立方体”继承来的;V表示一个用于物化立方体的数值集合,每个元素是一个k-元组,每个ui是第i个度量mi的物化;g表示映射:domdimension(1)*domdimension(2)*domdimension(n)V,直观上,g映射显示了哪个值与立方体实例的特定“单元”有关。换句话说,对应于同一个源立方体的两个立方体实例将唯一区别在于2-元组。如取:V =1672,1985,1340,2089,2560,1864,1056,2326,987,;f(2002年,1年以下,

49、上港集箱)=1672;f(2002年,1年以下,天津港)=1985;f(2002年,1年以下,招商局)=1340;f(2002年,1-3年,上港集箱)=2089;f(2002年,1-3年,天津港)=2560;f(2002年,1-3年,招商局)=1864;f(2002年,3年以上,上港集箱)=1056;f(2002年,3年以上,天津港)=2326;f(2002年,3年以上,招商局)=987;于是,“物化的应收账款期末余额数据立方体”(“应收账款期末余额数据立方体实例”)如图1-2所示。时间16722089198510562326987256013401864上港集箱天津港招商局3年以上1年以下1

50、-3年公司账龄图1-2应收账款期末余额数据立方体实例时间 上港集箱天津港招商局3年以上1年以下1-3年公司账龄图1-1 应收账款期末余额数据立方体2000年2001年2002年2001年2002年2000年不难看出,多维数据立方体通过各种映射表定义了关系模式,是一种逻辑模型。抽象的立方体对应于一个多维数组。多维数组由一组维和度量组成,它的表示形式是:(维1,维2,维n,度量)。当多维数组中的各个维都选定一个值,就可确定度量的值,即数据单元(单元格)。例如,上述的“应收账款额立方体”表示的是一个三维数组(时间,账龄,公司,期末余额)。“应收账款期末余额立方体实例”中“2560”就是在时间、账龄和

51、公司上各取维成员“2002年”、“1-3年”、“天津港”而确定的唯一度量“应收账款期末余额”的一个值,即该单元格可以表示为:(2002年,1-3年,天津港,2560)。三、多维分析操作多维数据分析操作是指对以多维形式组织起来的数据,如多维数据立方体,采取切片、切块、钻取、旋转等各种分析动作,将多维数据的某一平面用人们容易理解的二维表格或其他图形在屏幕上显示出来,满足用户能从多个角度、多侧面地观察、查询、分析数据的现实需求。这主要是因为三个或三个以上的多维数据很难想象,也不容易在屏幕上画出来。 切片在多维数据立方体的某一维上选定一具体维成员的动作称之为切片。由定义可以知道,切片的数目取决于所在维

52、的成员的数量。对数据立方体进行一次切片将使数据立方体的维数减1,所以得到的切片并不一定是二维的“平面”,其维数取决于原来的多维数据的维数。当进行多次维切片,直到剩下两个维时,即得到一个二维的“平面”。于是,定义1:选定多维数据立方体的一个二维子集的动作叫作切片,即选定多维数据立方体的两个维:维j和维k,在这两个维上取某一个区间的或者所有的维成员,而将其余的维都取定一个维成员,则得到的就是多维数据立方体在维j和维k上的一个二维子集,称这个二维子集为多维数据立方体在维j和维k上的一个切片二维的“平面”。 切块在多维数据立方体的某一维上选定某一区间的维成员的动作称为切块。显然,当这个区间只取一个维成

53、员时,就是一个切片。定义2:选定多维数据立方体的一个维数大于二的子集的动作称为切块。例如,选定多维数据立方体中的三个维:维i,维j,维k。在三个维上取某一区间的或者所有的维成员,而将其余的维都取定一个维成员,则得到的就是多维数据立方体在维i,维j,维k上一个三维子集,称这个三维子集为多维数据立方体在维i,维j,维k上的一个三维的切块。切片和切块是在一部分维上选定维成员后,度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有二个以上,则是切块。 旋转旋转就是改变报表所显示的维的方向。将某一个行维移到列维中去(或将列维转移到行维中)。 钻取钻取是改变维的层次,变换分析的数据的综合程度(

54、粒度)。它包括上卷(roll up)和下钻(drill down)。roll up是在某一维上将低层次的细节数据概括到高层次的汇总数据;而drill down则相反,它从汇总数据深入到细节数据进行观察。第二节 多维联机数据分析(MOLDA)技术联机分析处理将数据进行联机、简单的加工汇总以多维形式组成数据,对其采取切片、切块、钻取和旋转等分析动作将多维数据以二维表格或图形的形式显示出来。它迎合了人的思维模式,满足人们多维查询的较低层面的现实需求。将原始的数据库转换为多维数据库后,即使是对大型数据库,也可以实现快速、多维查询。但是这还是不够,人们要求更深入的分析、挖掘数据获得决策支持的信息。我们可

55、以在OLAP的基础上加载与研究问题相对应的数据分析方法,达到对数据深加工的高层次需求。一、多维联机数据分析(MOLDA)技术特点 用MOLDA模型设计和建立的分析系统,除了具有OLAP主要特性外,还加强了统计分析的功能。l MOLDA建立在多维数据模型的基础上。通过从所分析的问题的“多维业务空间”中提取和构建“多维数据立方体”,经过“切片”、“上卷”、“下钻”或“旋转”等操作,可以为用户提供各种“粒度”的统计分析结果,并用二维表格和图形表示出来。l 可以在MOLDA的方法库中加入各种指标计算、统计分析方法和自动识别建模工具,从而对提供的各种粒度的多维数据或直接来自信息源的信息进行各种分析和自动

56、建模。l 以MOLDA模型为基础设计开发的分析系统,可方便地扩充和修改。多维联机数据分析定义库数据连接、抽取、转换定义 3数据源定义 41多维业务空间度量(指标维)类别维多维数据立方体方法库 2分析方法多维数据立方体分析引擎前端用户分析结果需求用户请求数据源数据仓库多维联机分析系统图1-3 MOLDA设计开发的多维联机数据分析系统的构成二、多维联机数据分析系统的结构基于MOLDA模型的多维联机分析系统分为“多维联机分析系统”和“多维联机分析定义库”两大部分。多维联机分析系统由分析子系统、数据连接子系统、直接数据源或数据仓库等几个主要部分组成。多维联机分析定义库包括“多维业务空间”的定义,“方法

57、库”,“数据连接、抽取、转换定义”及“数据源的定义”等部分。如图1-3所示。当用户提出了各种多维分析要求后,分析子系统即从方法库及多维业务空间定义库中寻找与此多维分析要求相匹配的分析方法。同时它指令数据连接子系统寻找适当的数据源,并按分析的要求,连接数据源和分析方法,以获得必要的分析结果。多维联机分析定义库的设计,指的是多维业务空间的设计和定义、方法库中方法的设计及其与多维业务空间的匹配设计、数据连接和数据源的定义等,它们是MOLDA分析系统设计的关键。其中多维业务空间和方法库是核心。多维业务空间反映了用户的分析需求,根据多维业务空间中不同维的组合可以建立多维数据模型;而方法库的设计包括设计为

58、实现用户分析需求所采用的各种分析方法。第二章 MOLFDA多维业务空间的设计上市公司财务数据多维联机分析(简称为“多维联机财务数据分析”Multi-dimensional On-Line Financial Data Analysis, MOLFDA)是建立在MOLDA模型基础上的财务分析。多维业务空间的设计是上市公司财务数据多维联机分析设计的一个重要组成部分。第一节 多维业务空间设计概述一、多维业务空间所谓“多维业务空间”是对用户需求的描述,是一个将用户需求逐步细化,最终确定维和度量为建立多维数据立方体奠定基础的过程。首先,从现实用户需求中抽象出业务主题。一个业务主题又可以根据需要,按不同的

59、标准划分为若干“子主题”。因此,一个多维业务空间可被分为若干个“子空间”。例如,总量和相对数分析等就是上市公司财务数据分析主题中的两个子题。一个业务主题可以有若干个度量,如:年增长率、结构百分比、财务比率等是相对数分析的度量,它们是根据分析需求而定的。与业务主题有关的各个方面或因素称为该主题的“业务要素”。例如,总量分析这一主题,通常会涉及到诸如时间、报表编制单位、报表项目等方面,因此设计总量分析的多维业务空间时,它们都是必须要考虑的业务要素。有的业务要素可以再细分,例如对“报表编制单位”还可以进一步就它的所属行业、所在地区、所属市场类型等进行更加细致的研究。行业、地区、市场等就是报表编制单位

60、业务要素的细分。在诸多业务要素中,那些不可再细分的业务要素,称为“基本业务要素”,它们是多维业务空间的“基”,并形成该业务空间的“维”。每个维有一定的维成员,即每个坐标有其坐标值。一个维不可再分,但这个维坐标的取值可以细分。例如时间维可以由“年”细分为“季度”;地区维的坐标值可以由“地区”细分为“省(市)”等,这些对维坐标取值的细分称为分层。二、多维业务空间设计要点设计多维业务空间的要点包括以下一些方面: 对所要研究和分析的业务问题必须进行详细地调查和分析,找出这一应用领域里管理和决策人员的现实需求,确定业务主题。这是设计“多维业务空间”的基础。 细分业务主题,确定度量和维,为构造多维数据模型服务。 设置度量和维,构建多维数据模型,是对数据源中的数据按照用户可能的观察角度进行重新组合,使数据以多维联机的形式组织和存储

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!