商业分析第6章商业数据分析方法

上传人：wux****ua 文档编号：16180305 上传时间：2020-09-21 格式：PPT 页数：87 大小：6.01MB

收藏版权申诉举报下载

第1页 / 共87页

第2页 / 共87页

第3页 / 共87页

下载文档到电脑，查找使用更方便

14.9 积分

下载资源

资源描述：

《商业分析第6章商业数据分析方法》由会员分享，可在线阅读，更多相关《商业分析第6章商业数据分析方法（87页珍藏版）》请在装配图网上搜索。

1、,商业分析,-商业数据的分析、挖掘和应用,华东师范大学出版社,第6章商业数据分析方法,本章主要内容,回归分析介绍回归分析是处理变量之间关系的一种统计方法和技术，其基本思想、方法以及“回归（Regression）”名称的由来都要归功于英国统计学家FGalton（18221911）。,回归分析,回归分析主要解决以下几方面的问题：通过分析大量的样本数据，确定变量之间的数学关系式。对所确定的数学关系式的可信程度进行各种统计检验，并区分出对某一特定变量影响较为显著的变量和影响不显著的变量。利用所确定的数学关系式，根据一个或几个变量的值来预测或控制另一个特定变量的取值，并给出这种预测或控制

2、的精确度。,回归分析,一元线性回归分析一元线性回归分析是在排除其他影响因素或假定其他影响因素确定的条件下，分析某一个因素（自变量）是如何影响另一事物（因变量）的过程，所进行的分析是比较理想化的。其实，在现实社会生活中，任何一个事物（因变量）总是受到其他多种事物（多个自变量）的影响。,回归分析,一元线性回归模型的确定,回归分析,利用t检验和F检验分别检验回归系数和一元线性回归方程是否显著。如两者均显著，说明该数据可以用一元线性回归模型来拟合，否则要考虑其他模型,呈线性关系,不呈线性分布,回归模型的显著性检验问题通过样本数据建立一个回归方程后，不能立即用于对某个实际问题的预测。因为，将应用最小

3、二乘法求得的样本回归直线作为对总体回归直线的近似，这种近似是否合理必须通过各种统计检验。一般经常使用以下的统计检验。,回归分析,回归系数的显著性检验（t检验）所谓回归系数的显著性检验，就是根据样本估计的结果对总体回归系数的有关假设进行检验，也就是检验斜率。回归系数显著性检验的基本步骤,回归分析,Eg.一元线性回归回归模型：y=0+1x+ （x为自变量，y为因变量， 0为截距， 1为斜率（回归系数），为误差变量。）指定 H0：1=0；备择假设为H1： 10 检验统计量为：其中，Sb1是b1的标准偏差（标准误差），,回归分析,( 为标准误差),如果误差变量服从正态分布，那么检验统计量服

4、从自由度为n-2的t分布。拒绝域为。当原假设为真，就说明两个变量间没有线性关系；当备选假设为真，则两个变量存在某种线性关系。 SPSS的实际操作中，我们只要关注t检验的显著性（Significance）值（sig值）。我们一般将这个sig值与0.05比较，当sig值小于0.05，我们认为差别显著；当sig值大于0.05，我们认为差别不显著；sig值越小，说明差别越显著，回归系数越显著。,回归分析,拟合优度检验回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度，从而判断回归方程对样本数据的拟合程度。回归方程的拟合优度检验一般用判定系数（Coefficient of

5、Determination）实现，用R2表示。该指标建立在对总离差平方和进行分解的基础之上。测定多元线性回归的拟合程度，与一元线性回归中的判定系数类似，使用调整后的判定系数。,回归分析,拟合优度检验,回归分析,yi和的离差可以进一步分解为两部分,如果对等式两边各项求平方，并把所有样本点加起来，进行一些代数运算可得,方程的左边衡量了因变量y的差异。方程右边的第一项用SSE表示，第二项用SSR表示，为回归平方和（Sum of Squares for Regression，SSR）,Y的差异=SSE+SSR,因此将差异分解为两个部分：SSE度量y中不可解释的差异部分；SSR度量y中可以被自变量x的

6、差异解释的差异部分。把这个分析过程整合到R2的定义中去：因此，R2衡量了y的差异中能够被x的差异解释的部分在总差异中所占的比例。一般来说，R2的值越大，模型拟合数据的效果就越好。,回归分析,回归方程的显著性检验（F检验）回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验。回归方程的显著性检验一般采用F检验，利用方差分析的方法进行。检验统计量为：拒绝域为：,回归分析,因变量的总差异可以分解为可解释的差异和不可解释的差异两个部分：而F=MSR/MSE，因此，若F值较大，表明因变量的总差异中可被回归方程解释的部分所占的比例较大，回归模型有效在SPSS软件的实际

7、操作中，我们也主要观察它的sig值，只要sig小于0.05，我们就认为回归模型是显著的,回归分析,多元线性回归分析一元线性回归问题只涉及了一个自变量，但在实际问题中，影响因变量的因素往往有多个。在线性相关条件下，研究两个或两个以上自变量对一个因变量的数量变化关系，称为多元线性回归分析，表现这一数量关系的数学公式，称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展，其基本原理与一元线性回归模型类似，只是在计算上更为复杂，一般需借助计算机来完成。多元线性回归模型的确定时常用逐步回归方法（Stepwise）。,回归分析,逐步回归法是对全部的自变量（X1，X2，Xp）对Y贡献的大小进

8、行比较，并通过F检验法选择偏回归平方和显著的变量进入回归方程，每一步只引入一个变量，同时建立一个偏回归方程。,回归分析,在引入了两个自变量以后，便开始考虑是否有需要剔除的变量,当回归方程中的所有自变量对Y都有显著影响而不需要剔除时,不论引入还是剔除一个变量都被称为一步。不断重复这一过程，直至无法剔除已引入的变量，也无法再引入新的自变量，逐步回归过程结束,多元线性回归中还需要注意多元共线性问题。多重共线性指自变量间存在线性相关关系，即一个自变量可以用其他一个或几个自变量的线性表达式进行表示。多元共线性会有两个不利影响： 1. 估计回归系数时会产生较大的抽样误差 2. 会影响系数的t检验，使依据

9、t检验做出的是否线性相关的推断发生错误。,回归分析,为了避免或者修正多元共线性，我们采用两种方法： 1. 在建立模型时要尽可能确保自变量之间的相互独立性 2. 另一个是逐步回归只有当某个自变量能够改变模型的拟合效果时，才把它放在模型中。如果两个自变量强烈相关，那么要对自变量进行合并或将重复的自变量删除，才可以最小化多元共线性的影响。,回归分析,实际运用中多重共线性主要有以下几种类型表现： 1. 整个模型的方差分析检验结果为（为显著性水平），但各自变量的偏回归系数的统计学检验结果却是； 2. 专业上认为应该有统计学意义的自变量检验结果，却无统计学意义； 3. 自变量的偏回归系数取值大小甚至符号

10、明显与实际情况相违背，难以解释； 4. 增加或删除一个自变量或一条记录，自变量偏回归系数发生较大变化。,回归分析,对于多重共线性的识别，可以通过SPSS中Statistics（统计量）子对话框中的Collinearity Diagnostics（共线性诊断）复选框予以实现。复选框Collinearity Diagnostics提供以下统计量： 1. 容忍度（Tolerance） 2. 方差膨胀因子（Variance Inflation Factor, VIF） 3. 特征根（Eigenvalue） 4. 条件指数（Condition Index）,回归分析,含虚拟自变量的回归分析数量变量、定

11、量变量或数量因素：可以直接用数字计量的因变量和自变量，即可以获得实际观测值（如收入、支出、产量、国内生产总值等）非数量型的变量：性别、民族、职业、文化程度、地区、正常年份与干旱年份、改革前与改革后等定性变量定性变量作数量化处理：引进只取“0”和“1”两个值的虚拟自变量。当某一属性出现时，虚拟变量取值为“1”，否则取值为“0”。对于包含一个具有k种特征或状态的质因素的回归模型，如果回归模型没有常数项，则需引入k个01型虚拟变量D；如果有常数项，则只需引入k1个01型虚拟变量D。当k=2时，只需要引入一个01型虚拟变量D。,回归分析,含调节变量的回归分析如果变量Y与变量X有关系，并且这个关

12、系受到第三个变量M的影响，那么变量M就是调节变量。调节变量影响自变量和因变量之间的关系，既可以是定性的（比如性别、受教育程度等），也可以是定量的（比如年龄、工资收入），它影响自变量和因变量之间关系的方向（正负）和程度（强弱）。,回归分析,简要模型： Y = aX + bM + cXM + e Y与X的关系由回归系数a+bM来刻画，它是M的线性函数，c衡量了调节效应（Moderating Effect）的大小。如果c显著，说明M的调节效应显著。,回归分析,讨论调节变量的调节效应，可分为以下情况： 1. 当自变量是类别变量，调节变量也是类别变量时，用两因素交互效应的方差分析，交互效应即调节效应；

13、 2. 当调节变量是连续变量时，自变量使用伪变量，将自变量和调节变量中心化，使用上述公式做层次回归分析：做Y对X和M的回归，得测定系数R21；做Y对X、M和XM的回归得R22，若R22显著高于R21，则调节效应显著。或者，作XM的回归系数检验，若显著，则调节效应显著； 3. 当自变量是连续变量，调节变量是类别变量时，分组回归应按M的取值分组，做Y对X的回归。若回归系数的差异显著，则调节效应显著，调节变量是连续变量时，同上述公式的层次回归分析。,回归分析,多元线性回归分析在的商业应用案例,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,自变量：评论深度（字数）、评论极性

14、（正面或负面）、产品类型因变量：评论有用性 H1：商品类型会为评论极性对评论有用性的影响起到显著的调节作用。对于体验型商品，中立评价的作用比极端评价更显著。 H2a：负面评论的在线评论有用性大于正面评论。 H2b：较体验型商品，正面评论对搜索型商品的有用性更高。 H2c：较体验型商品，负面评论对搜索型商品的有用性更高。 H2d：较搜索型商品，体验型商品的正面评论与负面评论的有用性差异更大。 H3：评论深度对评论有用性具有显著的正向影响作用。 H4：商品类型会为评论深度对评论有用性的影响起到显著的调节作用，与体验型商品相比，评论深度对有用性的正向影响在搜索型商品中更为明显。,回归分析,数据来源

15、：卓越亚马逊（）研究样本：体验型和搜索型两种商品类型中的6个大类下的12种商品。搜索型商品选择U盘、手机和路由器，体验型商品选择了音乐CD、书籍和化妆品。对商品的基本信息和在线评论进行抓取，主要通过火车头采集器进行每条评论包括以下数据：评论星级；评论总投票数；评论有用票数；评论者；评论时间；评论文本内容根据研究需求对采集到的在线评论进行筛选共得到2157条较高质量的在线评论,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,自变量：评论星级Start_Rating；评论深度Review_Depth 调节变量：商品类型Product_Type；评论极性Review_

16、Extremity 因变量：评论有用性Helpfulness% 控制变量：投票总数Total_Votes,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,检验H1、H3、H4采用的回归方程： Helpfulness % =0 +1Star_Rating + 2Review_Depth + 3Product_Type+ 4Total_Votes + 5Star_Rating Product_Type+ 6Review _Depth Product_Type + 检验H2a、H2b、H2c、H2d采用的回归方程： Helpfulness % = 0 +1Product_Typ

17、e + 2Review_Extremity + 3Review_Extremity Product_Type + ,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,调整后的R2=0.384，达到同类研究水平，方程拟合度较高，p值=0.000表明各指标对评论有用性存在显著的影响,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,为进一步探究搜索型商品与体验型商品的具体调节作用，分别对其进行多元线性回归分析对于体验型商品，评论星级Star_Rating（p=0.000）和Star_Ra

18、ting2（p=0.018）对评论有用性有显著影响。对于搜索型商品，评论星级Star_Rating（p=0.069）对评论有用性没有显著影响，而Star_Rating2（p=0.035）对评论有用性有显著影响。假设H1成立，即商品类型会使评论极性对评论有用性的影响起到调节作用，且对于体验型商品，中立评价的作用比极端评价更显著。,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,0,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,0,回归分析,商业数据的采集,变量的确定,回归方程,模型构建和假设形成,体验型商品和搜索型商品，p值0.05，且系数均为

19、正，表明评论长度越长，有用性越高，即评论深度会对评论有用性产生显著的正向影响，假设H3成立。模型输出结果中Review_Depth Product_Type（p=0.009）可知商品类型使评论深度对评论有用性的影响起到显著调节作用，而其系数为正，则评论深度对评论有用性的正向影响作用在搜索型商品中更为明显，假设H4成立。商品类型与评论极性的交互影响会影响到在线评论的有用性，我们发现在体验型商品中，中立评价比极端评价（无论是正面评论还是负面评论）更有用。与体验型商品相比较，获取搜索型商品的客观信息对于消费者更加便利有用，消费者在浏览在线评论时会更多地关注字数较多的评论，从中达到了解商品优劣的

20、目的。,6.2.1 Logistic回归简介线性回归中的因变量是定量变量，但是当因变量的取值为两个或两个以上的定性变量时，之前介绍的回归模型就无法解决了。而事实上，无论是在社会科学还是经济生活中，我们常常会遇到这种情况（男性还是女性？买还是不买？用户购买某商品是受何种因素影响：年龄？性别？收入水平？）。因为这些定性变量的误差项不呈现正态分布，不能够满足线性回归要求的正态分布假设，而且普通线性回归模型的预测值可能不在01之间，无法解释某件事件发生的概率。,6.2 Logistic回归简介,能否建立类似于线性回归的模型，对这种数据加以分析？以最简单的二分类因变量为例来加以探讨，为了讨论方便，

21、常定义出现阳性结果时因变量取值为1，反之则取值为0。例如当领导层出有女性职员、下雨、痊愈、是潜在消费者时反应变量y1，而没有女性职员、未下雨、未痊愈时y0。记出现阳性结果的频率为p（y1）。很显然，。,6.2.1 Logistic回归简介,Logistic回归是对定性变量的回归分析。可用于处理定性因变量的统计分析方法有：判别分析（Discriminant Analysis）、Probit分析、Logistic回归分析和对数线性模型等。 Logistic回归分析根据因变量取值类别不同，又可以分为二元回归（Binary Logistic）分析和多元回归（Multinomi-nal Logistic

22、）分析。 Binary Logistic回归模型中因变量只能取两个值1和0（虚拟因变量），而Multinomial Logistic回归模型中因变量可以取多个值。,6.2.1 Logistic回归简介,Logistic回归属于多重变量分析的范畴，其实质是利用概率的形式，通过Logit函数变换，将自变量与非连续性的因变量的关联转化为特定的对数线性关系。这种回归方法一方面避免了对变量类型和变量分布的严格限定，另一方面又能保留线性回归的直观性，从而更好地对因变量的影响因素进行分析和筛选，对因变量的产生进行描述和预测。,6.2.1 Logistic回归简介,Logistic回归的用途可归纳为三个方面：

23、寻找影响因素：根据不同的研究目的，分析寻找影响研究结果的因素，即寻找定性因变量。预测：建立logistic回归模型，根据模型，预测在不同的因变量情况下，发生某些情况的概率有多大。如银行可以根据用户的年龄、性别、购房、贷款信息等预测客户还款情况。判别：实际上跟预测有些类似，也是根据logistic模型，判断人们可能的行为，还以银行还款为例，即根据模型判别该用户还款的几率有多大。,6.2.2 Logistic回归的目的与用途,1、二元Logistic回归模型假设某一事件Y可能有两种结果，发生（Y=1）和不发生（Y=0），该事件成功的概率P=Pr(Y=1)可以用Logistic模型表示为：

24、上式可推出：为截距；和 =1,2,.,k,是第j个自变量和该自变量的待估系数。回归系数的大小和符号可以揭示不同自变量与发生概率直接关系。,6.2.3 Logistic回归模型,2、多元Logistic回归模型当Y=1,2,3.n时，使用如下模型：代表截距大小，为回归系数，代表独立变量。,6.2.3 Logistic回归模型,6.2.4 Logistic回归的分析步骤,1. 定义业务目标定义业务目标是根据研究目的确定因变量和自变量。与客户购买保险产品行为有关的因变量包括年龄、性别、文化程度、收入、健康状况、对风险的认识等，可以赋予这些因变量的值有1或0。自变量也叫协变量，是指那

25、些对因变量有影响的变量。自变量的确定要根据经验和实际研究情况来确定，以客户购买保险产品行为为例，自变量可能是客户所处的行业、地区、宗教信仰等。,6.2.4 Logistic回归的分析步骤,2. 估计回归系数 Logistic回归系数一般由极大似然法（Maximum likelihood method）估算，以便估计的P当Y=0时接近0，Y=1时接近1。自变量的取舍通常根据极大似然比（MLR）或者协方差近似估计（ACE）以逐步回归的方式进行。通常从数据中选取60%-70%的样本作为估计回归系数的建模样本，其余的作为检验模型拟合情况的验证样本。,6.2.4 Logistic回归的分析步骤,3. 显

26、著性检验当回归系数不是很大时，可以用沃氏检验（Wald test）检验其显著水平。该统计量是建立在极大似然法估计的近似正态分布基础上，可用下式估算： W=（ /s.e.( )）是某个预测变量的Logistic回归系数估计值，s.e.( )是该系数的标准误差。Wald统计量呈卡方分布，如果预测变量时定量变量，其自由度为1，如果预测变量是分类变量，其自由度为类别数减1。实际上，也可以用参数估计值除以其标准误差计算t值，然后用t检验对参数为0的假设进行检验，其自由度为样本数减估计的参数个数。大样本时可以用z检验。,4. 解释结果截距决定假设所有变量值为0时事件发生的概率。回归系数表示事件发生

27、概率与Xj之间的关系。 0，表示Xj与事件发生概率正相关， 0，表示负相关， =0表示Xj与事件发生概率无关。,6.2.4 Logistic回归的分析步骤,确定业务目标 Logistic回归模型可用于解决银行对用户提前还贷款情况的预测。我们首先从企业业务视角定义业务目标：预测房贷客户提前还款的可能性；分析客户提前还款的特征；减少客户提前还款率。,6.2.5 Logistic回归案例,定义目标变量解决该问题的原理为，通过房贷的基本属性和客户历史行为预测客户未来提前还款的可能性。表现期：标识客户未来是否提前还款的时间段（3个月）。模型目标：预测客户未来三个月大幅提前还款。,6.2.5 Lo

28、gistic回归案例,6.2.5 Logistic回归案例,表6-5 目标变量及含义,建模算法 Logistic回归模型的一般形式为：（6.13）其中是P是流失概率，代表截距大小，为回归系数，代表独立变量。因为该案例数据来源于银行数据仓库， Logistic回归分析结果如表6-6所示：,6.2.5 Logistic回归案例,6.2.5 Logistic回归案例,表6-6 Logistic回归结果表,根据表6-6可以看出，表中所有的变量均显著，即认为这些因素都会影响客户的还款。具体的指标解释如下：,6.2.5 Logistic回归案例,表6-7 指标解释,从而可得到可能提前还款的用户

29、特征为：产品数和账户数较少开户时间较短，年龄偏小贷方交易不活跃借方交易次数较多大额资金转出或取现销户数增加可根据这些特征对用户采取挽留的措施。,6.2.5 Logistic回归案例,6.3 时间序列分析,如果历史数据受变量过去值的制约，这种预测方法叫时间序列分析方法。该方法的目的是在历史资料中发现规律性的轨迹，然后将这个轨迹推到未来。这种预测依赖于历史数据和历史预测误差。,6.3.1时间序列的构成要素和分析步骤,时间序列概念：时间序列，也叫时间数列，它是把不同时间状态下的统一指标按照时间的先后顺序排列得到的数列。时间序列中取值的时间间隔可以是年份、季度、月份、天或小时等其他时间

30、形式。所取数值可以是瞬间值，我们称之为时点值，也可以是某一阶段的累加值，即时期值，如，某一天12:00时的网页点击量是时点值，超市的年营业额是时期值。,2. 时间序列的构成要素,时间序列数值随着时间的统计特性呈现出多样化的规律和特征。为了把握时间序列数值的规律，传统统计学在研究大量实例后发现，按其特点和综合影响结果将时间序列分为四种不同的成分。一个时间序列往往是这四种要素的叠加或耦合。长期趋势（Long Term Trend，T）。季节变动（Seasonal component，S）。循环变动（Cyclical component，C）。不规则变动/随机变动（Irregular Com

31、ponent，I）。,时间序列由以上四种成分根据成分之间的关系进行组合而成。组合的方式主要有两种：一种是加法模型：Y=T+S+C+I 一种是乘法模型：Y=T*S*C*I,3. 时间序列分析的步骤,6.3.2 时间序列分析预测方法,指数平滑法简介指数平滑法是生产预测中常用的一种方法。也用于中短期经济发展趋势预测，据平滑次数不同，指数平滑法分为：一次指数平滑法、二次指数平滑法和三次指数平滑法等。当时间数列无明显的趋势变化，可用一次指数平滑预测。二次指数平滑是对一次指数平滑的再平滑。它适用于具线性趋势的时间数列。三次指数平滑预测是二次平滑基础上的再平滑。,指数平滑法案例,表6-8是一家制鞋公司

32、在2010年、2011年、2012年皮鞋、雨鞋和胶鞋的销售量数据（单位，双）。由图6-4、图6-5、图6-6可知，各类鞋子的时间数列无明显的趋势变化，故本文将选用一次平滑指数计算皮鞋、雨鞋、和胶鞋在2013年一月的销售数量。这里的值选定为0.4。,(2)季节分解法简介,季节趋势预测法是对包含季节变动的时间序列进行预测的专门方法。为此首先要研究时间序列中的季节变动规律。季节性分解法将时间序列分解为4个部分，或称为4个分量，即“趋势分量”、“季节分量”、“随机分量”、“季节性调整序列分量”。趋势分量采用多项式拟合，季节分量采用傅里叶变换估计，其数学表达式为： Yt=f(Tt,St,It) （6

33、.17）式中Tt代表长期趋势（可以是线性趋势，也可以是周期性波动或长周波动），St为季节因子（幅度和周期固定的波动），It为随机波动，可视为误差。季节性调整序列分量是消除了季节性要素之后的时间序列。,季节分解法案例本例以具体的时间序列数据，结合相应的分析软件SPSS 19.0的计算过程来展示季节分解的步骤，探讨季节变动中的规律，然后选用恰当的模型做季节趋势预测。,从趋势成分图中发现,销量增速缓慢，故本文采取直接平均法预测季节销量。直接平均法是通过同期（月或季度）数值直接平均的方法度量季节水平，进而求解各期的季节指数，预测出时间序列未来水平的预测方法，又称同期平均法、按月（季）平均法。这种方

34、法不考虑长期趋势的影响，直接对原始数据的时间序列采用直接平均的方法消除不规则变动，计算出各期的季节指数，对预测对象的平均趋势水平进行季节性调整或预测。重点是对周期内各个不同的水平进行预测。,6.4 交叉影响分析法,6.4 .1 交叉影响分析法概述(可称为交叉影响矩阵法或交叉影响概率法),交叉影响分析法，就是根据若干个事件之间的相互影响关系，分析当某一事件发生时，其他事件因受到影响而发生何种形式变化的一种方法。交叉影响法是研究一系列事件Ej(E1,E2,En)及其概率Pj(P1,P2,Pn)之间的相互关系,事件之间的相互影响关系:有影响、无影响或者分为正影响、负影响。有影响表示某一事件的发生会

35、引起另一事件发生的概率发生变化；无影响表示某一事件的发生不引起另一事件发生的概率发生变化（或者变化极小，可以忽略不计）；正影响表示某一事件的发生会使受影响的另一事件发生的概率提高；负影响表示某一事件的发生会使受影响的另一事件发生的发生概率降低。,6.4 .2 交叉影响分析法实施步骤,第一步：确定目标事件中相互间存在重要影响关系的各事件及其相互之间的影响关系。,以一个目标事件E1受到两个相关事件E2、E3影响为例，将事件影响关系按照有利发生（+），不利发生（-）及没有影响（/）分类，其影响关系矩阵如表6-11。,表6-11 各事件相互影响关系矩阵,第二步：评定各事件的初始概率Pj，见表6-1

36、2。,6.4 .2 交叉影响分析法实施步骤,表6-12 各事件相互影响关系及初始概率,第三步：评定各事件的相互影响概率Pij。,6.4 .2 交叉影响分析法实施步骤,比如将影响程度分为五等，分别赋以0-1之间的数值（S）（见表6-13），结合之前确定的影响方法判定（A），可以计算出相互影响概率，从而得到完成的相互影响矩阵（表6-14）。,表6-13 影响程度赋值表,6.4 .2 交叉影响分析法实施步骤,表6-14 完整的相互影响关系矩阵,6.4 .2 交叉影响分析法实施步骤,第四步：通过随机取样的方式进行实验，一次试验的完成过程如下：,从全部事件集合中随机抽取一个事件，如E1；用随机数法确定

37、事件E1是否发生，即从0-99中随机抽取一数i，与事件E1的初始概率P1相比较，如果i75，则事件E1不发生；如果i75，则事件E1将发生；如果随机抽取的事件E1不发生，将不影响其它事件，其它事件的初始概率均不改变。如果随机抽取的事件E1发生，将影响其它事件，受其影响的各事件的概率将按照相互影响关系矩阵，利用公式计算过程Pj。过程概率Pj将在该次试验中取代相互影响关系矩阵中的初始概率Pj。在没有被抽到的事件中重复上述三个步骤，直至全部事件都被随机抽取到，方完成一次试验。,6.4 .2 交叉影响分析法实施步骤,第五步：将过程概率Pj全部恢复为初始概率Pj，进行下一次试验。通过多次反复试验，最

38、后由各事件发生的次数与试验总次数相比，得到该事件的校正概率P*j，用P*j代替Pj，结合结论分析进行策略性决策。,6.4.3 交叉影响分析法应用实例,1. 工程项目风险事件等级的评定,假设某个工程项目在开发建设阶段有以下五个风险事件：成本超支、工期延误、设计不当、劳资纠纷、施工效率低下。风险等级确定。根据行业经验确定风险事件登记的划分范围（见表6-15）。,表6-15风险事件的等级划分,6.4.3 交叉影响分析法应用实例,最后将每种风险事件发生的概率乘以该风险事件对于工程项目的影响程度，得到每种风险事件的风险等级（风险等级=风险发生概率*风险影响程度）。并对应表6-15、表6-16可以给出每个

39、风险事件的登记含义以及风险事件发生的概率。,表6-16 用德尔菲法确定每种风险的发生概率,6.4.3 交叉影响分析法应用实例,由表6-17可以看出，该工程项目有三个一般风险事件和两个轻度风险事件，假设项目决策方或风险管理人员看到了这个结果，则会认为该工程项目中没有特别重要的风险，而有可能忽略对于风险事件的防范和控制。,表6-17各事件的风险等级,6.4.3 交叉影响分析法应用实例,2. 引入交叉影响法,以工程项目风险事件为例，交叉影响法的运用流程如下：确定五种风险的初始概率分别为P1=0.8，P2=0.5，P3=0.1，P4=0.4，P5=0.2。假定用KS表示其中一种风险对其它风险的影响

40、，其中K=+1表示正影响，K=-1表示负影响，S表示影响的程度大小，建立影响列表（见表6-18）。,表6-18 交叉影响的方向和程度,6.4.3 交叉影响分析法应用实例,表6-19 不同风险的相互影响矩阵,表6-18、表6-19中的数值，可以通过德尔菲法由专家做出，即由专家测定交叉影响的程度。例如P1与P2交叉的-0.8代表的含义是：当成本超支的风险发生后，即当P1=1，对工期延长的风险有80%的负影响。,6.4.3 交叉影响分析法应用实例,然后可以根据交叉影响法的经验公式，算出相互影响后的概率。（6.20）例如，当成本超支的风险已经发生时候，即P1=1，工期延误的风险概率变为：（6.2

41、1）即成本超支反而降低了工期延误的风险，因为工期很有可能因为加大投资而缩短,6.4.3 交叉影响分析法应用实例,同理:,（6.22）（6.23）（6.24）,可以看出，当成本增加后，其它建设期的风险都有所下降,6.4.3 交叉影响分析法应用实例,依照这种方式，可以计算出当P2=1，P3=1，P4=1，P5=1时其它风险的交叉概率，最后可以得到交叉影响概率的汇总表（见表6-20）。,表6-20 相互影响发生后的概率矩阵,这就是交叉影响后的概率，举例来说，当发生劳资纠纷时，即P4=1相应的成本超支的风险会增大到0.928，工期延误的风险会增大到0.75等等。,6.4.3 交叉影响分析法应用实

42、例,3. 通过蒙特卡罗模拟随机实验得到校正概率,在实际运用蒙特卡洛模拟随机事件发生时，总是随机抽取可能发生的事件，然后算出一组交叉影响概率值（已不同于初始概率），然后再随机抽取发生的事件，然后以上一次已经影响的概率作为新的初始概率来测算第二次相互影响的概率。其顺序是这样的，依然以上面的五种风险为例：在五种风险事件中随机抽取一种，假设抽中P2。在099的随机数表中抽取随机数，按照蒙特卡罗模拟法则，用该数与第一步中选定的风险的初始概率比较，来确定事件是否发生。若抽取的数为38，而初始概率P2=0.5，因为3850，所以可以认为工期延长的风险发生了。若抽中5099，则认为风险没有发生。若模拟事

43、件未发生，则初始概率不予调整，若发生，则按照经验公式来计算交叉影响后的概率。在本例中，表6-19就是按照经验公式计算出的第一次模拟后的交叉影响概率。,6.4.3 交叉影响分析法应用实例,再从未被模拟的风险事件中，随机抽取一个事件，重复步骤2和步骤3，如果第一次模拟已经调整过初始概率，则将步骤3中被调整后的交叉影响概率作为新的初始概率应用。重复步骤1到4，直到5种风险事件都被模拟一遍为止，也就是说，必须让这五种风险事件，或者“发生了”或者“没发生”，这称之为一轮模拟。在本例中，相当于一轮模拟需要进行5次随机模拟。将风险事件的概率调回最初的初始概率，再进行一轮一轮的模拟。经历多轮重复的模拟，统

44、计每一风险事件发生的概率，即在模拟过程中某风险事件发生的次数与模拟总次数的比值，这个值就可以认为是交叉作用影响下每个风险事件将要发生的概率值，即校正概率，模拟的次数越多，校正概率就越逼近于真实值。即假设经过了1000轮模拟，而P2事件一共被模拟发生了560次（每一轮模拟中，工期延长的风险P2都可能“发生”，或者“不发生”），则校正概率为560/1000=0.56。,6.4.3 交叉影响分析法应用实例,4. 用交叉影响法计算风险事件的概率,本文根据昌杰引入了马尔可夫链的预测概念来帮助手工计算交叉影响法的校正概率，对交叉影响法的改进，来计算文中五种风险事件相互影响后的校正概率。最终我们得到运用交叉

45、影响后的风险的事件为校正概率为：,（6.25）,由此可以看出，最终的校正概率比一开始用德尔菲法测定的风险事件概率要更精确，它考虑到了风险事件作为一个系统之后相互作用的结果，现在我们用这个校正后的风险事件概率来进行风险登记的计算，并对应表6-13来确定各个风险事件的登记和程度。通过对比可以发现，运用交叉影响法校正后的风险概率计算出的风险登记与表6-15中的风险登记有所不同。,6.4.3 交叉影响分析法应用实例,表6-21 运用交叉影响法后的风险等级的评定,从表6-21中可以看出，相对于原来的风险等级，运用交叉影响法后的风险等级都有了变化，其中成本超支这一风险事件已经由一般风险升高变为了重要风险，这意味着项目主体和风险管理人员在项目施工过程中要特别注重对于成本的控制，采取有针对性的应对措施，比如建立更完善的采购制度来避免浪费，提高施工质量来杜绝返工行为等，从而尽量避免成本超支的发生。,习题,1. 使用SPSS进行回归分析的过程有哪些？ 2. 时间序列分析的主要用途是什么？ 3. 交叉影响分析法的实施步骤是什么？,Click to edit company slogan .,Thank You !,

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

商业分析第6章商业数据分析方法

最新文档

相关资源

相关搜索