市场分析课件第8章数据的统计分析与软件应用

上传人:痛*** 文档编号:149405279 上传时间:2022-09-07 格式:PPTX 页数:172 大小:1.58MB
收藏 版权申诉 举报 下载
市场分析课件第8章数据的统计分析与软件应用_第1页
第1页 / 共172页
市场分析课件第8章数据的统计分析与软件应用_第2页
第2页 / 共172页
市场分析课件第8章数据的统计分析与软件应用_第3页
第3页 / 共172页
资源描述:

《市场分析课件第8章数据的统计分析与软件应用》由会员分享,可在线阅读,更多相关《市场分析课件第8章数据的统计分析与软件应用(172页珍藏版)》请在装配图网上搜索。

1、第第8 8章章数据的统计分析与软件应用数据的统计分析与软件应用9/6/20221主要内容第一节 统计分析的基本理论第二节 定性分析方法第三节 描述性统计分析第四节 解析性统计分析 9/6/20222第一节 统计分析的基本理论一、统计整理一、统计整理二、统计分组法二、统计分组法 三、次数分布三、次数分布四、统计图四、统计图9/6/20223一、统计整理的定义 统计整理是根据统计研究的任务,对统计调查所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。9/6/20224(二)统计整理的内容 1、录入数据,建立数据表 2、数据排序 与分组 3、

2、编制次数分布表与累计次数分布表 4、绘制统计图9/6/20225对数据进行排序对数据进行排序1 打开打开“2统计图表统计图表.xls”工作簿,选定工作簿,选定“成绩成绩排序排序”工作表。工作表。利用鼠标选定单元格区域。利用鼠标选定单元格区域。9/6/20226 在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。9/6/20227 在排序对话框窗口中,选择在排序对话框窗口中,选择“主要主要关键字关键字”列表中的列表中的“英语英语”作为排序作为排序关键字,并选择按关键字,并选择按“递增递增”排序。由排序。由于所选取数据中已经包含标题,所以于所选取数据中已经包含标题,所以在在“当前数据清单当前

3、数据清单”中选择中选择 “有标题有标题行行”,然后单击,然后单击“确定确定”按钮,即可按钮,即可得到得到 排序的结果。排序的结果。9/6/20228对数据进行排序对数据进行排序2 打开打开“2统计图表统计图表.xls”工作簿,选定工作簿,选定“成绩成绩排序排序”工作表。工作表。使用使用RANK函数进行排序:函数进行排序:RANK(指定数字,范围,(指定数字,范围,0)注意:注意:0或者忽略表示降序,非零值表示升序。或者忽略表示降序,非零值表示升序。范围要用绝对地址。范围要用绝对地址。9/6/20229 演示演示 9/6/202210 9/6/202211 9/6/202212 4.编制次数分布

4、表与累计次数分布表 次数分布表可以表明各组间的单位数在总体中所出现的次数或所占比重,从而描述总体的内部结构,揭示总体中的关键因素与本质特征。累计次数分布则能够表明各标志值以上或以下所出现的次数或比重。9/6/202213表213某班统计学考试成绩次数分配考分次数向上累计向下累计人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)506025.025.040100.06070717.5922.53895.070801127.52050.03177.580901230.03280.02050.090100820.040100.0820.0合计40100.0返回9/6/202214统计图 各

5、种各样的统计图可以形象、直观地表明数据的分布形态与发展变化的趋势。9/6/202215三、Excel中的统计整理工具 1.数据排序Excel可以根据用户的要求对数据表的行或列数据进行排序。排序时,Excel 将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。9/6/202216 2.频数分布函数 频数分布函数是Excel 的一个工作表函数,是编制次数分布的主要工具,通过频数分布函数,可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。3.数据透视表 数据透视表是一种交互式工作表,用于对已有数据表和数据库中的数据进行汇总和分析的一种工具。9/6/2

6、02217频数分布函数(FREQUENCY)可以对一列垂直数组返回某个区域中数据的频数分布。频数分布函数(FREQUENCY)的语法形式为:FREQUENCY(data_array,bins_array)其中:Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。9/6/2022184.统计图Excel可以绘制许多图表,其中大部分是统计图,可用于数据的整理与分析,能够直观形象地描述现象的数量规律性。9/6/202219二、资料整理的方法二、资料整理的方法统计分组法统计分组法 (一)分组涵义(一)分组涵义 (二)分组的作用(二)分组的作用 (三)分组标志的选择

7、(三)分组标志的选择 9/6/202220就是根据统计研究的需要,将统计总体按照一定的标志区分成若干组成部分的一种统计方法。9/6/202221(三)分组标志的选择(三)分组标志的选择 9/6/202222按品质标志分组 如按性别分组,见表3-5表 3-5 某班学生的性别构成情况按性别分组绝对数人数比重(%)男3075女1025合计40100直方图接收频率频率直方图接收频率频率直方图接收频率频率9/6/202223按数量标志分组 单项式分组 见表3-6 工人日产量(件)绝对数比重(%)2108.731513.043026.154034.862017.4合计115100.0表3-6 某厂第二季度

8、工人平均日产量工人数9/6/202224组距式分组 见表3-7工人完成生产定额分组(%)绝对数比重(%)第一组80903016.7第二组901004022.2第三组1001106033.3第四组1101203016.7第五组1201302011.1合计180100.0表3-7 某工厂工人完成生产定额情况表工人数9/6/202225三、次数分布次数分布的概念与种类 在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分配(布)或分配数列。分布在各组的个体单位数叫次数或频数,各组次数占总次数的比重叫频率。9/6/202226 按品质标志分组

9、品质数列 一般是单项式分组 见表3-5 按数量标志分组变量数列 可以是单项式 见表3-6 也可以是组距式 等距数列 见表3-7、3-8 异距数列 见表3-99/6/202227考分人数(人)比重(%)506025.06070717.570801127.580901230.090100820.0合计40100.0表3-8 某班学生考试成绩单9/6/202228人口按年龄分组人口数(万人)1岁以下(婴儿组)117岁(幼儿组)6717岁(学龄儿童组)121855岁(有劳动能力的人口组)24.655岁以上(老年组)8.1合计51.7表3-9 某地区人口分布状况9/6/202229四、统计图 一)、绘制

10、统计图的基本步骤 二)、条形图与柱形图 三)、饼形图 9/6/202230(一)、Excel绘制统计图的基本步骤 Excel 提供“图表向导”工具,帮助创建适合于数据信息和分析目的的各种图表,下面先简单描述一下图表操作的基本步骤。使用“图表向导”工具制作图表之前,选定数据 所在的单元格,如果希望数据的行列标题显示 在图表中,则选定区域还应包括含有标题的单 元格。9/6/202231单击“插入”菜单中的“图表”选项,按照“图表向导”中4个步骤的指令进行操作。第1步“图表类型”:每种类型的图表都有两种以上的子类型,选中所需要的图形以及它的子图形,单击“下一步”按钮。第2步“图表数据源”:选定包含数

11、据和行列标志的工作表单元格,即便工作表包含多个行列标志,也能在图表中显示它们。生成图表时,应将各行列标志包含到选定区域中。若预览图表看去很合适,则表示所选数据区正确。单击“下一步”按钮。9/6/202232第3步“图表选项”:为选定的图表设置某些标准选项。修改这些设置时,随时查看预览图表可以帮助我们确定设置是否合适。单击“下一步”按钮。第4步,“图表位置”:可以将图表放置在工作表上,或者单独置于一张新的图表工作表上,在这一步中,我们为图表工作表命名,或者选择现有工作表的名称,单击“完成”按钮。9/6/202233(二)、条形图与柱形图 条形图和柱形图可交换使用。Excel的条形图是水平条形,E

12、xcel柱形图为竖直条形。两种图表都可以用来表示与一组或几组分类相关的数值,它可用于不同现象的比较,也可以采用时间顺序描述现象的发展趋势。在条形图或柱形图中,各长条或柱的宽度与各长条间的距离彼此均等,条的长度与所代表的变量值成比例。9/6/202234基本步骤Excel 提供提供“图表向导图表向导”工具,帮助创建工具,帮助创建适合于数据信息和分析目的的各种图表。适合于数据信息和分析目的的各种图表。打开打开“2统计图表统计图表.xls”工作簿,选定工作簿,选定“成绩分组表成绩分组表”工作表。工作表。绘制柱形图。绘制柱形图。9/6/202235 上一页下一页9/6/202236 上一页下一页9/6

13、/202237 上一页下一页9/6/202238 上一页下一页9/6/202239 上一页下一页9/6/202240 上一页9/6/202241(三)、饼形图 例 中国人如何看WTO。由中国社会调查事务所组织的最近一次问卷调查显示:有58.4%的被调查者对中国加入WTO非常有信心;有19.3%的被调查者没有态度;有9.2%的被调查者表示担心;有13.1%的被调查者反对中国加入WTO试用饼形图描述一下中国人对加入WTO的看法。9/6/202242打开“统计整理.xls”工作簿,选择“WTO”工作表。打开Excel“插入”菜单,并单击“插入”菜单中的 “图表”选项,Excel会启动图表向导。在步骤

14、1的“图表类型”中选择“饼图”,并在“子类 型图表”中选择“三维饼图”,单击“下一步”按钮,进入向导2。9/6/202243如图所示,在步骤2中的数据区域中输入A3:B6单元格,单击“下一步”按钮,进入向导3。9/6/202244在步骤3中单击“标题”页面,输入标题“中国人看WTO”;单击“图例”页面,取消显示图例;单击“数据标志”页面,在“数据标志”列表中选择“同时显示百分比及数据标志”。如图所示。9/6/202245如果通过图表预览,认为满意,即可单击“完成”按钮。经过修饰后,得饼形图如图所示。中国人看WTO很有信心59%没有态度19%担心9%反对加入13%9/6/202246第二节第二节

15、 定性分析定性分析9/6/202247在市场营销研究过程的所有活动中,对研究者的技能要求最高的是资料的分析与解释。一般来讲,事实本身是没有用处的,一个人在一天中可能会搜集到对他本人并无用处的许多事实。资料只有经过比较和分析才有用。9/6/202248分析是以某种有意义的形式或次序把收集的资料重新展现出来。分析实际上是回答下面的问题:“每组资料里有些什么信息?”分析是分别检查每组资料,以找出其内涵的关键信息,并以有意义的形式表示出来。解释是在资料分析的基础上找出信息之间或手中信息与其它已知信息的联系。解释的主要目的是从所收集的资料中获得结论。它是把分析过的资料变成跟研究目的有关的有用信息,以使收

16、集的资料能为研究目的服务。9/6/202249资料的分析与解释是相互联系,相互依赖的。无论是资料的分析还是资料的解释,任何一个方面的工作开展得不好,都会影响到研究结果的有效性以及对资料的充分利用。9/6/202250例 假设某大型日用化工厂,每个季度要在全国的50个主要的大百货商场作一次库存检查。表7-8是该厂A牌老产品和B牌新产品在过去4个季度里销售量的变化。公司的营业部经理从上面资料发现,A牌销售量的下降与B牌销售量的上升有着惊人的吻合,因此作出结论,A牌产品的顾客转向了B牌,并建议这个时刻将A牌牙膏退出市场。9/6/2022519/6/202252 实际上发生的是,有两个竞争对手大力推销

17、他们的与A牌类似的产品以防止他们的顾客转到B牌上来。这样,尽管A牌老产品的市场由于新产品推出而下降了一些,但其销售量的下降主要是由于其它公司的促销活动引起的。9/6/202253表7-8的资料表明,A牌的销售量在下降而B牌的销售量在上升,这种分析是正确的,但解释是错误的,因为上面两组资料被不适当地联系到一起。如果调查市场上该产品的总销量以及仔细研究竞争对手的活动,发现市场上该产品的需求量在大幅度上升,而竞争对手的促销活动也在不断加强。那么A牌销售下降的真实原因也许是它的促销措施不得力,而不是由于B牌产品的进入。9/6/202254分析是把每组数据以某种形式重新组合起来以便从中发现有用的信息,解

18、释是在分析的基础上进行的,即把已经分析过的资料与其它的一些现存资料放在一起,通过比较,得到与研究目的有关的信息。如从各种分散资料中归纳出结论,然后根据结论提出各种备选的市场营销的方案。9/6/202255定性分析定性分析定量分析定量分析9/6/202256(一)定性分析(一)定性分析 常用的定性分析方法常用的定性分析方法定性分析的概念和原则定性分析的概念和原则 。9/6/202257(二)定量分析(二)定量分析定量分析:定量分析:是从事物数量方面的特征入手,运用一定的是从事物数量方面的特征入手,运用一定的数据处理技术进行数量分析,从而挖掘出数量中数据处理技术进行数量分析,从而挖掘出数量中所含的

19、事物本身的特性及其规律性的分析方法。所含的事物本身的特性及其规律性的分析方法。定量分析包括:定量分析包括:(1)描述性统计分析)描述性统计分析 (2)解析性统计分析)解析性统计分析 (3)不确定分析方法)不确定分析方法模糊分析模糊分析9/6/202258(三)定性分析方法(三)定性分析方法(1)归纳分析法归纳推理的方法是,首先产生一系个别的前提,然后把这些前提与其它前提结合在一起,以形成结论。这些个别的前提可以从观察、实验、调查中获得。在归纳方法中,任何结论都是基于从调查、实验或观察中得出的证据。市场营销研究中通过对大量个体(或样本)的研究得出一般性结论的方法使用的就是归纳法。9/6/2022

20、59(2)演绎分析法在运用演绎分析法时要注意如下问题:1)分类研究的标准要科学;2)分类研究的角度应该是多角度、多层次的;3)对分类研究后的资料还要运用多种逻辑方法揭示其本质,形成理性认识;4)综合要以分类研究为基础;5)综合要根据研究对象本身的客观性质,从内在的相互关系中把握其本质和整体特征,而不是将各个部分、方面和因素进行简单相加或形式上的堆砌。9/6/202260(3)比较分析法比较分析法是把两个或两类事物的调查资料相对比,从而确定它们之间相同点和不同点的逻辑方法。运用比较分析法时,要注意如下问题:可以在同类对象间进行,也可以在异类对象间进行;要分析可比性;应该是多层次的;9/6/202

21、261(4)结构分析法在市场调查的定性分析中,我们通过调查资料,分析某现象的结构及其各组成部分的功能,进而认识这一现象本质的方法,称为结构分析法。9/6/202262第三节 描述性统计分析描述性统计分析指对被调查总体所有单位的有关数据作搜集、整理和计算综合指标等加工处理,用来描述总体特征的统计分析方法。市场调查分析中最常用的描述性统计分析,主要包括对调查数据的分组分析、集中趋势分析、离散程度分析和相对程度分析、列表分析等。9/6/202263 描述性分析内容频数、频率分析数据集中趋势分析数据离散趋势分析交叉表分析9/6/202264描述性分析(一)中心趋势 平均值:中位数:众数:可以回答下述问

22、题,如购物中心调查 被调查者的平均年龄是多大?在购物中心的平均花费是多少?哪个时间段来惠顾的人最多?他们进入购物中心的主要目的是什么?9/6/202265描述性分析(二)离散程度 标准差:百分比(成数)可以回答下述问题,如购物中心调查 被调查者的年龄差别大吗?平均而言,有多大?他们在购物中心的花费差别有多大?他们进入购物中心的时间段集中吗?他们进入购物中心的目的一致吗?9/6/202266描述性分析(三)同一个变量,多个样本之间的比较比如,广州的顾客与西安的顾客有差别吗?西安的顾客在2003年与2000年相同吗?在被调查者的年龄上?在花费上?在时间段上?在目的上?9/6/202267(一)频数

23、、频率分析(1)例1:假设有样本数据ABCDEFGHIJ1122146533226112232543344133143354134564246353521121146626345513227636623651184153364634951325222621032523414459/6/202268频数、频率分析(2)VAR000016.005.004.003.002.001.00Count2220181614129/6/202269频数、频率分析(3)VAR000011717.017.017.02020.020.037.02121.021.058.01616.016.074.01313.013

24、.087.01313.013.0100.0100100.0100.01.002.003.004.005.006.00TotalValidFrequencyPercentValidPercentCumulative Percent9/6/202270例如例如:品质标志的描述分析品质标志的描述分析某校学生对体育锻炼态度调查结果0.00%5.00%10.00%15.00%20.00%25.00%30.00%35.00%非常喜欢喜欢一般不太喜欢讨厌很讨厌9/6/202271品质标志的描述品质标志的描述 饼图饼图某校学生对体育锻炼态度调查结果20%30%25%5%10%10%非常喜欢喜欢一般不太喜欢讨厌

25、很讨厌9/6/202272例例:对矿泉水市场的调查对矿泉水市场的调查北京市居民矿泉水最喜欢品牌33%32%19%5%4%3%2%2%乐百氏农夫山泉娃哈哈可赛雀巢蓝涧获特满其它9/6/202273(二)数据的集中趋势分析 对调查数据公布的数量规律性中集中特征进行分析,是对被调查总体的特征进行准确描述的重要前提。数据集中趋分析的对象,包括数据的均值(各类平均数)、中位数和众数。9/6/202274均值是数据偶然性和随机性的一个特征值,反映了一些数据必然性的特点。利用均值,可以将处在不同地区、不同单位的某现象进行空间对比分析,以反映一般水平的变化趋势或规律;可以分析现象间的依存关系等等,从而拓宽分析

26、的范围 9/6/202275众数是总体中出现次数最多单位的标志值,也是测定数据集中趋势的一种方法,克服了平均数指标会受数据中极端值影响的缺陷。从分析的角度看,众数反映了数据中最大多数的数据的代表值,可以使我们在实际工作中抓住事物的主要矛盾,有针对性地解决问题。9/6/202276中位数的确定可以以未分组资料为基础,也可由分组资料得到。它同样不受到资料中少数极端值大小的影响。在某些情况下,用中位数反映现象的一般水平比算术平均数更具有代表性,尤其对于两极分化严重的数据,更是如此。9/6/202277算术平均数未分组数据的平均数计算分组数据的平均数计算上例的计算结果270.31001001iixxf

27、ffxfxfxnxx为组频数 9/6/202278 中位数的计算(1)未分组数据的中位数计算 对所有数据进行排序,当数据量为奇数时,取中间数为中位数,当数据量为偶数时,取最中间两位数的平均数为中位数。上例中数据量为100,是偶数,所以应取排序后第50位数和第51位数的平均值作为中位数。第50位数是3,第51位数也是3,所以中位数为3。9/6/202279中位数的计算(2)分组数据的中位数计算 下式中L为中位数所在组的下限值,fm为中位数所在组的组频数,Sm-1为至中位数组时累计总频数,h为组距。hfSfLMmme1219/6/202280中位数的计算(3)例2:假设有分组数据如下(销售额单位为

28、万元)年销售额组中值商店数目累计频数80-90853390-10095710100-1101051323110-120115528120-130125230合计309/6/202281中位数的计算(4)依据公式例2的中位数为万元 85.103101310230100212111hfSfLMhfSfLMmmemme9/6/202282众数的计算未分组数据的众数为出现次数最多的数。分组数据的众数依据下式计算获得。表达式中1表示众数所在组与前一组的频数差,2表示众数所在组与后一组的频数差。依据公式,例2分组数据的众数为104.29万元。hLMo2119/6/202283(三)数据离散趋势分析对一组数

29、据规律性的研究,集中趋势是数据重要数量特征的一个方面,离散程度则是数据数量特征的另一方面。集中趋势反映的是数据的一般水平,我们用均值等一个数值来代表全部数据。若要较全面地掌握这组数据的数量规律,还需要计算反映数据差异程度的数值,如极差、平均差、方差和标准差离散系数等。9/6/202284l标志变动度l全距(Range)l四分位间距(IQR)l方差(Variance)l标准差(Standard Deviation)9/6/202285(1)标志变动度标志变动度是描述总体各单位标志值差别大小程度的指标,又称离散程度或离中程度。例某车间两个生产小组各人日产量如下:甲组:20,40,60,70,80,

30、100,120 乙组:67,68,69,70,71,72,73从下图可以看出甲组离散程度大,乙组离散程度小。9/6/2022869/6/202287(2)、全距全距是总体各单位标志的最大值和最小值之差。用R表示。R=Xmax-Xmin全距数值越大,反映变量值越分散,全距数值越小,反映变量值越集中。例1中最小值为1,最大值为6,因而全距为6-1=5。9/6/202288(3)四分位差四分位差是一种按照位置来测定数据离散趋势的计量方法,它只取决于位于样本排序后中间50%位置内数据的差异程度。即第一个四分位与第三个四分位数据之间的差异。9/6/202289(4)平均差 平均差是各单位标志值对平均数离

31、差绝对值的平均数。计算公式 在平均数相等时,平均差愈大,标志变异程度愈大,平均数的代表性愈小;平均差愈小,标志变异程度愈小,平均数代表性愈大。.XXADn9/6/202290(5)方差和标准差)方差和标准差总体方差 样本方差 标准差总体标准差,样本标准差s。NXi22)(22()1ixxsn2ss9/6/202291月租金的全距和四分位间距月租金的全距和四分位间距9/6/202292月租金的标准差月租金的标准差方差 标准差16.996.22s74.542ss9/6/202293(四)、交叉表交叉表是一种以表格的形式同时描述两个或多个变量以及结果的统计方法。频数分布只能依次描述一个变量。交叉表可

32、以同时描述两个或两个以上变量。9/6/202294频数分布如果要研究那些愿意在不同商场购物的消费者与其年龄间的关系?9/6/202295交叉表分析9/6/202296建立交叉分组表的通常做法是设计一个表,在这张表中,各列列出各种不同因素,如人口统计和生活方式特征,它们可以作为各行所列因素如心理、行为或意愿的预测指标。在表中,百分比通常以列总计为基数进行计算。采用这种方法可以简单比较各种关系,如心理、行为或意愿数据与性别或年龄之间的关系。9/6/202297交叉分组表为总结和分析调查结果提供了一种有效而易懂的方法。设计交叉分组表时必须牢记调研目标和事先的基本假设。某项调查的结果可能产生无数个交叉

33、分组表。这表明,分析人员必须加以判断,从所有可能的交叉分组表中选择适合于调研目标的表格形式。大量的电子制表软件(Excel)和几乎所有的统计软件包(SAS、SPSS、SYSTAT、STATISTICA)都能够生成交叉分组表。9/6/202298Excel的应用9/6/202299 9/6/20221009/6/2022101(五)用EXCEL计算描述统计量用EXCEL计算平均数、标准差等描述性统计量有两种方法,一是用函数,二是用“数据分析”工具。第一次使用“数据分析”时,需在EXCEL工具菜单中选“加载宏”,选“分析工具库”。这样在“工具”菜单中就会出现“数据分析”。9/6/2022102打开

34、“4数据描述.xls”工作簿,选择“网上冲浪”工作表。打开“工具”菜单,选择“数据分析”选项,打开数据分析对话框如图所示。9/6/2022103双击“描述统计”项或先单击此项再选择“确定”按钮,描述统计对话框打开如图所示。在“输入区域”中输入A1:A21。9/6/2022104由于所选数据范围包括一个标志名称,单击“标志位于第一行”选项边上的复选框。单击“输出区域”项,旁边出现了一个输入框,单击此框出现插入符,单击C1,在输入框中出现输出地址“$B$1”,这是输出结果的左上角起始位置。单击“汇总统计”,如不选此项,则Excel省略部分输出结果。9/6/2022105单击“确定”按钮,将产生输出

35、结果,如下图所示。9/6/2022106在上表中:平均算术平均数标准误差估计标准误差,在抽样调查一章会讲到中值中位数模式众数标准偏差样本标准差s,分母除以n-1样本方差s平方峰值反映钟形分布峰高的一个指标偏斜度反映偏斜程度的一个指标区域全距,等于最大值减最小值计数单位数9/6/2022107习题一按月工资分组(元)职工人数(人)60703708098090590 1002要求:计算平均数、众数、中位数9/6/2022108习题二.某商店售货员的工资资料如下:工资额(元)售货员人数(人)37544303510759036903要求:计算全距、平均差、标准差9/6/2022109第四节 解析性统计

36、分析假设检验方差分析相关分析回归分析 9/6/2022110一、相关分析一、相关分析(一)、相关分析的概念(二)、简单线性相关分析9/6/2022111(一)、相关分析的概念现实世界中现象之间存在着两种关系,现实世界中现象之间存在着两种关系,市场调研活动也是一样。市场调研活动也是一样。1 1、函数关系、函数关系 两个变量的关系是确定的,可以两个变量的关系是确定的,可以用一个数学表达式表示出来。用一个数学表达式表示出来。例:圆的面积与半径的关系例:圆的面积与半径的关系 S=R S=R2 2 L=RL=R9/6/20221122 2、相关关系、相关关系两个变量的关系确实存在,但关系两个变量的关系确

37、实存在,但关系数值是不固定的相互依存关系。数值是不固定的相互依存关系。例:市场份额与广告支出的关系、例:市场份额与广告支出的关系、顾客对品牌的态度与价格敏感度的顾客对品牌的态度与价格敏感度的关系。关系。9/6/2022113函数关系是变量之间的一种完全确立性函数关系是变量之间的一种完全确立性的关系。即某一变量发生变化,另一变的关系。即某一变量发生变化,另一变量就有一个确定值与之相对应;相关关量就有一个确定值与之相对应;相关关系一般是不完全确定的关系,即对自变系一般是不完全确定的关系,即对自变量的一个值,与之对应的因变量值不是量的一个值,与之对应的因变量值不是唯一的。唯一的。9/6/202211

38、43 3、相关分析的类型、相关分析的类型(1)根据自变量的多少划分根据自变量的多少划分单相关:只有一个自变量。单相关:只有一个自变量。复相关:有两个及两个以上的变量。复相关:有两个及两个以上的变量。9/6/2022115(2)根据相关的形式不同划分根据相关的形式不同划分 线性相关(直线相关):当一个变量变动时,线性相关(直线相关):当一个变量变动时,另一个变量也相应发生大致均等的变动。另一个变量也相应发生大致均等的变动。非线性相关(曲线相关):当一个变量变动非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变动,但这种变时,另一个变量也相应发生变动,但这种变动是不均等的。动是不均等

39、的。9/6/2022116(3)根据相关关系的方向划分根据相关关系的方向划分 正相关:两个变量之间的变化方向一致,都是增正相关:两个变量之间的变化方向一致,都是增长趋势或下降趋势。长趋势或下降趋势。负相关:两个变量变化趋势相反,一个下降而另负相关:两个变量变化趋势相反,一个下降而另一个上升,或一个上升而另一个下降。一个上升,或一个上升而另一个下降。9/6/2022117(二)、简单线性相关分析 1、散点图和相关表 2、相关系数的测定与应用 3、相关系数的密切程度 9/6/20221181、散点图和相关表例例 近年来国家教育部决定将各高校的后近年来国家教育部决定将各高校的后勤社会化。某从事饮食业

40、的企业家认为勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资资料,并想根据高校的数据决策其投资规模。规模。9/6/2022119操作过程:操作过程:打开打开“8简单线性回归简单线性回归.xls”工作簿,选择工作簿,选择“饭店饭店”工作表,如下图所示,该表为相关表。工作表,如下图所示,该表为相关表。9/6/2022120从从“插入插入”菜单中选择菜单中选择“图表图表”选项,打开选项,打开“图表向导图表向导”对话框如下图所示。在对话框如下图所示

41、。在“图表图表类型类型”列表中选择列表中选择XY散点图,单击散点图,单击“下一步下一步”按钮。按钮。9/6/2022121在数据区域中输入在数据区域中输入B2:C11,选择,选择“系列产生系列产生在在列列”,如下图所示,单击,如下图所示,单击“下一步下一步”按按钮。钮。上一页下一页返回本节首页9/6/2022122打开打开“图例图例”页面,取消图例,省略标题,如页面,取消图例,省略标题,如下图所示。下图所示。9/6/2022123单击单击“完成完成”按钮,便得到按钮,便得到XY散点图如下图散点图如下图所示。所示。0501001502002500510152025309/6/20221242、相

42、关系数的测定与应用yyxxnnyxxynyyixxiyyxxrii2222229/6/2022125相关系数的计算有两种方法:用计算器计算例 序号xy11.262228633.18043.81105511566.113277.2135881606.4544,880,10421454.207,4.36,822xyyxnyx9697.0104214854.20788804.366.454488804.36222222yyxxnnyxxynr9/6/2022126用计算机计算选取“工具”-“数据分析”选“相关系数”选“确定”输入“输入区域”输入“输出区域”在“分组方式”中选“逐列”选“标志位于第一行

43、”确定出现结果如下:xyx1.0000y0.96971.00009/6/20221273、相关系数的密切程度 相关系数的范围在-1到1之间,即-1r1,当r=1为完全正相关,r=-1,为完全负相关,r=0为不相关。r的范围在0.3-0.5是低度相关;r的范围在0.5-0.8是显著相关;r的范围在0.8以上是高度相关.9/6/2022128二、回归分析(一)、回归分析的概念(二)、直线回归(三)、曲线回归 9/6/2022129(一)、回归分析的概念 回归分析就是对具有相关关系的变量之间的数量关系进行测定,确定一个相应的数学表达式,其中一个是因变量,其余均为自变量。9/6/2022130(二)、

44、直线回归简单直线回归分析的特点在两个变量之间,必须确定哪个是自变量,哪个是因变量回归方程的主要作用是用自变量来推算因变量。例如:奢侈品的消费是否直接用消费者收入来解释9/6/2022131简单直线回归方程的确定设y为实际值,yc为估计值,现在要用一条直线 拟合实际值,而且要满足bxayc0yyc为最小。yyc29/6/2022132n由最小平方原理,可得:xbyanxyyxnbxx 229/6/2022133练习练习1 1 相关与回归分析相关与回归分析表 7-1 年销售额及平均每天车流量数据年销售额及平均每天车流量数据 商店编号(商店编号(I)平均每天车流量平均每天车流量/千辆(千辆(Xi)年

45、销售额年销售额/千美元(千美元(Yi)1 62 1121s 2 35 766 3 36 701 4 72 1304 5 41 832 6 39 782 7 49 977 8 25 503 9 41 773 10 39 839 11 35 893 12 27 588 13 55 957 14 38 703 15 24 497 16 28 657 17 53 1209 18 55 997 19 33 844 20 29 883 9/6/2022134练习练习1 1 相关与回归分析相关与回归分析在确定了20个店后,该公司在长达一个月的时间内,每天都到每个地点做车流量的纪录,而且通过自己的内部记录获得

46、了这20家店前12个月的全部销售数据。见表7-1所示。图7-1显示了数据的散点分布。显而易见,年销售量随日均车流量的增多而升高。现在的问题是,如何用明确的定量的方式把这种特性表示出来。9/6/2022135练习练习1 1 相关与回归分析相关与回归分析9/6/2022136练习练习1 1 相关与回归分析相关与回归分析最小二乘法最小二乘法 最小二乘法估计法是最能体现两变量 X 和 Y 之间关系的浅显易懂的数学方法。在散点图中,没有任何一条直线能完美的表示每个观察结果。这表现为实际结果(散点分布)和预测结果(线所表示的值)之间不完全相符。任何一条散点图上的是和直线都会有客观存在的误差。能够基本反映观

47、察结果的直线可以画出许多条来。9/6/2022137练习练习1 1 相关与回归分析相关与回归分析 最小二乘估计的结果是一条比其他线更能体现观察结果的直线。换句话说,这条线上的离差平方和比可用于观察结果的任意其它直线的离差平方和都小。这条线的简单方程为 Y=a+bX。回归分析的估计方程是 Ya b Xe 9/6/2022138练习练习1 1 相关与回归分析相关与回归分析式中 Y因变量即年销售额的估计值,千美元;a估计值 y 在回归直线上的截距;b回归直线的估计斜率;X自变量,即日均车流量;e误差,即实际值和估计值之间的差额。9/6/2022139练习练习1 1 相关与回归分析相关与回归分析 ba

48、和的值可计算如下:22)(XnXYXnYXbiii aYb X 式中 XX 的平均数;YY 的平均数;n 样本容量例子中组数。9/6/2022140练习练习1 1 相关与回归分析相关与回归分析表 7-2 最小二乘估计参数的计算表 商店 X Y X2 Y2 XY 1 62 1121 3844 1256641 69502 2 35 766 1225 586756 26810 3 36 701 1296 491401 25236 4 72 1304 5184 1700416 93888 5 41 832 1681 692224 34112 6 39 782 1521 611524 30498 7 4

49、9 977 2401 954529 47873 8 25 503 625 253009 12575 9 41 773 1681 597529 31693 10 39 839 1521 703921 32721 11 35 893 1225 797449 31255 12 27 588 729 345744 15876 13 55 957 3025 915849 52635 14 38 703 1444 494209 26714 15 24 497 576 247009 11928 16 28 657 784 431649 18396 17 53 1209 2809 1461681 64077

50、18 55 997 3025 994009 54835 19 33 844 1089 712336 27852 20 29 883 841 779689 25607 合计 816 16826 36526 15027574 734083 平均 40.8 841.3 9/6/2022141练习练习1 1 相关与回归分析相关与回归分析用表 7-2 中的数据可得出 b,计算公式如下:72.14)8.40(2036526)3.841)(8.40(207340832b a值计算如下:86.240)8.40(72.143.841XbYa 9/6/2022142练习练习1 1 相关与回归分析相关与回归分析 因

51、此,回归估计方程得出:240.86 14.72Ya b XX 其中,Y是相对给定 X 值的回归估计的数值。根据估计的回归方程,车流量(X)每增加 1000 辆车,年销售额将增加 14.7 美元(b 的估计值),a 值是 240.86。在技术上,a是自变量为 0 时因变量(Y)的估计值。9/6/2022143练习练习1 1 相关与回归分析相关与回归分析回归线 表 7-2 中显示了根据ba和计算的 Y 的预测值。此外,还显示了每一观察值的误差)(YY。基于Y值得出的回归线如图 7-2 所示。9/6/2022144练习练习1 1 相关与回归分析相关与回归分析图7-2 最小平方回归拟合样本资料0200

52、40060080010001200140001020304050607080车流量(以千计的平均每天车流量)销售额(千美元)9/6/2022145序号产品产量(千吨)x生产费用(万元)y11.262228633.18043.81105511566.113277.213588160生产费用与产量散点图0501001502000246810生产费用(万元)y例29/6/2022146用计算器算得:110,55.4,6.4544,880,10421454.207,4.36,822yxxyyxnyx31.5155.49.121109.124.3654.20788804.366.45448222xbya

53、nyxxynbxx故直线方程为yc=51.31+12.9x9/6/2022147例:某厂商品销售量和商品价格如下表所示 q=a+bp 那么商品销售量q(百件)商品价格p(元)pqP23382646432.59292.581261128612127123241442512.5312.5156.2523.513305.5169211429419616.5162642561717255289合计 219.5112.52597.51476.2551.5095.11209.295.21909.25.11225.147695.1125.2195.25979222npbnqappnqppqnb9/6/202

54、2148预测商品价格为20元时的销售量qc=50.51-2.09pq20=50.51-2.0920=8.71(百件)9/6/2022149先作图表,然后添加趋势线。先作图表,然后添加趋势线。用鼠标激活散点图,把鼠标放在任一数据用鼠标激活散点图,把鼠标放在任一数据点上,单击鼠标右键,打开菜单,在菜单栏里选点上,单击鼠标右键,打开菜单,在菜单栏里选择择“添加趋势线添加趋势线”选项。选项。图1生产费用与产量散点图0501001502000246810生产费用(万元)y9/6/2022150图29/6/2022151打开打开“类型类型”页面,选择页面,选择“线性线性”选项,选项,Excel将显示一条拟

55、合数据点的直线。将显示一条拟合数据点的直线。打开打开“选项选项”页面如下图所示,在对话框下部页面如下图所示,在对话框下部选择选择“显示公式显示公式”和和“显示显示R平方根平方根”选项,选项,单击单击“确定确定”按钮,便得到回归图如下图所示。按钮,便得到回归图如下图所示。生产费用与产量散点图y=12.896x+51.323R2=0.94030501001502000246810生产费用(万元)y线性(生 产 费用(万元)y)9/6/2022152多元线性回归回归方程为xbxbyac2211要估计参数a、b1、b2手工计算较繁,可以用EXCEL数据分析功能完成。9/6/2022153年份玻璃销售额

56、(万元)y汽车产量(万辆)x1建筑业产值(千万元)x212803.9099.432281.55.11910.363337.56.66614.54404.55.33815.755402.14.32116.7864526.11717.447431.75.55919.778582.37.9223.769596.65.81631.6110620.86.11332.1711513.64.25835.0912606.95.59136.42136296.67536.5814602.75.54337.1415656.76.93341.316778.57.63845.6217877.67.75247.38合计9

57、054101.268471.1例 某地区玻璃销售量与汽车产量、建筑业产值资料如左,试建立回归模型。9/6/2022154操作过程打开“8 回归.xls”工作簿,选择“玻璃”工作表。在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框如下图所示。9/6/2022155在“分析工具”列表中选择“回归”选项,单击“确定”按钮,打开“回归”对话框如下图所示。9/6/2022156在Y值输入区域中输入B1:B19。在X值输入区域中输入C1:D19。选择“标志”,置信度选择95%。在“输出选项”中选择“输出区域”,在其右边的位置输入“E1”,单击“确定”按钮。输出结果如下图所示。9/6/20221

58、57回归统计Multiple R0.9730544R Square0.9468349Adjusted R Square0.9392399标准误差41.078969观测值17方差分析dfSSMSFSignificance F回归分析2 420740.67 210370.34 124.66526 1.201E-09残差14 23624.744 1687.4817总计16 444365.42Coefficients 标准误差t StatP-valueLower 95%Intercept19.164577 51.937666 0.3689919 0.7176544-92.23074汽车产量(万辆)x

59、135.677939 10.0442273.552084 0.0031877 14.135195建筑业产值(千万元)x 210.857925 0.9721583 11.168886 2.337E-08 8.77285139/6/2022158Excel的回归分析工具计算简便,但内容丰富,计算结果共分为三个模块:回归统计表 方差分析表回归参数 回归分析工具的输出解释9/6/2022159回归统计表包括以下几部分内容:Multiple R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。上节例中:R为0.9468,表示二者之间的关系是高度正相关。R Squar

60、e(复测定系数R2):用来说明用自变量解释因变量变差的程度,以测量同因变量y的拟合效果。上节例中:复测定系数为0.9731,表明用自变量可解释因变量变差的97.31%。.回归统计表9/6/2022160Adjusted R Square(调整复测定系数R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。9/6/202

61、2161观测值:是指用于估计回归方程的数据的观测值个数。方差分析表方差分析表的主要作用是通过F检验来判断回归模型的回归效果。回归参数表如上图所示,回归参数表是表中最后一个部分:9/6/2022162图中,回归参数如下:Intercept:截距0第二、三行:0(截距)和1(斜率)的各项指标。第二列:回归系数0(截距)和1(斜率)的值。第三列:回归系数的标准误差第四列:根据原假设Ho:0=1=0计算的样本 统计量t的值。第五列:各个回归系数的p值(双侧)第六列:0和195%的置信区间的上下限。9/6/2022163故直线方程为:yc=19.16+35.68x1+10.86x29/6/2022164

62、销售额销售额x 流通费率流通费率y1.51.5 7 74.5 4.84.5 4.87.57.5 3.6 3.610.510.5 3.1 3.113.513.5 2.7 2.716.516.5 2.5 2.519.519.5 2.4 2.422.522.5 2.3 2.325.525.5 2.2 2.2引例:有下列数据,试分析引例:有下列数据,试分析y与的与的x关系,关系,并预测当并预测当x=28时的时的y值。值。三、曲线回归9/6/2022165作散点图如下,作散点图如下,y与与x是曲线关系。是曲线关系。流通费率y02468051015202530流通费率y9/6/2022166在在“图表图表

63、”中选中选“添加趋势线添加趋势线”选曲线类型选曲线类型在在“选项选项”中选中选“显示公式显示公式”和和“显示显示R平方值平方值”确定确定9/6/2022167经试验不同模型,曲线方程如下:经试验不同模型,曲线方程如下:线性线性:y=0.165x+5.6275 R2=0.7351对数对数 y=-1.713lnx+7.3979 R2=0.9733 二次函数二次函数y=0.0132x2-0.5225x+7.246 R2=0.9537幂函数幂函数y=8.5173x-0.4259 R2=0.9928指数函数指数函数y=5.6852e-0.0437x R2=0.8502幂函数效果最好。幂函数效果最好。9/

64、6/2022168 预测预测双击趋势线双击趋势线,打开打开“趋势线格式趋势线格式”,”,单击单击“选项选项”若预测若预测x=28x=28时时y y值值,在在“前推前推”中设置中设置2.52.5确定确定在图表中可以找到在图表中可以找到x=28x=28对应的对应的y y值值,约为约为2 2。9/6/2022169Thank you very much!9/6/20221709、静夜四无邻,荒居旧业贫。22.9.622.9.6Tuesday,September 06,202210、雨中黄叶树,灯下白头人。21:03:0921:03:0921:039/6/2022 9:03:09 PM11、以我独沈久

65、,愧君相见频。22.9.621:03:0921:03Sep-226-Sep-2212、故人江海别,几度隔山川。21:03:0921:03:0921:03Tuesday,September 06,202213、乍见翻疑梦,相悲各问年。22.9.622.9.621:03:0921:03:09September 6,202214、他乡生白发,旧国见青山。2022年9月6日星期二下午9时3分9秒21:03:0922.9.615、比不了得就不比,得不到的就不要。2022年9月下午9时3分22.9.621:03September 6,202216、行动出成果,工作出财富。2022年9月6日星期二21时03

66、分9秒21:03:096 September 202217、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。下午9时3分9秒下午9时3分21:03:0922.9.69、没有失败,只有暂时停止成功!。22.9.622.9.6Tuesday,September 06,202210、很多事情努力了未必有结果,但是不努力却什么改变也没有。21:03:0921:03:0921:039/6/2022 9:03:09 PM11、成功就是日复一日那一点点小小努力的积累。22.9.621:03:0921:03Sep-226-Sep-2212、世间成事,不求其绝对圆满,留一份不足,可得无限完美。21:03:0921:03:0921:03Tuesday,September 06,202213、不知香积寺,数里入云峰。22.9.622.9.621:03:0921:03:09September 6,202214、意志坚强的人能把世界放在手中像泥块一样任意揉捏。2022年9月6日星期二下午9时3分9秒21:03:0922.9.615、楚塞三湘接,荆门九派通。2022年9月下午9时3分22.9.6

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!