市场研究中的数据分析方法

上传人:仙*** 文档编号:31545687 上传时间:2021-10-12 格式:PPT 页数:52 大小:313KB
收藏 版权申诉 举报 下载
市场研究中的数据分析方法_第1页
第1页 / 共52页
市场研究中的数据分析方法_第2页
第2页 / 共52页
市场研究中的数据分析方法_第3页
第3页 / 共52页
资源描述:

《市场研究中的数据分析方法》由会员分享,可在线阅读,更多相关《市场研究中的数据分析方法(52页珍藏版)》请在装配图网上搜索。

1、市场研究的数据分析方法市场研究的数据分析方法第一节第一节 线性回归分析线性回归分析 一、线性回归方程的基本模型一、线性回归方程的基本模型 线性回归方程从样本资料出发,一般利用最小二乘法,根据回归直线与样本数据点在垂直方向上的偏离程度最低的原则,进行回归方程的参数的求解。 线性回归分析是考察变量之间的数量关系变化规律,它通过一定的数学表达式-回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的影响程度,为预测提供数学依据。1、一元线性回归模型、一元线性回归模型模型是: 式中:为被解释变量(因变量);为解释变量(自变量),是随机误差项,i为观测值下标,n为样本容量, 与 是待估参数,

2、称 为回归常数,为回归系数。ii10ixyyx01012、多元回归模型、多元回归模型 多元线性回归模型中自变量的个数在2个以上,模型的一般形式为: i=1,2n 其中, 为被解释变量(因变量), 为解释变量(自变量), 是随机误差项,i为观测值下标,n为样本容量, 为k+1个待估参数, 为回归常数, 称为回归系数。ikiki22i 110ix.xxyyk21x,.,x ,xk210,.,k21,.,0在应用线性回归模型时,必须满足以下假设:在应用线性回归模型时,必须满足以下假设: (1)解释变量 是确定性变量,而且解释变量之间不相关。 (2)随机误差项具有0均值和同方差。 (3)随机误差项在不

3、同样本点之间是独立的,不存在序列相关。 (4)随机误差限于解释变量之间不相关。 (5)随机误差项服从0均值和同方差的正态分布。k21x,.,x ,x二、线性回归方程的统计检验二、线性回归方程的统计检验 1、回归方程拟合优度检验 2、回归方程的显著性检验 3、回归系数显着性检验 三、回归分析假设条件的检验三、回归分析假设条件的检验 1、残差分析 2、多重共线性 3、误差项的序列相关 四、线性回归分析的基本步骤四、线性回归分析的基本步骤1、确定回归中的自变量和因变量。2、从收集到样本资料出发确定自变量和因变量之间的数学关系,即建立回归方程。3、对回归方程进行各种统计检验。4、利用回归方程进行预测。

4、 例:Checkers Pizza公司是休斯敦附近Westbury镇上仅有的从事比萨饼送货业务的两家公司之一,其直接竞争对手是欧文公司,提供相同的产品与服务。另外麦当劳也是它的一个重要竞争者。在过去的24个月中,该公司的销售量(Q)、价格(P),小镇上居民的人均收入(M),欧文公司产品的价格(P欧文)以及麦当劳产品的价格(P麦当劳)。假定下个月公司产品价格为9.05,人均收入为26614元,欧文公司产品的价格10.2元,麦当劳产品的价格为1.15元,请预测该公司下个月的销售量。五、实例分析五、实例分析 首先Checkers Pizza公司根据资料估计下面的线性需求方程的参数: 式中: Q比萨饼

5、的销量; P比萨饼的价格 M小镇居民的人均收入 P欧文欧文公司产品的价格 P麦当劳麦当劳产品的价格下面是SPSS11.0的输出结果:M Mo od de el l S Su um mm ma ar ry y.985a.970.96434.70896Model1RR SquareAdjusted RSquareStd. Error ofthe EstimatePredictors: (Constant), P麦当劳, P欧文, M, Pa. A AN NO OV VA Ab b736912.314184228.078152.923.000a22889.523191204.712759801.83

6、23RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), P麦当劳, P欧文, M, Pa. Dependent Variable: Qb. C Co oe ef ff fi ic ci ie en nt ts sa a-343.784414.076-.830.417-195.89511.041-1.037-17.743.0007.472E-02.010.4057.359.000174.40331.712.2325.500.00081.05722.166.1663.657.002(

7、Constant)PMP欧文P麦当劳Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: Qa. 从上面的输出结果可以看出,模型可以解释97%的比萨饼销售量的变化;模型整体非常显著,F统计的相伴概率值P=0.000;四个参数b、c、d、e非常显著,T统计的相伴概率值P都远小于0.01。 所以,回归方程为: 该公司下一个月比萨饼的销量为; 第二节第二节 判别分析判别分析 一、判别分析法的基本思想一、判别分析法的基本思想 判别分析包括以下两步: 1、分析和解释各

8、类指标之间存在的差异,并建立判别函数。 2、以第一步的分析结果为依据,将对那些未知分类属性的案例进行判别分类。二、判别分析基本模型与统计术语二、判别分析基本模型与统计术语 (一)假设条件1、每一个类别都取自一个多元正态总体的样本2、所有正态总体的协方差矩阵或相关矩阵都相等 (二)基本模型 1、先验概率 2、后验概率 3、判别系数4、结构系数 5、分组的矩心 6、判别力指数7、残余判别力 (三)统计术语(三)统计术语三、分析的基本步骤三、分析的基本步骤 判别分析一般都是通过现成的统计软件进行分析。一般而言,利用统计软件的判别分析具体包括以下步骤:确定研究确定研究的问题的问题获取判别分获取判别分析

9、的数据析的数据进行判别进行判别分析分析评价和解释评价和解释分析结果分析结果 某公司生产一新产品,该公司在新产品末大量上市以前,进行了一次市场调查。公司将新产品寄给十五个代理商,并附意见调查表,要求对该产品给予评估并说明是否愿意购买。评估的因素有:式样、包装及耐久性。评分用10分制,高分表示特性良好,低分则较差。其中有三位代理商没有表明自己的购买意愿。 那么这些代理商是属于“非购买组”还是“购买组”? 四、实例分析四、实例分析 以下是SPSS11.0的部分输出结果: S St ta an nd da ar rd di iz ze ed d C Ca an no on ni ic ca al l

10、D Di is sc cr ri im mi in na an nt tF Fu un nc ct ti io on n C Co oe ef ff fi ic ci ie en nt ts s.910.083.254式样包装耐久性1Function 表中,式样 、包装和耐用性的标准化系数分别为0.91、0.083、0.254。因而,式样是最重要的判别变量,其次是“耐用性”,最后是包装。C Ca as se ew wi is se e S St ta at ti is st ti ic cs s11.50011.000.4542.00017.8772.15511.4201.969.6512.0

11、317.548.67411.16411.0001.9352.00024.4522.87211.6481.991.2082.0099.5951.02411.9251.999.0092.00113.3131.57511.9691.998.0012.00212.3581.44211.3911.963.7362.0377.269.62322.6181.989.2491.0119.336-1.57522.7601.995.0941.00510.550-1.76722.1311.7212.2811.2794.177-.56322.57211.000.3191.00016.962-2.63822.08011

12、.0003.0641.00028.136-3.823ungrouped2.3871.962.7481.0387.230-1.208ungrouped1.6481.991.2082.0099.5951.024ungrouped2.7991.996.0651.00410.885-1.81811.66331.0001.5842.00018.18911.8003.9611.0062.0397.39811.17831.0004.9102.00031.80011.2473.9644.1422.03610.72412*.0003.97485.9341.02693.19411.8623.996.7482.00

13、411.65511.6463.9451.6602.0557.36222.9343.984.4281.0168.69822.0623.9467.3201.05413.04221*.09131.0006.4572.00021.79022.57431.0001.9941.00017.42822.02731.0009.2081.00045.539Case Number123456789101112131415123456789101112OriginalCross-validatedaActual GroupPredictedGrouppdfP(Dd | G=g)P(G=g | D=d)Squared

14、MahalanobisDistance toCentroidHighest GroupGroupP(G=g | D=d)SquaredMahalanobisDistance toCentroidSecond Highest GroupFunction 1DiscriminantScoresFor the original data, squared Mahalanobis distance is based on canonical functions.For the cross-validated data, squared Mahalanobis distance is based on

15、observations.Misclassified case*. Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than thatcase.a. 表中最大概率组一栏是判别分析得出的组别。13、15号代理商属于“非购买组”,14号代理商属于“购买组”。 第三节第三节 聚类分析聚类分析一、聚类分析的基本思想一、聚类分析的基本思想 聚类分析

16、(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。 样品聚类是对事件进行聚类,或是说对观测量进行聚类,是对反映被观测对象的特征的变量值进行分类。 变量聚类则是当反映事物特点的变量很多时,根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。二、距离与相似系数二、距离与相似系数 (一)常用的距离指标有 1、欧式距离 2、欧式距离的平方 3、曼哈顿距离 4、切比雪夫距离 (二)常用的相似系数指标主要有 1、余弦系数 2、皮尔逊相关系数 (三)定类数据的距离 1、卡方距离 2、法方距离 三、聚类方法三、聚类方法 1层次聚类法 2迭代聚类法 四、聚类分析的主要步骤四、聚类

17、分析的主要步骤 确定研究的问题计算相似性聚类聚类结果的解释和证实 某家具公司为了对市场进行的细分,对购买家具的顾客进行了一次市场调查。这次调查的指标有:喜爱的款式(老式为1,新式为2),图案(素式为1,格字为2,花纹为3);颜色(蓝色为1,黄色为2,红色为3,绿色为4)。调查样本为30人。 五、实例分析:五、实例分析:顾客式样图案颜色12 3 456 789101112131415161718192021222324252627282930112 212121212121121221212212121 3 2 3 3 1 2 1 3 2 1 3 2 3 1 2 2 3 2 1 3 2 3 2

18、3 1 3 1 1 3 21 24323241143224324143432142243 根据聚类结果,这30名顾客分为3类,可以较好的反映这些顾客对家具的偏好类型: 第一类: 1,9,13,17,24 第二类:2,3,4,5, 6,7,8,11,12,15,16,18,20,21,22,23,26,28,29,30 第三类: 10,14,19,25,27 第四节第四节 因子分析因子分析一、因子分析的基本思想一、因子分析的基本思想 因子分析是一项多元统计分析技术,其主要目的就是简化数据。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示基本的数据结果。这

19、些假设变量是不可观测的,通常称为因子。它们反映了原来众多的观测变量所代表的主要信息,并能解释这些观测变量之间的相互依存关系。 二、因子分析的数学模型和相关统计量二、因子分析的数学模型和相关统计量 (一) 数学模型 (二)相关统计量 1、因子载荷 2、共同度 3、因子的贡献 4、巴特利特球体检验 5、KMO指数 三、因子分析的基本步骤三、因子分析的基本步骤1、确定研究变量。2、计算所有变量的相关矩阵。3、构造因子变量。4、因子旋转。5、计算因子得分。四、实例分析四、实例分析 某公司为了了解消费者对牛肉、色、羊肉、猪肉及鸡等五种肉类食物的偏好倾向,进行了一次市场调查。请10位消费者对这五种肉类进行

20、评分。评分采用十分制,分数越高表示越喜欢。调查结果列于下表。试用因子分析方法研究影响消费者选择食物的因素。 R Ro ot ta at te ed d C Co om mp po on ne en nt t M Ma at tr ri ix xa a.791 .736-.393-.649-.211-.184.761.127.715鸡鱼牛肉猪肉羊肉12ComponentExtraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.Rotation conver

21、ged in 3 iterations.a. 上表是SPSS11.0输出的旋转后的因子载荷矩阵。我们可以依此推断两个公共因子的含义。从表中的数据来看,鸡、鱼、牛肉在第一公共因子的因子载荷值较高,而在第二公共因子的因子载荷值较低,故第一公共因子反映鸡、鱼、牛肉的公共特性。第一公共因子可能代表脂肪少。而羊肉、猪肉在第二公共因子的因子载荷值较高,在第一公共因子的因子载荷值较低,这说明第二公共因子反映羊肉、猪肉的公共特性,第二公共因子可能代表价格。因而我们可以认为脂肪和价格是决定消费者肉类消费的主要因素。第五节第五节 对应分析对应分析 一、对应分析的基本思想一、对应分析的基本思想 对应分析,又称为相应

22、分析,是在R型和Q型因子分析基础上,发展起来的一种多元相依的变量统计分析技术。它通过分析由定性变量构成的交互汇总表来揭示变量间的关系。当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时,使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。 二、有关统计术语与资料格式二、有关统计术语与资料格式(一)统计术语 1、列联表 2、主成分 3、惯量和特征值 4、卡方、似然比卡方、曼图汉斯泽鲁卡方、法系数、列联系数(二) 数据格式三、分析的步骤三、分析的步骤 1、 确定研究的内容 2、 获取分析资料 3、 对列联表作对应分析 4、 解释结果意义 5、 评价分

23、析结果四、实例分析四、实例分析 某公司进行一次市场调查,得到轿车特征于一些用户特征的数据。如有: 轿车大小(大、中、小)、轿车类型(家用型、跑车、商用车)、 收入(一份收入、双份收入)、状态(已婚、已婚有孩子、未婚、未婚有孩子)、房子(租房、买房)等数据。现请分析它们之间的联系。Dimension 11.51.0.50.0-.5-1.0Dimension 22.01.51.0.50.0-.5-1.0-1.5NHOMENMARITNINCOMENTYPENSIZE租房买房未婚有孩子未婚已婚有孩子已婚双份收入一份收入商用车跑车家用车大型中型小型 1、已婚有孩子、家用车和中型车相关性较大。 2、已婚

24、和双份收入有联系,已婚、已婚有孩子和买房也有一定的联系。 3、未婚、一份收入和租房之间关系紧密。 4、跑车与小型车之间也有关系。从对应图可以推断出下面一些结论:从对应图可以推断出下面一些结论:,我们在进行市场细分、制定营销战略方面可以充分利用这些信息。例如:面向已婚家庭应重点推销中型家用车。而那些未婚、一份收入、租房的消费者,因其经济条件方面的原因,他们难以成为轿车消费的目标顾客群。另外现没有适合双份收入、已婚的消费者的车型,应考虑开发新车型满足他们的需求。第六节第六节 多维偏好分析多维偏好分析一、主成分分析法简介一、主成分分析法简介 (一)主成分分析的基本思想 主成分分析法就是将原来众多具有

25、一定相关性的指标(如p个指标),重新组合成一组新的相互无关的综合指标来代替原来的指标。 (二)主成分分析的数学模型 (三)主要统计术语 1、偏好评分 2、特征值或惯量二、分析的基本步骤二、分析的基本步骤 1、确定研究的问题 2、资料的收集 3、主成分分析 4、偏好图并解释结果意义 三、实例分析三、实例分析 某心理学期刊作了一项市场调查,以了解自己刊物与现有的其它心理学刊物的相对定位。他们挑选10种心理学刊物,请39个专业心理学家根据他们对这些刊物的偏好按1-10的量表评分,其中“1”代表低评价,“10”代表高评价。 利用SPSS Categories PRINCALS过程的“非线性”主成分分析

26、方法对上表的资料进行分析,部分结果如下: 这些刊物表现为以下分组:1)一个“硬”组,包括JEXP,PMET,MVBR,JAPP,或许BULL 2)一个“发展”组,包括JEDP,HUDE 2、成份加载图表: 箭头指向相同的心理学家的偏好相似。如,图形左上方的“D”组的发展和教育心理学家偏好教育心理学杂志和人类发展两种期刊。其它组心理学家的偏好也很明显,都集中指向其研究方向的期刊。 3、双图: 4、模型总结 最后结果说明,总的拟合情况好:二维顺序方案占总方差的大约82%。 第七节第七节 多维尺度法多维尺度法 一、多维尺度法的基本介绍一、多维尺度法的基本介绍 具体主要包括两步: (1)初步图形结构的

27、构造。 (2)初步图形结构的修改。二、统计术语与数据格式二、统计术语与数据格式 (一)统计术语 1、接近程度 2、空间图 3、克鲁斯卡系数 4、残差 (二)数据格式 多维尺度法输入的数据是表示待比较事物之间相似程度的矩阵。 三、分析的基本步骤三、分析的基本步骤 1、确定研究的问题。 2、获取资料。 3、作多维尺度分析。 4、作空间图并解释结果意义。 5、评价分析结果。 四、实例分析:四、实例分析: 在某次市场研究中,研究者调查了10位消费者,要求他们对A、B、C、D、E等五种品牌的相似性进行评分。消费者利用李克量表分别对AB 、AC、 AD、AE、 BC、 BD BE 、CD、 CE 、DE中

28、的每一对评分。其中一位消费者的评分结果为:AB=2 、AC=1、 AD=4、AE=5 BC=6、 BD=8 、BE=6 CD=3,CE=7, DE=5,从而可以得到一个相似性比较矩阵。请就此进行多维尺度分析。 将表的相似矩阵输入,利用SPSS11.0进行计算,可得到如下的概念空间图: Derived Stimulus ConfigurationEuclidean distance modelDimension 13210-1-2Dimension 21.0.50.0-.5-1.0-1.5edcba 从该空间图可以看出,D和E相对接近。在第一维度方向,A、B、C、D、E几个品牌的差异较为明显。

29、第八节第八节 联合分析联合分析 一、联合分析的基本概念与功能一、联合分析的基本概念与功能 联合分析方法的基本思想是,通过提供给消费者以不同的属性组合形成的产品,请消费者做出心理判断,按其意愿程度给产品组合打分、排序,然后采用数理分析方法对每个属性水平赋值,使评价结果与消费者的给分尽量保持一致,来分析研究消费的选择行为。二、联合分析的模型和有关统计术语二、联合分析的模型和有关统计术语 (一) 联合分析的基本模型 (二)统计术语 1、分值函数 2、属性和水平 3、相对重要性权数 4、全轮廓 5、配对表 6、实验设计 7、内部有效性 8、最大效用模型 三、联合分析的基本步骤三、联合分析的基本步骤 1、确定研究对象 2、确定属性及水平 3、实验设计 4、资料的收集 5、计算属性的分值 6、评价分析的结果 7、解释结果 8、模拟市场占有率

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!