运用spss对各地区的废气排放进行因子分析

上传人:z**** 文档编号:126214787 上传时间:2022-07-28 格式:DOC 页数:14 大小:320.50KB
收藏 版权申诉 举报 下载
运用spss对各地区的废气排放进行因子分析_第1页
第1页 / 共14页
运用spss对各地区的废气排放进行因子分析_第2页
第2页 / 共14页
运用spss对各地区的废气排放进行因子分析_第3页
第3页 / 共14页
资源描述:

《运用spss对各地区的废气排放进行因子分析》由会员分享,可在线阅读,更多相关《运用spss对各地区的废气排放进行因子分析(14页珍藏版)》请在装配图网上搜索。

1、摘要多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。近30年来,随着计算机应用技术的发展和科研生产的迫切需要。多元统计分析技术被广泛地应用于地质、气象、水文等许多领域,已经成为解决实际问题的有效方法。因子分析模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系;因此,因子分析的出发点是原始变量的相关剧增。因子分析的思想始于1904年查尔斯斯皮尔曼对学生考试成绩的研究。近年来,随着电子计算机的高速发展,人们将因

2、子分析的理论成功地应用于心理学、医院、气象、地质、经济学等各个领域,也使得因子分析的理论和方法更加丰富。本文利用2014年中国统计年鉴的统计数据资料,在研究城市废气排放的现状及主要问题的基础上,运用因子分析方法分析了影响城市废气排放的主要因素,通过SPSS的操作,得出它的成分矩阵,方差贡献度提取公共因子最后计算它的各因子得分和综合因子得分,然后就是对变量数据进行分析,得出一些结论提出控排,合排和净化的对策建议。1设计目的12设计问题13设计原理24操作步骤25结果分析35.1主成分分析法36设计总结10致谢11参考文献12全国各重要城市废气排放的因子分析1设计目的学会应用SPSS软件进行相关的

3、因子分析,同时更好的了解应用多元统计分析的知识,熟练掌握应用多元统计分析在实际问题上的应用,并将所学的知识结合SPSS对数据的处理解决实际问题。本设计是利用因子分析理论作分析,并用SPSS软件进行求解2设计问题X1表示二氧化硫年平均浓度;X2表示二氧化氮年平均浓度;X3表示可吸入颗粒数X4表示一氧化碳日均值第95百分位浓度;X5臭氧日最大8小时第九十百分位浓度;X6细颗粒物年均浓度;X7空气质量好于二级的天数。现在利用因子分析对全国各重要城市废气排放进行分析?各个重要城市的废气排放表2.1:表21各个重要城市废气排放地区X1X2X3X4X5X6X7北京26561083.418889167天津5

4、9541503.715196145石家庄105683055.717315449太原80431573.414881162呼和浩特56401464.110457213沈阳90431293.213978215长春44441302.112773230哈尔滨44561192.27281239上海2448841.615862246南京37551372.113878198杭州28531061.915570212宁波2244861.713754277温州2351941.914758252嘉兴3047942.117368214湖州29521111.818074192绍兴38491051.913371240金华3

5、441991.916470195衢州3637941.413468248舟山1022581.112233319台州1734821.815453266丽水1932691.214349297合肥22391151.810188180福州1143641.27336343厦门2044621.213636336南昌40401161.812269230济南95611993.119011079青岛5843106211567259五十一个变量取前二十七个变量数据来源:2014年中国统计年鉴现在利用因子分析对全国各重要城市废气排放进行分析,看它们的排放与城市的有何关系?3设计原理1确定因子载荷:主成分法、主轴因子法

6、、最小二乘法、极大似然法、a因子提取法等。由于这些方法求解因子载荷的出发点不同,所得的结果也不完全相同2因子旋转:因子旋转分为正交旋转与斜交旋转,正交旋转由初始载荷矩阵A左乘一正交阵而得到。经过正交旋转而得到的新的公因子仍然保持彼此独立的性质。而斜交旋转则放弃了因子之间彼此独立这个限制,因而可能达到更为简洁的形式,其实际意义也更容易解释。但不论是正交旋转还是斜交旋转,都应当使新的因子载荷系数要么尽可能地接近与零,要么尽可能地远离零。3因子得分:因子得分就是公共因子在每一个样品点上的得分。根据因子得分我们可以知道哪个城市的废气较多,哪个城市的废气较少。根据因子得分排名可以得到排名较前的地区有什么

7、特征。4操作步骤(1) 将数据输入SPSS后,在SPSS窗口选择分析描述统计描述,然后将变量选入变量框,在选项点击均值在离散中最大值最小值和标准差,在显示顺序点击变量列表。(2) 将数据输入SPSS后,在SPSS窗口选择分析f降维f因子分析f将数据选入变量框中。(3)点击描述按钮,展开相应对话框,选择统计量中的单变量描述性,相关矩阵中的系数及KMO和Bartlett的球形度检验和相关性水平。单击继续按钮,返回主界面。(4)点击抽取按钮,设置因子提取的选项,在方法下拉菜单栏里选择主成分法,在分析框中选相关性矩阵,未旋转的因子解,碎石图抽取中基于特征值大于1,最后,选最大因子迭代数为25次,单击继

8、续按钮,返回主界面。(5)点击旋转按钮,设置因子旋转方法,选择方差最大旋转,并选择输出中的旋转解,单击继续按钮,返回主界面。(6)点击得分按钮,设置因子得分的选项。选中保存为变量,方法为回归,将因子得分作为新变量保存在数据文件中。选中显示因子得分系数矩阵按钮,这样在结果输出窗口中会给出因子得分系数矩阵。单击继续按钮,返回主界面。(7)点击选项按钮,在出来的界面缺失值中选均值替代,系数排序选择按大小排序,单击继续按钮,返回主界面。(8)最后,在主界面上点击确定,输出结果5结果分析51主成分分析法利用SPSS得到表5.1表5.1描述统计量N极小值极大值均值标准差X151710535.3122.24

9、6x251176844.2010.692x35147305108.5145.990x451162.271.130x55172190137.9827.876x6512615466.2924.404x75149343233.4166.430有效的N(列表状态)51从描述统计量中可以看出数据都是比较有效的,因为所有的变量都没有缺失值,在最小值,最大值,均值和标准差都是有效数字,都是介于最大的数和最小的数。利用SPSS得到表5.2CorrelationMatrix原有变量的相关系数矩阵表5.2相关矩阵aX1x2x3x4x5x6x7相关x11.000.472.808.651.085.696-.700x2

10、.4721.000.635.563.305.764-.727x3.808.6351.000.819.066.897-.872x4.651.563.8191.000.010.737-.710x5.085.305.066.0101.000.222-.334x6.696.764.897.737.2221.000-.950x7-.700-.727-.872-.710-.334-.9501.000a.行列式=.001从相关系数矩阵得知:大部分的相关系数都比较高,例如XI和X3的相关系数比较高,也就是二氧化硫和可吸入颗粒的相关系数比较强,X3和X6的相关系数比较高,也就是可吸入颗粒和臭氧含量的相关系数比较

11、高等,例外从表中可以知道,前六个变量与第七个变量都成负相关,也很容易理解,毕竟空气质量的好坏和污染空气的排放不是正相关的,总的来说,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。利用SPSS得到表5.3表5.3KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量。Bartlett的球形度检验近似卡方dfSig.837353.67021.000KMO(Kaiser-Meyer-Olkin)检验统计量是用于比较变量间简单相关系数和偏相关系数的指标。主要应用于多元统计的因子分析KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相

12、关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析当所有变量间的简单相关系数平方和接近0时,KMO值接近O.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析由图可知:Bartlett的球形度检验的自由度21,sig值小于0.05,无限接近于0,说明原变量之间存在相关关系。同时,Kaiser-Meyer-Olkin为0.837,接近于1,根据KMO度量标准可知此数据适合做因子分析。利用SPSS得到表5.4表5.4公因子方差初始提取x11.000.700x21.000.686x31.000.935x41.000.771x5

13、1.000.921x61.000.918x71.000.916是因子分析的初始解,显示了所有数据变量的共同度数据。可以看到:X,X,X,X等变量的绝大部分信息(大于90%)可被因子解释,这些变量的信3567息丢失较少。但其余的三个变量的信息也都保存了60%以上的信息。因此,本次因子提取的总体效果是比较理想利用SPSS得到表5.5表5.5解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%14.74267.73967.7394.74267.73967.7394.55265.02465.02421.10415.77383.5121.10415

14、.77383.5121.29418.48883.5123.4906.99690.5084.3104.42294.9295.2473.53098.4596.069.98799.4467.039.554100.000提取方法:主成份分析。由方差解释表可知特征值九=4.472,九=1.104,相应的方差贡献的12百分比为:第一公共因子:67.739%,第二公共因子:15.773%,,取前两个公共因子时的累计贡献率已经达到83.512%,还差一点达到85%的要求,又满足特征值大于1的要求,所以取两个公共因子。同样,通过得到的图一图一另外,从碎石图来看由图可知:横坐标为因子分析数目,纵坐标为特征根。第一

15、个因子的特征根值很高,对解释原有变量的贡献最大;第2个以后的因子特征根值都很小,对解释原有变量的贡献很小,已经成为可被忽略的,因此提取2个因子是合适的。利用SPSS得到表5.6表5.6成份矩阵a成份12x6.957.033x7-.948-.134x3.946-.201x4.835-.270x1.809-.210x2.788.256x5.243.928可知,通过用提取方法为主成分分析法提取了两个成分,X1,X2,X3,X4,X6,X7变量在第一个因子的载荷值的绝对值都很高。即说明他们与第一个因子的相关程度高,而X5变量在第二个因子的载荷值也比较高,对原有变量的解释较为显著。根据表5.6可以写出每

16、个原始变量的因子表达式:fX1X2X3X4X5X6IX、7f0.8360.7080.9670.8750.0240.9240.892-0.020、0.4300.0210.7200.9590.2510.347丿从成分矩阵表中可以看出,每个因子在不同的原始变量上的载荷虽然有明显的差别,为了便于对因子进行命名,需要对因子载荷阵进行旋转,得到表5.7和成分图:表5.7旋转成份矩阵a成份12x3.967.021x6.924.251x7-.892-.347x4.875-.072x1.836-.020x2.708.430x5|.024|.959由表5.7可知,通过提取方法为主成分分析法,通过方差最大法对成分矩

17、阵进行正交旋转,在旋转在3次迭代后收敛,可以知道它在旋转后解释变量的能力虽然没有比较大的变化但对变量的解释还是比较好的。从旋转后的正交因子载荷阵得知:由于旋转后的因子载荷阵按照成份按照大小得分,而且同时它还具有两极分化的趋势,可以用趋向于1的变量来解释奢移因子,趋向于0的变量来解释低级因子第一公共因子上的高载荷的指标有XI、X2、X3、X4、X6、X7的载荷值分别为0.836,0.708,0.967,0.875,0.924,-0.892;第二公共因子上高载荷的指标有X5的因子载荷值为0.959。从旋转矩阵中可以看出虽然它具有两极分化的特点,但和原来的成分矩阵相比变化不大,为了避免数据变量的绝对

18、化,下面准备用斜交旋转对成分矩阵(即分析f降维一因子分析一点击旋转按钮,设置因子旋转方法,选择Promax,并选择输出中的旋转解,单击继续按钮,返回主界面。)得到表5.8表5.8模式矩阵a成份12x3.997-.132x6.919.113x4.915-.213x7-.872-.217x1.867-.153x2.670.331x5-.114.986提取方法:主成分分析法。旋转法:具有Kaiser标准化的倾斜旋转法。通过主成分分析法,并采用斜交旋转得到的模式矩阵虽然具有两极分化的特点,但和前面的方差最大法得到的成份旋转矩阵相差不大,都是去两个成份,且取法也一样,所以不认为通过方差最大法得到的成份旋

19、转矩阵绝对化,即得到旋转空间的成分图i2ft.XO3ll皿g沪iM笛忆-唱做光吟立3亍用二*1让BU匸T耳J俶谊%世M业万go-tillE4i甲旳球,愛中立榨啟1.rWASH:于H銀偲%说卄:抚h出用咦怡严总吁J-二tttnq理丸JiUIRC1IT4Trta.3.WC3C.F.Sjf忸化蚊11平呦帯九十兀百曲J蜩取.1*屯陀悔立打屮-ia-o!.a0as斗:qME曲1在图中可以直观的看出:二氧化碳浓度,二氧化氮浓度,细颗粒物,一氧化碳浓度基本在一起,虽然空气质量好于二级的天数不在一起,但也可以看出它跟成分1比跟成分二更有相关关系,可以命名为奢侈因子(地面排放污染因子);臭氧浓度单独在一起可以命

20、名为低级因子(人为破化污染因子).表5.9成份得分系数矩阵成份12X1.210-.147x2.109.264x3.236-.132x4.227-.198x5-.142.830x6.190.076x7-.167-.164根据表5.9中的因子得分系数和原始变量的标准化值可以计算每个观测值的各因子的得分数,并可以根据此对观测量进行进一步的分析。旋转后的因子得分表达式可以写成:F=0.210Xl+0.109X2+0.236X3+0.227X4-0.142X5+0.190X6+0.167X71综合得分:厂Fx65.024+Fx18.488F二T283.512得表5.10因子得分矩阵:地区F1得分F2得分

21、综合得分F北京0.3446173891.8799888850.682天津1.2097636850.4146493391.0257石家庄3.5624851010.7350696172.935太原1.127581351-0.140394740.8439呼和浩特0.865349745沈阳0.927599103长春0.272523033哈尔滨0.678581849-1.716564780.148上海-0.4958693170.907908839-0.325南京0.4172162030.3282438370.397杭州-0.0713015670.9088099110.146宁波-0.557780530.

22、072444798-0.148温州-0.3531604290.552605663-0.152嘉兴-0.2471573131.2716825770.089湖州-0.1128631741.6869937610.285绍兴0.0270185540.0259149990.02655金华-0.1757942190.9030015870.063衢州-0.319288247-0.13732458-0.271舟山-1.35084138台州-0.7738576280.382695391-0.517丽水-1.0154915790.046057299-0.775合肥0.251916932福州-0.863924844

23、厦门-1.0832773570.010837882-0.838南昌0.056456405济南1.8262210991.6830129281.793青岛0.193005286郑州1.873971451武汉0.4634701151.3409776170.6572长沙0.1721524290.1215997160.1606广州-0.6669843640.965357998-0.304深圳-1.008308351珠海-1.076315582佛山-0.5009579941.216116827-0.121江门-0.7090395270.557804229-0.428肇庆-0.5696626690.7800

24、17448-0.2705惠州-1.2592894490.145147581-0.9047东莞-0.9042072381.258361475-0.4249中山-0.9286964150.962764489-0.509南宁-0.536899254海口-1.529141816重庆-0.29476791成都0.800241549贵阳-0.496754384昆明-0.644131329拉萨-1.365269745西安1.615460435兰州0.440428707西宁0.829958829银川0.51616638乌鲁木齐1.438847982表5.10各因子得分和综合得分在两个公共因子上得分和综合得分就

25、可以对各城市的环境与废气排放作出评价了,污染气体(F1)而言,在天津、太原、南昌、乌鲁木齐、青岛上的得分比较高,这就是在污染气体的排放而言,总的来说,这几个城市的人口比较多,人均消费也比较高,它们远高于其他城市,虽然北京的人口多和人均消费都比较高,但它的得分也比较小,就F2来说,北京、温州、嘉兴、南昌、珠海、惠州、成都的臭氧含量远高于其他城市,其余城市的得分虽然不很突出,但数值也都不低,说明这些城市的废气排放也都没有怎么控制。将各城市在两个因子上的进行加权,就是综合得分,综合评分的前五是天津、石家庄、济南、郑州、西安,综合评分最低的是海口、舟山、惠州、厦门、拉萨,再结合前两个因子进行分析天津在

26、污染气体的排放上都得分均位于前列,而惠州等城市在F2因子也就是臭氧含量上的等分比较低。这种评价方法应用所以虽然普遍,但还是有一些文献有不同看法,因为主因子的特征向量的各级分量不一致,很难进行评价。因此,认为这种综合评价的方法不严谨。其实,我们认为这与其他统计方法一样,很多理论问题没有解决,但好像并不影响人们使用的热情,统计学应用中许多问题的完善需要人们去实践和探讨,这个问题也在其中。6设计总结通过这次课程设计,我知道了因子分析在解决实际问题中有很重要的意义,有些实际问题看起来很复杂麻烦,但通过因子以及SPSS软件的结合应用,就能很清楚的得到解决,给我们带来了很大的方便。我也更加熟悉了因子分析相关知识以及SPSS软件的应用,并能很好的运用到实际中去。致谢本论文是在秦俭老师的教导下完成的。在她的指导下,让我对多元统计分析知识以及SPSS操作有了一定的了解,让我学到了许多知识。在本次课设中,老师严格负责,使我认识到自己的许多不足之处。在此,我向秦老师致以诚挚的谢意和崇高的敬意。同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。我还要感谢我的论文中被我引用或参考的文献的作者。参考文献【1】方开泰,张尧庭多元统计分析。北京:科学出版社,1982年【2】何晓群,多元统计分析第四版。北京:中国人大出版社,2015年【3】百度文库spss因子分析教程

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!