spss第十一章主成分分析和因子分析
《spss第十一章主成分分析和因子分析》由会员分享,可在线阅读,更多相关《spss第十一章主成分分析和因子分析(25页珍藏版)》请在装配图网上搜索。
1、主 成 分 分 析 和 因 子 分 析 主要内容11.1 主 成 分 析12.2 因 子 分 析 11.1 主 成 分 析基本概念 主 成 分 分 析 ( Principal Component Analysis) 就 是 考 虑各 指 标 之 间 的 相 互 关 系 , 利 用 降 维 的 方 法 将 多 个 指 标 转 换 为 少数 几 个 互 不 相 关 的 指 标 , 从 而 使 进 一 步 研 究 变 得 简 单 的 一 种 统计 方 法 。 主 成 分 分 析 是 由 Hotelling于 1933年 首 先 提 出 的 , 是 利用 “ 降 维 ” 的 思 想 , 在 损 失 很
2、 少 信 息 的 前 提 下 把 多 个 指 标 转 化为 几 个 综 合 指 标 , 称 为 主 成 分 。 分 类 变 量 和 连 续 变 量 均 可 以 参与 两 步 聚 类 分 析 。 每 个 主 成 分 均 是 原 始 变 量 的 线 性 组 合 , 且 各 个 主 成 分 之 间互 不 相 关 , 这 就 使 得 主 成 分 比 原 始 变 量 具 有 某 些 更 优 越 的 性 能 。主 成 分 分 析 不 能 看 作 是 研 究 的 结 果 , 而 应 该 在 主 成 分 分 析 的 基础 上 继 续 采 用 其 他 多 元 统 计 方 法 来 解 决 实 际 问 题 。 11
3、.1 主 成 分 析统计原理 1 1 2 2i i i i pi py e x e x e x e x 第 i个 主 成 分 : 1 kk p iip 设 第 k个 主 成 分 的 方 差 占 总 方 差 的 比 例 为 , 则 有 :kp1 11 1 12 2 12 21 1 22 2 21 1 2 2 m mm mp p p pm my e x e x e xy e x e x e xy e x e x e x 主 成 分 的 计 算公 式 为 : 11.1 主 成 分 析分析步骤第 1步 原 始 数 据 的 标 准 化 处 理 ;第 2步 计 算 相 关 系 数 矩 阵 ; 第 3步 计
4、 算 特 征 值 及 单 位 特 征 向 量 ; 第 4步 计 算 主 成 分 的 方 差 贡 献 率 和 累 计 方 差 贡 献 率 ;第 5步 计 算 主 成 分 。 11.1 主 成 分 析SPSS实现举例【例11-1】为了从总体上反映世界经济全球化的状况,现选择了具有代表性的16个国家的数据,这些国家参与经济全球化程度指标值见下表。试对其进行主成分分析。 编 号 国 家 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x151 中 国 3.205 54.5 28.53 0.878 1.409 0.894 11.6 2.305 0.547 2
5、.932 4.818 9.003 2.7 3.914 1.4722 印 度 1.449 31.1 0.279 0.339 0.272 0.1 2.7 0.128 0.193 0.825 2.318 5.127 0.6 4 0.2183 日 本 14.079 52.3 0.653 10.254 11.769 1.097 0 1.967 1.3 6.178 14.746 27.297 30.9 57.734 15.1254 韩 国 1.318 136.3 1.011 1.6 0.42 1.838 1.3 0.77 0.78 2.267 23.32 42.875 9.1 12.129 0.4525
6、新 加 坡 0.275 739.5 3.572 27.841 0.884 13.314 28.6 0.622 0.143 1.885 169.772 319.907 54.2 917.328 0.7186 美 国 29.641 46.1 3.682 6.429 20.563 4.808 5.4 24.253 29.941 15.638 10.784 24.555 13.6 24.495 21.2747 加 拿 大 2.056 101.5 0.898 8.276 2.313 5.369 10.5 2.444 5.145 3.854 34.691 67.047 15.1 21.83 1.3628
7、巴 西 2.434 27.1 1.584 2.327 0.962 2.905 6.8 1.953 2.3 0.857 4.716 10.101 6.7 5.498 1.1049 墨 西 哥 1.567 151.4 1.657 2.837 0.797 1.471 10.9 0.67 0.212 2.186 18.485 37.986 4.5 4.887 0.46810 英 国 4.67 118.4 0.497 26.151 12.456 22.137 11.2 16.552 19.642 5.542 28.434 58.7 66.1 278.968 11.289 11 法 国 4.639 120
8、.6 1.84 9.242 4.492 10.848 8.5 8.282 5.841 5.21 28.46 54.052 29.2 56.453 8.88912 德 国 6.84 132.9 2.252 9.558 6.646 7.747 2.2 8.589 8.971 8.843 32.121 63.174 36 51.514 12.1813 意 大 利 3.792 104.5 0.321 8.153 3.724 1.059 2.5 0.77 1.913 4.032 22.869 43.924 27 17.776 5.67814 俄 罗 斯 1.3 58.6 1.533 1.499 0.55
9、2 0.499 2.5 0.31 0.298 0.987 7.77 12.581 1.1 2.001 0.46915 澳 大 利 亚 1.309 94.5 0.502 5.773 0.941 1.987 18.9 0.527 1.371 1.131 15.745 33.795 13.2 24.117 0.79716 新 西 兰 0.177 110.5 0.218 7.374 0.179 3.04 31.5 0.126 0.338 0.248 23.221 47.387 19.8 41.274 0.215 11.1 主 成 分 析第 1步 分 析 : 根 据 题 目 要 求 , 需 进 行 主
10、成 分 分 析 。第 2步 数 据 组 织 : 按 如 上 表 所 示 的 “ 指 标 ” 一 列 定 义 变 量 ,输 入 数 据 并 保 存 ;第 3步 主 成 分 分 析 的 设 置 , 主 要 如 下 两 图 所 示 。 11.1 主 成 分 析第 4步 因 子 分 析 的 结 果 ; u特 征 值 与 方 差 贡 献 表 Component Initial Eigenvalues Extraction Sums of Squared LoadingsTotal % of Variance Cumulative % Total % of Variance Cumulative %1 6
11、.049 40.325 40.325 6.049 40.325 40.3252 5.813 38.755 79.080 5.813 38.755 79.0803 1.142 7.616 86.696 1.142 7.616 86.6964 .876 5.842 92.5385 .599 3.996 96.5346 .326 2.174 98.7097 .119 .796 99.505 8 .041 .272 99.7769 .018 .121 99.89710 .010 .063 99.96111 .004 .027 99.98812 .001 .009 99.99713 .000 .002
12、99.99914 .000 .001 100.00015 4.080E-7 2.720E-6 100.000Extraction Method: Principal Component Analysis.从 表 中 可 以 看 出 前 3个 主 成 分 已 经 解 释 了 总 方 差 的 近 86.7%, 故可 以 选 择 前 3个 主 成 分 进 行 分 析 。 11.1 主 成 分 析 u主 成 分 的 碎 石 图 该 图 从 另 一 个 侧 面 说 明 了 取 前 三 个 主 成 分 为 宜 。 11.1 主 成 分 析 u旋 转 前 的 因 子 载 荷 矩 阵 Component1 2
13、 3x1 .407 .805 .268x2 .596 -.727 .209x3 -.147 .016 .821x4 .895 -.333 -.181x5 .614 .763 .028x6 .826 -.124 -.281x7 .273 -.627 .184x8 .636 .703 .041x9 .619 .703 .008 x10 .552 .766 .196x11 .654 -.691 .172x12 .666 -.685 .166x13 .863 -.191 -.297x14 .728 -.632 .144x15 .579 .760 .005Extraction Method: Princ
14、ipal Component Analysis.a. 3 components extracted. 11.1 主 成 分 析 第 5步 利 用 因 子 分 析 的 结 果 进 行 主 成 分 分 析 : 上 表 是 旋 转前 的 因 子 载 荷 矩 阵 , 并 不 是 主 成 分 分 析 中 所 需 要 的 标 准 化 的正 交 向 量 , 要 得 到 标 准 化 正 交 向 量 还 需 作 如 下 运 算 :l将 上 表 因 子 载 荷 矩 阵 中 的 数 据 输 入 SPSS数 据 编 辑 窗 口 中 , 将3个 变 量 名 分 别 命 名 为 a1,a2和 a3。l用 公 式 计 算
15、出 标 准 化 特 征 向 量 。 其 步 骤 为 : 打 开Analyze Compute Variable, 计 算 过 程 如 下 图 所 示 。/ij ij ie a 11.1 主 成 分 析 l计 算 结 束 后 得 到 的 特 征 向 量 矩 阵 如 下 表 所 示 。变 量 t1 t2 t3x1 0.17 0.33 0.25x2 0.24 -0.30 0.20 x3 -0.06 0.01 0.77x4 0.36 -0.14 -0.17x5 0.25 0.32 0.03x6 0.34 -0.05 -0.26x7 0.11 -0.26 0.17x8 0.26 0.29 0.04x9
16、0.25 0.29 0.01x10 0.22 0.32 0.18 x11 0.27 -0.29 0.16x12 0.27 -0.28 0.16x13 0.35 -0.08 -0.28x14 0.30 -0.26 0.13x15 0.24 0.32 0.00 11.1 主 成 分 析 l对 原 始 的 数 据 变 量 进 行 标 准 化 。 由 于 是 以 相 关 系 数 矩 阵为 出 发 点 进 行 因 子 分 析 的 , 所 以 主 成 分 分 析 表 达 式 中 的变 量 应 该 是 经 过 标 准 化 的 数 据 。l计 算 主 成 分 : 再 通 过 表 各 个 主 成 分 所 分 析
17、 的 方 差 百 分 比计 算 出 综 合 得 分 函 数 , 其 公 式 为 : 0.40325 1 0.38755 2 0.07616 3y y y y 综 11.1 主 成 分 析 l主 成 分 及 综 合 得 分 表 : 编 号 国 家 y1 y2 y3 y综1 中 国 -2.19 0.07 3.01 -0.632 印 度 -2.56 -0.11 -0.46 -1.113 日 本 0.45 1.85 -0.27 0.884 韩 国 -1.69 -0.46 -0.27 -0.885 新 加 坡 5.28 -6.26 1.19 -0.206 美 国 3.30 6.07 1.46 3.807
18、 加 拿 大 -0.43 -0.47 -0.31 -0.388 巴 西 -1.91 -0.06 -0.43 -0.839 墨 西 哥 -1.68 -0.68 0.03 -0.94 10 英 国 4.46 0.98 -1.75 2.0511 法 国 0.87 0.46 -0.52 0.4912 德 国 1.40 1.34 -0.26 1.0613 意 大 利 -0.61 0.10 -0.54 -0.2514 俄 罗 斯 -2.35 -0.20 -0.30 -1.0515 澳 大 利 亚 -1.36 -0.92 -0.30 -0.9316 新 西 兰 -0.99 -1.73 -0.28 -1.09
19、 主要内容11.1 主 成 分 析11.2 因 子 分 析 11.2 因 子 分 析基本概念 因 子 分 析 是 一 种 通 过 显 在 变 量 测 评 潜 在 变 量 , 通 过 具 体 指标 测 评 抽 象 因 子 的 分 析 方 法 , 最 早 是 由 心 理 学 家 Chales Spearman在 1904年 提 出 的 , 它 的 基 本 思 想 是 将 实 测 的 多 个 指 标 ,用 少 数 几 个 潜 在 的 指 标 ( 因 子 ) 的 线 性 组 合 表 示 。 因 子 分 析 主要 应 用 到 两 个 方 面 : 一 是 寻 求 基 本 结 构 , 简 化 观 测 系 统
20、 ; 二 是对 变 量 或 样 本 进 行 分 类 。 因 子 分 析 的 基 本 思 想 是 根 据 相 关 性 的 大 小 把 变 量 分 组 , 使得 同 组 内 的 变 量 的 相 关 性 较 高 , 而 不 同 组 的 变 量 相 关 性 较 低 。每 组 变 量 代 表 一 个 基 本 结 构 , 这 个 基 本 结 构 称 为 一 个 公 共 因 子 。 11.2 因 子 分 析统计原理 1 11 1 12 2 12 21 1 22 2 2 1 1 2 2 m mm mp p p pm mx a F a F a Fx a F a F a Fx a F a F a F 其 中 x1
21、, x2, ,xp为 p个 原 有 变 量 , 是 均 值 为 零 , 标 准 差 为 1的标 准 化 变 量 , F1, F2, , Fm为 m个 因 子 变 量 , m小 于 p, 表示 成 矩 阵 形 式 为 : X AF a 11.2 因 子 分 析分析步骤第1步 将原始数据进行标准化;第2步 确定待分析的原有若干变量是否适合于因子分析;第3步 构造因子变量;第4步 利用旋转使得因子变量更具有可解释性;第 5步 计 算 因 子 变 量 的 得 分 。 计 算 因 子 得 分 和 模 型 为 : 1 1j j jp pF X X j=1,2,m 11.2 因 子 分 析SPSS实现举例【
22、例11-2】为了研究几个省市的科技创新力问题,现取了2005年8个省市的15个科技指标数据,请对其进行因子分析。省 市 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15北 京 229 80.26 48.5 24.49 3.55 5.55 10.23 44774.45 25.02 24.1 779.24 226.01 34.42 3183.29 2.12天 冿 87 67.48 36.82 14.08 2.62 1.96 4.49 35451.77 33.59 21.38 410.34 73.15 25.06 495.78 1.82辽 宁 44
23、 65.69 35.94 8.34 2.32 1.56 2.45 18974.2 11.29 5.57 263.35 22.32 15.21 204.98 1.78上 海 104 74.06 35.98 17.84 4.78 2.28 4.8 51485.83 39.72 19.08 654.31 112.32 15.85 1303.32 2 江 苏 50 60.79 34.07 6.8 2.13 1.47 3.17 24489.18 43.13 17.99 206.68 16.6 9.14 134.89 1.41浙 江 53 63.48 31.08 5.42 3.95 1.22 1.83 2
24、7435.38 7.94 7.63 257.65 22.66 5.82 79.01 1.72山 东 30 64.59 33.22 4.44 1.81 1.05 1.59 20022.57 9.17 5.69 117.73 9.76 8.41 106.36 1.34广 东 35 69.64 37.27 5.81 3.66 1.09 2.18 24327.32 35.67 24.99 117.51 20.4 5.08 122.33 1.47 11.2 因 子 分 析第 1步 分 析 : 如 题 所 示 , 要 求 用 因 子 分 析 法 分 析 。第 2步 数 据 组 织 : 建 立 x1-x15
25、共 15个 数 据 变 量 和 一 个 “ 省 市 ”字 符 型 变 量 , 将 北 京 、 天 津 等 8个 省 市 作 为 个 案 数 据 输 入 并 保存 。第 3步 因 子 分 析 设 置 : 11.2 因 子 分 析正 交 旋 转 设 置 :保 存 对 话 框 设 置 : 11.2 因 子 分 析第 4步 主 要 结 果 及 分 析 :u特 征 值 与 方 差 贡 献 表 Component Initial Eigenvalues Extraction Sums of Squared LoadingsTotal % of Variance Cumulative % Total % o
26、f Variance Cumulative %1 6.049 40.325 40.325 6.049 40.325 40.3252 5.813 38.755 79.080 5.813 38.755 79.0803 1.142 7.616 86.696 1.142 7.616 86.6964 .876 5.842 92.538 5 .599 3.996 96.5346 .326 2.174 98.7097 .119 .796 99.5058 .041 .272 99.7769 .018 .121 99.89710 .010 .063 99.96111 .004 .027 99.98812 .00
27、1 .009 99.99713 .000 .002 99.99914 .000 .001 100.00015 4.080E-7 2.720E-6 100.000Extraction Method: Principal Component Analysis. 可 以 看 出 前 3个 特征 值 大 于 1, 同 时这 3个 公 共 因 子 的方 差 贡 献 率 占 了93.924%, 说 明 提取 这 3个 公 共 因 子可 以 解 释 原 变 量 的绝 大 部 分 信 息 。 11.2 因 子 分 析u旋 转 前 的 因 子 载 荷 矩 阵 在 表 的 底 部 表 明 使用 的 是 主 成 分
28、 分 析法 , 3个 主 成 分 被抽 取 出 来 。Component1 2 3x1 .973 -.158 .052x2 .919 .036 -.090 x3 .883 -.161 .334x4 .985 -.004 -.022x5 .482 .497 -.664x6 .947 -.242 .131x7 .972 -.108 .178x8 .849 .340 -.301x9 .300 .834 .386 x10 .611 .637 .399x11 .955 .000 -.211x12 .992 -.091 -.001x13 .876 -.282 .205x14 .968 -.156 .032
29、x15 .859 -.092 -.385Extraction Method: Principal Component Analysis.a. 3 components extracted. 11.2 因 子 分 析u旋 转 后 的 因 子 载 荷 矩 阵 从 旋 转 后 的 因 子 载 荷 矩阵 可 以 看 出 。 因 子 1在 1、3、 4、 6、 7、 12、 13、14上 有 较 大 的 载 荷 , 反映 科 技 投 入 与 产 出 情 况 ,可 以 命 名 为 创 新 水 平 因子 。 因 子 2在 指 标 5、 8和15上 有 较 大 载 荷 , 反 映地 区 经 济 发 展 及 财
30、 政 科教 投 入 水 平 , 可 以 命 名创 新 环 境 因 子 , 因 子 3在指 标 9和 指 标 10上 有 较 大的 载 荷 , 可 以 命 名 为 高技 术 产 业 发 展 因 子 。Component1 2 3x1 .936 .286 .130 x2 .776 .459 .202x3 .924 .016 .251x4 .867 .413 .221x5 .068 .940 .180 x6 .966 .177 .095x7 .944 .202 .235x8 .541 .726 .327x9 .018 .137 .956 x10 .377 .172 .876x11 .794 .558
31、 .118x12 .913 .365 .161x13 .937 .071 .084x14 .926 .301 .119x15 .705 .626 -.069Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 5 iterations. 11.2 因 子 分 析u因 子 转 换 矩 阵 表 明 了 因 子 提取 的 方 法 是 主成 分 分 析 , 旋转 的 方 法 是 方差 极 大 法 。Compo
32、nent 1 2 31 .884 .403 .2392 -.405 .400 .8223 .236 -.823 .517Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. u因 子 得 分 及 综 合 因 子 得 分 情 况 : 通 过 以 下函 数 计 算 得 出 综 合 因 子 得 分 情 况 。 省 市 F1 F2 F3 F 综 合 排 序山 东 -0.344 -1.001 -0.945 -0.536 8浙 江 -0.791 0.905 -1.223 -0.473 7江 苏 -0.488 -1.024 1.073 -0.342 6广 东 -0.791 -0.104 1.202 -0.327 5辽 宁 -0.002 -0.500 -1.206 -0.269 4天 冿 0.248 -0.275 0.572 0.177 3上 海 -0.136 1.947 0.481 0.366 2北 京 2.305 0.053 0.045 1.406 10.6028 1 0.19507 2 0.14137 3F F F F
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。