77范文网 - 专业文章范例文档资料分享平台

因子分析在STATA中实现和案例(2)

来源:网络收集 时间:2019-05-18 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

----------------------------------------------------------- Variable | Factor1 Factor2 Factor3 | Uniqueness -------------+------------------------------+-------------- x1 | 0.9659 0.0601 0.1284 | 0.0469 x2 | 0.2269 0.8399 0.1052 | 0.2320 x3 | 0.9585 0.1143 -0.0844 | 0.0611 x4 | 0.9708 0.1546 -0.0211 | 0.0332 x5 | 0.2236 0.8940 -0.0362 | 0.1494 x6 | -0.0962 0.8291 -0.0635 | 0.2993 -----------------------------------------------------------

Factor rotation matrix

----------------------------------------- | Factor1 Factor2 Factor3 -------------+--------------------------- Factor1 | 0.8578 0.5138 0.0115 Factor2 | -0.5137 0.8579 -0.0135 Factor3 | 0.0168 -0.0056 -0.9998 -----------------------------------------

结合实际情况,我们通过上面的分析整理出前两个主因子的正交因子表。

表:正交因子表 因 子 指 标 x1 x2 x3 x4 x5 x6 Factor 1 0.9659 0.2269 0.9585 0.9708 0.2236 -0.0962 Factor 2 0.0601 0.8399 0.1143 0.1546 0.8940 0.8291 根据上表将六个指标按高载荷分成两类,并结合专业知识对各因子命名,如下表:

表:高载荷分类 1 2 高载荷指标 人均GDP 城镇居民人均年可支配收入 农村居民家庭人均纯收入 高等学校数 卫生机构数 新增固定资产 因子命名 收入因子 投资、社会因子 接着进行一个后续因子分析的制图命令loadingplote有助于将其可视化。从图中我们就可以直观的看出在主因子1中x1、x3、x4明显取得较大值,而对于主因子2则是x2、x5、x6取得较大的值。

载荷图

Factor loadings1x6x5x2Factor 2.2.4.6.8x4x3x100Rotation: orthogonal varimaxMethod: principal factors.5Factor 11

因子分是通过将每个变量标准化为平均数等于0和方差等于1,然后以因子分系数进行加权合计为每个因子构成的线性组合。基于最近的rotate或factor结果,predict会自动进行这些计算。通过命令predict f1 f2,我们得到了各个观察变量的主因子1、主因子2的得分情况。

. list area f1 f2

+--------------------------------+ | area f1 f2 | |--------------------------------| 1. | 北 京 2.561218 -.3716789 | 2. | 天 津 1.557873 -.9623399 | 3. | 河 北 -.3308641 1.11135 | 4. | 山 西 -.4196471 -.1267554 | 5. | 内蒙古 .0597282 -.493462 | |--------------------------------| 6. | 辽 宁 .0589154 1.03599 | 7. | 吉 林 -.1869884 -.0693724 | 8. | 黑龙江 -.3388027 .0518705 | 9. | 上 海 3.102133 -.8749663 |

10. | 江 苏 .7713872 1.864629 | |--------------------------------| 11. | 浙 江 1.640963 .5580102 | 12. | 安 徽 -.5925296 .5026094 | 13. | 福 建 .5376554 -.3128498 | 14. | 江 西 -.445243 .2467043 | 15. | 山 东 .1589503 1.588749 | |--------------------------------| 16. | 河 南 -.4744598 1.084772 | 17. | 湖 北 -.4194019 .7986803 | 18. | 湖 南 -.4611212 .8609527 | 19. | 广 东 .6425342 1.33433 | 20. | 广 西 -.5491737 -.1288966 | |--------------------------------|

21. | 海 南 -.2889173 -1.39015 | 22. | 重 庆 -.3183038 -.6323313 | 23. | 四 川 -.652319 .9108785 | 24. | 贵 州 -.9411649 -.6618432 | 25. | 云 南 -.7608307 -.2586383 | |--------------------------------| 26. | 西 藏 -.6072451 -1.569231 |

. summarize f1 f2

27. | 陕 西 -.7326311 .1913275 | 28. | 甘 肃 -.9497479 -.5987777 | 29. | 青 海 -.6269016 -1.50444 | 30. | 宁 夏 -.4114082 -1.422286 | |--------------------------------| 31. | 新 疆 -.5836563 -.7628338 | +--------------------------------+

Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- f1 | 31 -4.09e-09 .988557 -.9497479 3.102133 f2 | 31 9.13e-09 .9464783 -1.569231 1.864629

在这些因子分之间是存在着相关,在默认选项中,promax旋转允许因子分之间存在相关。通过运行命令correlate f1 f2可得。从运行出来的结果看到,两个因子分相关关系是很小的。

. correlate f1 f2 (obs=31)

| f1 f2 -------------+------------------ f1 | 1.0000

f2 | 0.0158 1.0000

另一个后因子分析制图命令,scoreplot可绘出这些观测案例的因子分的散点图。在本例的得分图中,我们可以看到,上海、北京、浙江、天津这些城市的主因子1的得分相对于其他城市高,因为主因子1是收入因子,这些城市的收入在全国是排在前列的。而我们可以看到北京、上海的在主因子2(即投资、社会因子)的得分是较低,这是因为这两个城市的经济总量相对较小。在江苏、山东、广东这些经济总量名列前茅的省份,它们的主因子2的得分也是相应位于其他城市前面。

得分图

Score variables (factor)2江 苏山 东广 东-1投资、社会因子01河 河南 北四 川湖 南湖北辽 宁浙 江安 徽陕 西江 西黑龙江吉 林山 西广 西云 南内蒙古甘重 庆贵 肃州新 疆海 南宁 夏青西 海藏福 建北 京天 津上 海-2-1Rotation: orthogonal varimaxMethod: principal factors01收入因子23 练习:

将上一章的主成分分析的例子的数据进行因子分析。

居民

省份

GDP (亿元)

消费水平

固定资产投资

职工平均工资

货物周转量 (亿吨公里) x5 758.9 2703.4 5925.5 2562.2 3658.7 7033.9 1157.8 1690.9 4300.9 4974.9 5843.2

居民消费价格指数 (上年100) x6 105.1 105.4 106.2 107.2 105.7 104.6 105.1 105.6 105.8 105.4 105 106.2

商品零售价格指数 (上年x7 104.4 105.1 106.7 107.2 104.7 105.3 106.2 105.8 105.3 104.9 106.3 106.3 100)

x8 10413 12503 23031 10024 8740.2 24769 8406.9 7624.5 25121 67799 40832 11162 工业总产值 (亿元)

(亿元) (元)

(元) x2

x3 3814.7 3389.8 8866.6 3531.2 5475.4 5038.9 3656 4823.1 9323 6747

x4 56328 41748 24756 25828 26114 27729 23486 23046 31667 34146 26363

area 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽

x1

10488.03 20346 6354.38 14000 16188.61 6938.73 7761.8 13461.57 6424.06

8310

6570 6187 8108 7591 7039

9625 10019.1

13698.15 27343 21486.92 13893 8874.17

6377

56565 16029.8

30312.61 11013 15300.6

福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 10823.11 10361 6480.33 31072.06 18407.78 11330.38 11156.64 7171.58 1459.23 5753

5207.7 4745.4

25702 21000 24816 22739 24870 33110 25660 21864 2396.2 2285.5 5165.1 2526.4 2349.8 4428.4 2079 597.7 104.6 106 105.3 107 106.3 106 105.6 107.8 106.9 105.7 106.1 104.9 107.5 106.3 105.6 106 107.6 106.7 15213 8499.6 62959 26028 13455 11553 65425 6072 1103.1 9573 15435.9 5877 10490.6 7406 7145 6103 6550 5647 5534 3756.4 705.4 26404 10107.8

35696.46 14390 10868.7

重 庆 5096.66 四 川 12506.25 贵 州 3333.4 云 南 5700.1 西 藏 395.91 陕 西 6851.32 甘 肃 3176.11 青 海 961.53 宁 夏 1098.51 新 疆

4203.41

9835 3979.6 6072 7127.8 4426 1864.5 4553 3435.9 3504 309.9 6290 4614.4 4869 1712.8 5830 583.2 7193 828.9 5542

2260

26985 1490.3 25038 1578.7 24602 805.3 24030 821.3 47280 35.5 25942 2027 24017 1594.9 30983 335.7 30719 703.6 24687

1273

105.6 105 105.1 105.3 107.6 107.2 105.7 106.1 105.7 103.9 106.4 106.9 108.2 107.9 110.1 110.6 108.5 108.5 108.1

108.5

5755.9 14762 3111.1 5144.6 48.19 7480.8 3667.5 1103.1 1366.5 4276.1

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库因子分析在STATA中实现和案例(2)在线全文阅读。

因子分析在STATA中实现和案例(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/631056.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: