案例 我国各地区城镇居民消费性支出的主成分分析
下表列出了1999年全国31个省、直辖市和自治区(港、澳、台不在其中)的城镇居民家庭平均每人全年消费性支出的八个主要变量数据,请从八个变量中识别出主成分。
表1 变量表
x1:食品 x5:交通和通讯 x6:娱乐教育文化服务 x7:居住 x8:杂项商品和服务
单位:元
x2:衣着 x3:家庭设备用品及服务 x4:医疗保健 表1
地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 消费性支出数据
x1 2959.19 2459.77 1495.63 1406.33 1303.97 1730.84 1561.86 1410.11 3712.31 2207.58 2629.16 1844.78 2709.46 1563.78 1675.75 1427.65 1783.43 1942.23 3055.17 2033.87 2057.86 2303.29 1974.28 1673.82 2194.25 x2 730.79 495.47 515.90 477.77 524.29 553.90 492.42 510.71 550.74 449.37 557.32 430.29 428.11 303.65 613.32 431.79 511.88 512.27 353.23 300.82 186.44 589.99 507.76 437.75 537.01 x3 749.41 697.33 362.37 290.15 254.83 246.91 200.49 211.88 893.37 572.40 689.73 271.28 334.12 233.81 550.71 288.55 282.84 401.39 564.56 338.65 202.72 516.21 344.79 461.61 369.07 x4 513.34 302.87 285.32 208.57 192.17 279.81 218.36 277.11 346.93 211.92 435.69 126.33 160.77 107.90 219.79 208.14 201.01 206.06 356.27 157.78 171.79 236.55 203.21 153.32 249.54 x5 467.87 284.19 272.95 201.50 249.81 239.18 220.69 224.65 527.00 302.09 514.66 250.56 405.14 209.70 272.59 217.00 237.60 321.29 811.88 329.06 329.65 403.92 240.24 254.66 290.84 x6 1141.82 735.97 540.58 414.72 463.09 445.20 459.62 376.82 1034.98 585.23 795.87 513.18 461.67 393.99 599.43 337.76 617.74 697.22 873.06 621.74 477.17 730.05 575.10 445.59 561.91 x7 478.42 570.84 364.91 281.84 287.87 330.24 360.48 317.61 720.33 429.77 575.76 314.00 535.13 509.39 371.62 421.31 523.52 492.60 1082.82 587.02 312.93 438.41 430.36 346.11 407.70 x8 457.64 305.08 188.63 212.10 192.96 163.86 147.76 152.85 462.03 252.54 323.36 151.39 232.29 160.12 211.84 165.32 182.52 226.45 420.81 218.27 279.19 225.80 223.46 191.48 330.95 1
西藏 陕西 甘肃 青海 宁夏 新疆 2646.61 1472.95 1525.57 1654.69 1375.46 1608.82 839.70 390.89 472.98 437.77 480.89 536.05 204.44 447.95 328.90 258.78 273.84 432.46 209.11 259.51 219.86 303.00 317.32 235.82 379.30 230.61 206.65 244.93 251.08 250.28 371.04 490.90 449.69 479.53 424.75 541.30 269.59 469.10 249.66 288.56 228.73 344.85 389.33 191.34 228.19 236.51 195.93 214.40 资料来源:2000年《中国统计年鉴》
我们希望对上述八个指标数据进行主成分分析。
?出发进行主成分分析,从x1,x2,?,x8的样本相关阵RSAS软件的输出结果如输出1所示。
2
输出1 对全国31个地区消费性支出的主成分分析
从输出1可以看出,前两个和前三个主成分的累计贡献率分别达到80.6%和87.8%,第
*?1在所有变量(除在x2一主成分y上的载荷稍偏小外)上都有近似相等的正载荷,反映了综合消
*?2在变量x2费性支出的水平,因此第一主成分可称为综合消费性支出成分。第二主成分y上
*有很高的正载荷,在变量x4上有中等的正载荷,而在其余变量上有负载荷或很小的正载荷。
3
可以认为这个主成分度量了受地区气候影响的消费性支出(主要是衣着x2,其次是医疗保健
x4①)在所有消费性支出中占的比重(也可理解为一种消费倾向),第二主成分可称为消费倾向
成分。第三主成分很难给出明显的解释,因此我们只取前面两个主成分。
表2和表3是把31个地区分别按第一和第二主成分得分从小到大重新排序后的结果。从表2可以看出,东部地区的第一主成分得分普遍较高,中部地区一般,而西部地区则普遍较低。从表3可见,北方地区的第二主成分得分普遍较高,而南方地区则普遍较低,这是由于北方地区气候寒冷,用于衣着、医疗保健等消费的比重相对较高,而南方地区则相反。这也进一步支持了上述对第二主成分的解释。图1是关于第一和第二主成分得分的散点图,该图等价于各变量经标准化后的八维数据点群在具有最大投影点群分散程度的二维平面上的投影。它对各地区的综合消费性支出和受地区气候影响的消费性支出占的比重有较直观的描述。
表2
地区 江西 河南 黑龙江 吉林 山西 内蒙古 安徽 甘肃 宁夏 辽宁 贵州 海南 青海 陕西 河北 湖北
按第一主成分排序的31个地区
?1 y-2.234 -1.947 -1.927 -1.859 -1.848 -1.826 -1.796 -1.549 -1.501 -1.313 -1.298 -1.157 -1.045 -0.859 -0.769 -0.717 ?2 y-1.867 -0.388 0.636 0.151 0.404 0.509 -0.519 0.526 0.906 0.844 -0.341 -1.913 0.426 -0.501 0.580 -0.247 地区 新疆 四川 广西 山东 福建 湖南 江苏 云南 西藏 重庆 天津 浙江 北京 广东 上海 ?1 y-0.697 -0.533 -0.251 -0.147 0.201 0.219 0.407 0.435 0.437 1.115 2.006 3.583 5.426 5.583 5.866 ?2 y0.647 0.041 -2.058 0.983 -1.337 -0.203 -0.311 0.479 2.365 0.409 0.044 0.531 2.466 -3.072 -0.195 ①
可从表1计算出医疗保健在消费性总支出中占的比率x4?xi?18i,然后进行由大到小的排序,各地区的顺
序依次为:宁夏、黑龙江、青海、河北、辽宁、北京、浙江、陕西、甘肃、山西、吉林、河南、新疆、内蒙古、天津、云南、山东、广东、湖北、四川、重庆、湖南、海南、江苏、上海、西藏、贵州、广西、安徽、江西和福建,大致由寒冷的北方地区排到温暖的南方地区。这是由于气候的寒冷易导致医疗保健费用的增加,因此,可以认为除衣着x2外医疗保健x4也是受地区气候影响的变量。
4
表3 地区 广东 广西 海南 江西 福建 安徽 陕西 河南 贵州 江苏 湖北 湖南 上海 四川 天津 吉林 按第二主成分排序的31个地区
?1 y5.583 -0.251 -1.157 -2.234 0.201 -1.796 -0.859 -1.947 -1.298 0.407 -0.717 0.219 5.866 -0.533 2.006 -1.859 ?2 y-3.072 -2.058 -1.913 -1.867 -1.337 -0.519 -0.501 -0.388 -0.341 -0.311 -0.247 -0.203 -0.195 0.041 0.044 0.151 地区 山西 重庆 青海 云南 内蒙古 甘肃 浙江 河北 黑龙江 新疆 辽宁 宁夏 山东 西藏 北京 ?1 y-1.848 1.115 -1.045 0.435 -1.826 -1.549 3.583 -0.769 -1.927 -0.697 -1.313 -1.501 -0.147 0.437 5.426 ?2 y0.404 0.409 0.426 0.479 0.509 0.526 0.531 0.580 0.636 0.647 0.844 0.906 0.983 2.365 2.466
图1 前两个主成分的散点图
从图1中可以看出,上海、广东和北京在最右边,城镇居民综合消费性支出是最高的;其次是浙江和天津;江西在散点图的最左边,表明综合消费性支出是最低的;北京和西藏在散点图的最上边,说明受地区气候影响的消费性支出占的比重最高;广东在最底部,表明受地区气候影响的消费性支出占的比重最低。
5
注:该例中,如果我们只是要根据x1,x2,?,x8来比较各地区城镇居民消费性支出的总水平,则消费性总支出x0??xi无疑是最合适的,它的含义确切且富有很好的实际意义。但
i?18如果我们要比较的不是总水平而是整体水平,则使用单个变量x0就有其不足之处,它的信息量不够足,未能较充分地提取x1,x2,?,x8中的有用信息。本案例所进行的主成分分析却能
?出发的)前两个主成分y?1和y?2合在一起能够包含有x1,x2,?,x8的较多弥补此种不足,(从R?1能在某种意义上反映消费性支出总水平外,y?2还能进一步反映对各地区消费信息,除了y性支出差异起较重要作用的某种消费倾向。
?1和x0之间存在着高达r?0.989的正相关性,虽然这两个变量高度相关,且意义相近,y但两者还是有着本质区别,主要表现在如下几点:(1)x1,x2,?,x8中各变量对x0的作用有
?1是对x1,x2,?,x8作标准化变换(意味着对每项消很大的不同(如x1的作用就特别大),而y?1的表达式,x1,x2,?,x8中的每个变量对y?1的作用是费性支出平等看待)后得到的,依据y?1值则取决于大致相同的。(2)某地区的x0值取决于该地区x1,x2,?,x8的绝对数值,而其y该地区x1,x2,?,x8中的每个变量值在所有31个地区中的相对大小,它是这八个变量值相对
?1的含义是在某种意义上(即在某线性组大小的综合值;(3)x0的含义是完全清楚的,而y合意义上)的,不像x0的含义那么清楚。
6
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库主成分分析案例 - 图文在线全文阅读。
相关推荐: