lnX6 lnX1 lnX6 lnX2 lnX6 lnX3 lnX6 lnX4 lnX6 lnX5 lnX6 lnX7 -0.186 (-0.698) -0.251 (-1.021) 0.061 (1.548) -0.119 (-0.897) -0.623 (-7.127) 0.666 (1.891) 0.753 (2.308) 0.341 (5.901) 0.585 (3.167) 1.344 (10.314) 0.391 (11.071) 0.920 0.922 0.927 0.921 0.977 0.924 经比较,新加入lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数
的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。
如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。 例如, 不取对数作全部变量多元线性回归,结果为:
可以看出还是有严重多重共线性。作逐步回归: 分别作一元回归得到:
变量 参数估计值 t 统计量 X1 0.7333 26.4698 0.9709 0.9695 X1 6.6399(0.0022) 0.5512 (0.0000) 0.5040 (0.3356) 1.0516 X2 0.7353 0.9684 0.9669 X2 -5.9308 (0.0054) X3 1.6655 0.9393 0.9364 X3 0.4349 (0.0821) X4 X4 13.1909 25.9636 0.9697 0.9683 X5 X5 10.8980 13.5147 0.8969 0.8920 X6 X6 678.0058 22.4229 0.9599 0.9580 X7 X7 19332.30 4.7024 0.5129 0.4897 25.3627 18.0257 R2 R2 X1,X2 X1,X3 X1,X4 X1,X5 以X1为基础加入其他变量, 结果为: R2 0.9785 0.9726 0.9683 0.9766 4.1326 (0.6580) -5.0269 (0.0000) X1,X6 X1,X7 1.0075 (0.0088) 0.7499 (0.0000) (0.013) -255.80 (0.438) -813.44 (0.5988) 0.9684 0.9690 注: 括号中为p值.
可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:
可是这里的lnX2和lnX5的参数符号为负,在经济意义上并不合理。说明多重共线性影响仍然很严重。
4.7 在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果所采用的数据如下表所示
表4.13 1978-2007年财政收入及其影响因素数据
建筑业增加受灾面积财政收入农业增加值工业增加值总人口(万最终消费年份 值(亿(千公(亿元)CS (亿元)NZ (亿元)GZ 人)TPOP (亿元)CUM 元)JZZ 顷)SZM 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 37148 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233.0 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062.0 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 4348.95 5218.1 6242.2 7407.99 8651.14 9875.95 11444.08 13395.23 16386.04 18903.64 21715.25 26396.47 31649.29 38760.20 51321.78 6963.8 9572.7 12135.8 14015.4 14441.9 14817.6 14770.0 14944.7 15781.3 16537.0 17381.7 21412.7 22420.0 24040.0 28095.0 14188 19480.7 24950.6 29447.6 32921.4 34018.4 35861.5 4003.6 43580.6 47431.3 54945.5 65210 76912.9 91310.9 107367.2 2266.5 2964.7 3728.8 4387.4 4621.6 4985.8 5172.1 5522.3 5931.7 6465.5 7490.8 8694.3 10133.8 11851.1 14014.1 118517 119850 121121 122389 123626 124761 125786 126743 127627 128453 129227 129988 130756 131448 132129 21899.9 29242.2 36748.2 43919.5 48140.6 51588.2 55636.9 61516 66878.3 71691.2 77449.5 87032.9 96918.1 110595.3 128444.6 48829 55043 45821 46989 53429 50145 49981 54688 52215 47119 54506 37106 38818 41091 48992 (资料来源:《中国统计年鉴2008》,中国统计出版社2008年版) 试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?
练习题4.7参考解答:
(1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵
解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与第三章对模型的无多重共线性假定不符合。 (2)解决方案:
采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。 合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。 取对数再回归,可以减低共线性。
第五章练习题及参考解答
练习题5.1参考解答:
2(1)因为f(Xi)?X2i,所以取W2i?1,用W2i乘给定模型两端,得 X2iYiXu1??1??2??33i?iX2iX2iX2i X2i上述模型的随机误差项的方差为一固定常数,即
Var(
ui1)?2Var(ui)??2X2iX2i
(2)根据加权最小二乘法,可得修正异方差后的参数估计式为
??Y*???X*???X*?12233 ??2W???***2****yxWx?WyxWx?????????2ii2i2i3i2ii3i2i2ix3i?**??W2ix2*2i???W2ix3*2i????W2ix2ix3i?2
??3 其中
W???2i**2****yi*x3i???W2ix2i????W2iyix2i???W2ix2ix3i???W2i*2*2**2ix2i???W2ix3i????W2ix2ix3i?2
*X2?
?WX?W2i2i,*X3??WX?W2i2i3i,Y*??WY?W
2ii2i**x?X?X2i2i2
**x3i?X3i?X3y*?Yi?Y*
练习题5.2参考解答:
(1)该模型样本回归估计式的书写形式为
??9.347522+0.637069XYii t= (2.569104) (32.00881)
R2=0.946423 R2=0.945500 F=1024.564 DW=1.790431 (2)首先,用Goldfeld-Quandt法进行检验。
将样本X按递增顺序排序,去掉中间1/4的样本,再分为两个部分的样本,即
n1?n2?22。
分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
?e?e求F统计量为
2122?603.0148?2495.840
2221e?F??e?2495.84?4.1390603.0148
给定??0.05,查F分布表,得临界值为F0.05(20,20)?2.12。
c.比较临界值与F统计量值,有F=4.1390>F0.05(20,20)?2.12,说明该模型的随机误差项存在异方差。
其次,用White法进行检验。具体结果见下表
White Heteroskedasticity Test: F-statistic 6.301373 Probability Obs*R-squared 10.86401 Probability Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 08/05/05 Time: 12:37 Sample: 1 60
Included observations: 60 Variable Coefficient Std. Error t-Statistic C -10.03614 131.1424 -0.076529 X 0.165977 1.619856 0.102464 X^2 0.001800 0.004587 0.392469 R-squared 0.181067 Mean dependent var Adjusted R-squared 0.152332 S.D. dependent var S.E. of regression 102.3231 Akaike info criterion Sum squared resid 596790.5 Schwarz criterion Log likelihood -361.2856 F-statistic Durbin-Watson stat 0.937366 Prob(F-statistic) 0.003370 0.004374 Prob. 0.9393 0.9187 0.6962 78.86225 111.1375 12.14285 12.24757 6.301373 0.003370 给定??0.05,在自由度为2下查卡方分布表,得?2?5.9915。比较临界值与卡方统计量值,即nR2?10.8640??2?5.9915,同样说明模型中的随机误差项存在异方差。 (2)用权数W1?
Dependent Variable: Y Method: Least Squares
Date: 08/05/05 Time: 13:17 Sample: 1 60
Included observations: 60 Weighting series: W1 Variable Coefficient Std. Error t-Statistic C 10.37051 2.629716 3.943587 X 0.630950 0.018532 34.04667 Weighted Statistics R-squared 0.211441 Mean dependent var Adjusted R-squared 0.197845 S.D. dependent var S.E. of regression 7.778892 Akaike info criterion Sum squared resid 3509.647 Schwarz criterion Log likelihood -207.2041 F-statistic Durbin-Watson stat 0.958467 Prob(F-statistic) Unweighted Statistics 1,作加权最小二乘估计,得如下结果 XProb. 0.0002 0.0000 106.2101 8.685376 6.973470 7.043282 1159.176 0.000000
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库计量经济学参考答案(6)在线全文阅读。
相关推荐: