Chapter1 线性回归模型的OLS估计(4)

来源：网络收集时间：2020-04-14 下载这篇文档手机版

说明：文章内容仅供预览，部分内容可能不全，需要完整文档或者需要复制内容，请下载word后使用。下载word有问题请添加微信号:或QQ：处理（尽可能给您提供完整文档），感谢您的支持与谅解。

??β)R'??2R(X'X)?1R' var(v)?Rvar(β根据结论：如果n维随机向量x~N(μ,Σ)，则(x?μ)'Σ?1(x?μ)~?2(n)，可得w~?(2J)。

?的函数，而u?与u?的函数。前文已经证明，β?是独立的。因此，w与?'u?/?2是uw是β?'u?/?2也相互独立。 u??q)'[?2R(X'X)?1R']?1(Rβ??q)/J(Rβ综上所述，F?~F(J,N?K)。

?'u?/?2)/(N?K)(u检验步骤如下。

Step1：根据上式计算F统计量。

Step2：根据对应自由度的F分布查临界值Fcrit。

Step3：如果F>Fcrit，则拒绝原假设；否则，接受原假设。

实际上，前面的整个方程的显著性检验、部分参数的联合显著性检验、单个参数的显著性检验都是线性约束检验的特殊形式。比如，在模型

lwage = ?0 + ?1 exper + ?2 educ + u 检验?1=0，即?010???0检验?1=?2=0，即

?1?2?'?0

?010??001???0???1?2?'???

0???0?检验?1=?2，即?01?1???0?1?2?'?0

1个自由度的t分布的平方为1个自由度的卡方分布，因此如果只有一个约束时，F~F(`1,N?K)?t(2N?K)。因此，对于参数关系的单个约束也可以利用t检验来完成。

例 1.6教育（educ）和工作时间（tenure）的对工资的影响相同，即检验：?1=?2。

. test educ=tenure

工龄（exper）对工资没有影响，即检验：?3=0。 . test exper

对上面两个假设进行联合检验，即检验：?1=?2，?3=0。 . test educ=tenure exper

说明：与整个方程的显著性相类似，线性约束的F统计量也是通过比较受约束模型与无约束模型的残差平方和来构建。无约束模型：y?Xβ?u

t???Rβ?q 受约束模型：y?Xβ?u,???s..对于受约束模型的OLS估计，最小化残差平方和

?,λ)?(y?Xβ?)'(y?Xβ?)?2λ'(Rβ??q) 1.61 L(β?,λ)?L(β?)?2R'λ?0??2X(y?Xβ??β 1.62

??L(β,λ)??q)?0?2(Rβ?λ利用分块矩阵求解，可得：

??β??(X'X)?1R'[R(X'X)?1R']?1(Rβ??q)β 1.63

?1?1?λ?R'[R(X'X)R'](Rβ?q)残差项为：

??(y?Xβ?)?(Xβ??Xβ?)?u??β?) 1.64 ??y?Xβ??X(βu受约束模型的残差平方和为：

??β?)]'[u??β?)]?u??β?)'X'X(β??β?)?u?'u??[u??X(β??X(β?'u??(β?'u? 1.65 u由（2.71）式，

??β???(X'X)?1R'[R(X'X)?1R']?1(Rβ??q) 1.66 β??β?)'X'X(β??β?)?[(Rβ??q)'][R(X'X)?1R']?1(Rβ??q) 1.67 (β故而可得无约束模型与受约束模型的残差平方和的差为：

??q)'[R(X'X)?1R']?1(Rβ??q) 1.68 ?'u??u?'u??(Rβ u检验统计量为：

??q)'[R(X'X)?1R']?1(Rβ??q)/J?'u??u?'u?)/J(Rβ(R2?RU2)/J(u 1.69 F????'u?/(N?K)?'u?/(N?K)uu(1?R2)/(N?K)判别方法与整个方程的显著性检验相同。 1.3.7

（非）线性约束的Wald检验

对于一般的参数约束（包括线性约束和非线性约束）的检验的另外一种常见的方法是Wald检验。原假设为：

H0：c(β)?q Wald检验统计量为

?)?q]'var[c(β?)?q]wald?[c(β???1?)?q] 1.70 [c(β根据Delta方法（参见附录：概率统计），

?)?q]?C(β?)var(β?)C(β?)'，其中，C(β?)??c(β?)/?β?' 1.71 var[c(β因此，Wald统计量又可以写为：

?)?q]'C(β?)var(β?)C(β?)'wald?[c(β???1?)?q] 1.72 [c(β结论：如果原假设成立，则Wald统计量渐进服从J个自由度的卡方分布，J表示约束条件的个数。

如果参数约束为线性形式，即H0：c(β)?q?Rβ?q?0。则

?)??c(β?)/?β?'?R C(β?)?q]?Rvar(β?)R' var[c(β因此，Wald统计量为

??q]'Rvar(β?)R'wald?[Rβ???1??q] [Rβ事实上，F统计量与Wald统计量之间的关系是渐进等价的。

??q)'[R(X'X)?1R']?1(Rβ??q)/J(RβF??'u?/(N?K)u

2?1?1??(Rβ?q)'[?R(X'X)R'](Rβ?q)??2/?2J??2??2，F与由Plim?W*?1???q) (Rβ?q)'[?2R(X'X)?1R']?1(RβJ具有相同的极限分布。

??q]?Rvar(β?)R'?R?2(X'X)?1R'，因此，JW*正是Wald统而Wald统计量中var[Rβ计量。也就是说，JF与Wald统计量都渐进服从J个自由度的卡方分布。

例 1.7 在消费模型：const = ?0+ ?1 inct + ?2 const-1 + ut中，长期边际消费倾向MPC=?1/(1-?2)，利用数据估计模型，并检验MPC>1；

H0：MPC≥1；H1：MPC<1

约束形式为：c(β)??1/(1??2);q?1

?)??c(β?)/?β?'?[1/(1??),1/(1??)2]' C(β22Wald统计量为：

?)?q]??[c(β?/(1???)?1]?[1/(1???),??/(1???)]Cov(??,??)[1/(1???),??/(1???)]??[??)?q]'C(β?)var(β?)C(β?)'wald?[c(β1221?122212212?1?/(1???)?1][?12 . regress consp gdpp L.gdpp

. testnl _b[gdpp]*(1-_b[L.gdpp])=1 可得：F=105.45，拒绝原假设。

1.4 模型的设定分析

上面所分析的估计量的统计特征都是基于模型设定准确的前提。如果模型设定错误，那

么会直接影响到参数估计量的统计分布特征。这里，我们介绍两种情形，过度设定和欠设定。 1.4.1

过度设定

如果模型的解释变量中加入了本来与y不相关的变量xj，我们称之为过度设定(overspecify)。设真实DGP为

2y?Xβ0?u,???u~NIID(0,?0I)

但模型设定为：

y?Xβ?Zγ?u

根据FML定理，

??[X'MX]?1[X'My]?β?[X'MX]?1X'Mu βZZ0ZZ期望值和方差分别为：

?)?β E(β0?)?E?(X'MX)?1X'Muu'MX(X'MX)?1?Var(βZZZZ????????????????(X'MZX)20?1

?)??2(X'X)?1。由如果模型设定正确，即y?Xβ?u，则其估计量的方差为Var(β0X'X?X'MZX?X'(I?MZ)X?X'PZX?(PZX)'PZX

?)?Var(β?)。即模型中加入多余的变量，不会影响参数估计量的无偏性，但会可知，Var(β?)?Var(β?)。但在一般情况下，解释影响有效性。除非PZX?0，即X与Z正交，则Var(β变量会存在一定程度的相关。而且，加入的多余变量越多，则估计量的方差越大，越不准确。 1.4.2

欠设定

与过度设定相对应，如果把本来与y相关的变量排除在模型之外，那么我们称之为欠设定(underspecifying)。设真实DGP为

2y?Xβ0?Zγ0?u,???u~NIID(0,?0I)

模型设定为：

y?Xβ?u

OLS估计量的期望为

??(X'X)?1X'y?(X'X)?1X'(Xβ?Zγ?u)β00???β0?(X'X)?1X'Zγ0?(X'X)?1X'u?)?β?(X'X)?1X'ZγE(β00

参数估计量的偏差取决于两个因素，Z对X回归的系数以及Z对y的回归系数。Z对X的影响越大，或者Z对y的影响越大，都将导致参数估计量较大偏差。只有X'Z?0或γ0?0时，参数估计量才具有无偏性。

由于估计量是有偏的，用均方误差（Mean Squared Error）计算估计量的精确度。

?)?E?(β??MSE(β??β0)(β?β0)'??????????????????????=E??β?E(β)?E(β)?β0β?E(β)?E(β)?β0'?

????????????????????=E?β?E(β)β?E(β)'??E(β)?β0E(β)?β0'?)?E(β?)?βE(β?)?β'????????????=Var(β?????????????0??0?对于无偏估计量，均方误差等于方差。

?)?E?(β???MSE(β??β0)(β?β0)'???Var(β)

可以计算出，估计量的MSE为

?)??2(X'X)?1?(X'X)?1X'Zγγ'Z'X'(X'X)?1 MSE(β000相对于过度设定模型，欠设定模型的均方误差可能更有效、也可能非有效，取决于上述公式的第二部分的大小。

例 1.8 利用蒙特卡罗模拟考察模型过度设定与欠设定对参数估计量的影响。

假设DGP为y=10+2x1+5x2+u，其中，x1与x2的相关系数为0.6，u~NIID(0, 1)。模型1设定为y=?0+?1x1+?2x2+u，模型2设定为y=?0+?1x1+u，模型3设定为y=?0+?1x1+?2x2+?3x3+u。x1与x3的相关系数为0.1，x2与x3的相关系数为0.3。每次生成200个观测值，模拟1000次，观察模型1、2、3的参数估计量的分布。（程序文件：spec.ado）

. simulate under_b=(r(under_b)) under_se=(r(under_se)) c_b=(r(c_b)) c_se=(r(c_se)) over_b=(r(over_b)) over_se=(r(over_se)), reps(1000) nodots: spec

. twoway (kdensity under_b, lpattern(dot)) (kdensity c_b, lpattern(solid)) (kdensity over_b, lpattern(dash))

1.5

异常点检测

异常点是指对估计量具有较大影响的观测值，即如果删除某个观测值会引起估计量的较大变化。删除第i个观测值后，参数估计量为：

??(X'X)?1X'y β(?i)(?i)(?i)(?i)(?i)?1??β??(1?h)?1(X'X)?1Xu?可以等价地表述为：β(?i)iii。其中，hi?Xi(X'X)Xi'，即映射矩阵的

第i个对角元素，称为杠杆。因此，第i个观测值对估计量的影响取决于一个很关键的因素，即hi。hi介于[0，1]，且和为k+1。

?hi?Tr[X(X'X)?1X']?Tr[(X'X)?1X'X]?k?1

如果一个观测值具有较大的杠杆，则它对估计量具有较大的潜在影响。

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读，免费范文网，提供经典小说教育文库Chapter1 线性回归模型的OLS估计(4)在线全文阅读。

Chapter1 线性回归模型的OLS估计(4).doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档

本文链接：https://www.77cn.com.cn/wenku/jiaoyu/938723.html（转载请注明文章来源）

上一篇：2018-2024年中国液晶显示器行业深度调研报告（目录） - 图文
下一篇：MASTERCAM后处理的设置和参数修改