77范文网 - 专业文章范例文档资料分享平台

Chapter1 线性回归模型的OLS估计(4)

来源:网络收集 时间:2020-04-14 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

??β)R'??2R(X'X)?1R' var(v)?Rvar(β根据结论:如果n维随机向量x~N(μ,Σ),则(x?μ)'Σ?1(x?μ)~?2(n),可得w~?(2J)。

?的函数,而u?与u?的函数。前文已经证明,β?是独立的。因此,w与?'u?/?2是uw是β?'u?/?2也相互独立。 u??q)'[?2R(X'X)?1R']?1(Rβ??q)/J(Rβ综上所述,F?~F(J,N?K)。

?'u?/?2)/(N?K)(u检验步骤如下。

Step1:根据上式计算F统计量。

Step2:根据对应自由度的F分布查临界值Fcrit。

Step3:如果F>Fcrit,则拒绝原假设;否则,接受原假设。

实际上,前面的整个方程的显著性检验、部分参数的联合显著性检验、单个参数的显著性检验都是线性约束检验的特殊形式。比如,在模型

lwage = ?0 + ?1 exper + ?2 educ + u 检验?1=0,即?010???0检验?1=?2=0,即

?1?2?'?0

?010??001???0???1?2?'???

0???0?检验?1=?2,即?01?1???0?1?2?'?0

1个自由度的t分布的平方为1个自由度的卡方分布,因此如果只有一个约束时,F~F(`1,N?K)?t(2N?K)。因此,对于参数关系的单个约束也可以利用t检验来完成。

例 1.6教育(educ)和工作时间(tenure)的对工资的影响相同,即检验:?1=?2。

. test educ=tenure

工龄(exper)对工资没有影响,即检验:?3=0。 . test exper

对上面两个假设进行联合检验,即检验:?1=?2,?3=0。 . test educ=tenure exper

说明:与整个方程的显著性相类似,线性约束的F统计量也是通过比较受约束模型与无约束模型的残差平方和来构建。 无约束模型:y?Xβ?u

t???Rβ?q 受约束模型:y?Xβ?u,???s..对于受约束模型的OLS估计,最小化残差平方和

?,λ)?(y?Xβ?)'(y?Xβ?)?2λ'(Rβ??q) 1.61 L(β?,λ)?L(β?)?2R'λ?0??2X(y?Xβ??β 1.62

??L(β,λ)??q)?0?2(Rβ?λ利用分块矩阵求解,可得:

??β??(X'X)?1R'[R(X'X)?1R']?1(Rβ??q)β 1.63

?1?1?λ?R'[R(X'X)R'](Rβ?q)残差项为:

??(y?Xβ?)?(Xβ??Xβ?)?u??β?) 1.64 ??y?Xβ??X(βu受约束模型的残差平方和为:

??β?)]'[u??β?)]?u??β?)'X'X(β??β?)?u?'u??[u??X(β??X(β?'u??(β?'u? 1.65 u由(2.71)式,

??β???(X'X)?1R'[R(X'X)?1R']?1(Rβ??q) 1.66 β??β?)'X'X(β??β?)?[(Rβ??q)'][R(X'X)?1R']?1(Rβ??q) 1.67 (β故而可得无约束模型与受约束模型的残差平方和的差为:

??q)'[R(X'X)?1R']?1(Rβ??q) 1.68 ?'u??u?'u??(Rβ u检验统计量为:

??q)'[R(X'X)?1R']?1(Rβ??q)/J?'u??u?'u?)/J(Rβ(R2?RU2)/J(u 1.69 F????'u?/(N?K)?'u?/(N?K)uu(1?R2)/(N?K)判别方法与整个方程的显著性检验相同。 1.3.7

(非)线性约束的Wald检验

对于一般的参数约束(包括线性约束和非线性约束)的检验的另外一种常见的方法是Wald检验。原假设为:

H0:c(β)?q Wald检验统计量为

?)?q]'var[c(β?)?q]wald?[c(β???1?)?q] 1.70 [c(β根据Delta方法(参见附录:概率统计),

?)?q]?C(β?)var(β?)C(β?)',其中,C(β?)??c(β?)/?β?' 1.71 var[c(β因此,Wald统计量又可以写为:

?)?q]'C(β?)var(β?)C(β?)'wald?[c(β???1?)?q] 1.72 [c(β结论:如果原假设成立,则Wald统计量渐进服从J个自由度的卡方分布,J表示约束条件的个数。

如果参数约束为线性形式,即H0:c(β)?q?Rβ?q?0。则

?)??c(β?)/?β?'?R C(β?)?q]?Rvar(β?)R' var[c(β因此,Wald统计量为

??q]'Rvar(β?)R'wald?[Rβ???1??q] [Rβ事实上,F统计量与Wald统计量之间的关系是渐进等价的。

??q)'[R(X'X)?1R']?1(Rβ??q)/J(RβF??'u?/(N?K)u

2?1?1??(Rβ?q)'[?R(X'X)R'](Rβ?q)??2/?2J??2??2,F与 由Plim?W*?1???q) (Rβ?q)'[?2R(X'X)?1R']?1(RβJ具有相同的极限分布。

??q]?Rvar(β?)R'?R?2(X'X)?1R',因此,JW*正是Wald统而Wald统计量中var[Rβ计量。也就是说,JF与Wald统计量都渐进服从J个自由度的卡方分布。

例 1.7 在消费模型:const = ?0+ ?1 inct + ?2 const-1 + ut中,长期边际消费倾向MPC=?1/(1-?2),利用数据估计模型,并检验MPC>1;

H0:MPC≥1;H1:MPC<1

约束形式为:c(β)??1/(1??2);q?1

?)??c(β?)/?β?'?[1/(1??),1/(1??)2]' C(β22Wald统计量为:

?)?q]??[c(β?/(1???)?1]?[1/(1???),??/(1???)]Cov(??,??)[1/(1???),??/(1???)]??[??)?q]'C(β?)var(β?)C(β?)'wald?[c(β1221?122212212?1?/(1???)?1][?12 . regress consp gdpp L.gdpp

. testnl _b[gdpp]*(1-_b[L.gdpp])=1 可得:F=105.45,拒绝原假设。

1.4 模型的设定分析

上面所分析的估计量的统计特征都是基于模型设定准确的前提。如果模型设定错误,那

么会直接影响到参数估计量的统计分布特征。这里,我们介绍两种情形,过度设定和欠设定。 1.4.1

过度设定

如果模型的解释变量中加入了本来与y不相关的变量xj,我们称之为过度设定(overspecify)。设真实DGP为

2y?Xβ0?u,???u~NIID(0,?0I)

但模型设定为:

y?Xβ?Zγ?u

根据FML定理,

??[X'MX]?1[X'My]?β?[X'MX]?1X'Mu βZZ0ZZ期望值和方差分别为:

?)?β E(β0?)?E?(X'MX)?1X'Muu'MX(X'MX)?1?Var(βZZZZ????????????????(X'MZX)20?1

?)??2(X'X)?1。由 如果模型设定正确,即y?Xβ?u,则其估计量的方差为Var(β0X'X?X'MZX?X'(I?MZ)X?X'PZX?(PZX)'PZX

?)?Var(β?)。即模型中加入多余的变量,不会影响参数估计量的无偏性,但会可知,Var(β?)?Var(β?)。但在一般情况下,解释影响有效性。除非PZX?0,即X与Z正交,则Var(β变量会存在一定程度的相关。而且,加入的多余变量越多,则估计量的方差越大,越不准确。 1.4.2

欠设定

与过度设定相对应,如果把本来与y相关的变量排除在模型之外,那么我们称之为欠设定(underspecifying)。设真实DGP为

2y?Xβ0?Zγ0?u,???u~NIID(0,?0I)

模型设定为:

y?Xβ?u

OLS估计量的期望为

??(X'X)?1X'y?(X'X)?1X'(Xβ?Zγ?u)β00???β0?(X'X)?1X'Zγ0?(X'X)?1X'u?)?β?(X'X)?1X'ZγE(β00

参数估计量的偏差取决于两个因素,Z对X回归的系数以及Z对y的回归系数。Z对X的影响越大,或者Z对y的影响越大,都将导致参数估计量较大偏差。只有X'Z?0或γ0?0时,参数估计量才具有无偏性。

由于估计量是有偏的,用均方误差(Mean Squared Error)计算估计量的精确度。

?)?E?(β??MSE(β??β0)(β?β0)'??????????????????????=E??β?E(β)?E(β)?β0β?E(β)?E(β)?β0'?

????????????????????=E?β?E(β)β?E(β)'??E(β)?β0E(β)?β0'?)?E(β?)?βE(β?)?β'????????????=Var(β?????????????0??0?对于无偏估计量,均方误差等于方差。

?)?E?(β???MSE(β??β0)(β?β0)'???Var(β)

可以计算出,估计量的MSE为

?)??2(X'X)?1?(X'X)?1X'Zγγ'Z'X'(X'X)?1 MSE(β000相对于过度设定模型,欠设定模型的均方误差可能更有效、也可能非有效,取决于上述公式的第二部分的大小。

例 1.8 利用蒙特卡罗模拟考察模型过度设定与欠设定对参数估计量的影响。

假设DGP为y=10+2x1+5x2+u,其中,x1与x2的相关系数为0.6,u~NIID(0, 1)。模型1设定为y=?0+?1x1+?2x2+u,模型2设定为y=?0+?1x1+u,模型3设定为y=?0+?1x1+?2x2+?3x3+u。x1与x3的相关系数为0.1,x2与x3的相关系数为0.3。每次生成200个观测值,模拟1000次,观察模型1、2、3的参数估计量的分布。(程序文件:spec.ado)

. simulate under_b=(r(under_b)) under_se=(r(under_se)) c_b=(r(c_b)) c_se=(r(c_se)) over_b=(r(over_b)) over_se=(r(over_se)), reps(1000) nodots: spec

. twoway (kdensity under_b, lpattern(dot)) (kdensity c_b, lpattern(solid)) (kdensity over_b, lpattern(dash))

1.5

异常点检测

异常点是指对估计量具有较大影响的观测值,即如果删除某个观测值会引起估计量的较大变化。删除第i个观测值后,参数估计量为:

??(X'X)?1X'y β(?i)(?i)(?i)(?i)(?i)?1??β??(1?h)?1(X'X)?1Xu?可以等价地表述为:β(?i)iii。其中,hi?Xi(X'X)Xi',即映射矩阵的

第i个对角元素,称为杠杆。因此,第i个观测值对估计量的影响取决于一个很关键的因素,即hi。hi介于[0,1],且和为k+1。

?hi?Tr[X(X'X)?1X']?Tr[(X'X)?1X'X]?k?1

如果一个观测值具有较大的杠杆,则它对估计量具有较大的潜在影响。

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库Chapter1 线性回归模型的OLS估计(4)在线全文阅读。

Chapter1 线性回归模型的OLS估计(4).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/jiaoyu/938723.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: