Chapter1 线性回归模型的OLS估计

来源：网络收集时间：2020-04-14 下载这篇文档手机版

说明：文章内容仅供预览，部分内容可能不全，需要完整文档或者需要复制内容，请下载word后使用。下载word有问题请添加微信号:或QQ：处理（尽可能给您提供完整文档），感谢您的支持与谅解。

第1章线性回归模型

考察多个自变量对一个因变量的影响。比如，施肥量、土质与农业产量的关系，受教育年数、工龄、性别对收入的影响，警察数量、下岗职工对城市犯罪率的影响等。以双变量为例。x1、x2对y存在影响，同时x1和x2之间也存在相关关系。如图所示。

X1 y X2

1.1 模型设定

假定变量yt与k个变量xt j, j = 1, … , k，存在线性关系。多元线性回归模型表示为，

yt??0??1x1t????kxkt?ut 1.1

其中yt是被解释变量（因变量），xj t是解释变量（自变量），ut是随机误差项，?i, i = 0, 1, … , k是回归参数（通常未知）。这说明xj t, j = 1, … , k, 是yt的重要解释变量。ut代表其他影响yt变化的随机因素。

给定一个样本（yt , xt1, xt2 ,…, xt k），t = 1, 2, …, T，上述模型表示为，

?1x11?y1????1x12y2???????????????yT?(T?1)?1x1T?xj1?xk1???xj2?xk2????????xjT?xkT????0??u1??????u1????2? 1.2 ???????????k?uT?(T?1)??(k?1)?1T?(k?1)令

?1?y1????1y2 y???, X???????????1y?T?(T?1)?x11x12?x1T????xj1xj2?xjT????xk1??xk2?

???xkT??T?(k?1)??0??u1??????u21 β???, u???

????????????uT?(T?1)?k?(k?1?)1则(3.3) 式可以写为，

y = X? + u 1.3

1.2 参数估计

1.2.1 参数的点估计

1．最小二乘法（OLS）设残差平方和用Q表示，

?)'(y?Xβ?)?'u?=(y?y?)'(y?y?)?(y?XβQ=u?'X'y?y'Xβ??β?'X'Xβ? 1.4 ?y'y?β??β?'X'Xβ??y'y?2y'Xβ?'X'y是一个标量，所以有β?'X'y?y'Xβ?。求Q对β?'的一阶偏导数，并令其为上式中，因为β零，

?Q??0 1.5 ??2X'y?2X'Xβ??β化简得，

? X'y?X'Xβ假定1 解释变量之间线性无关。

Rank(X'X) = Rank(X) = K＋1 1.6

其中Rank(?)表示矩阵的秩。即解释变量之间彼此线性无关。

?，如果假定1成立，可以直接得到β的最小二乘估计量β??(X'X)?1X'y 1.7 β?表示y的拟合值，u?表示残差项。拟合值和残差项经常表示为另外一种??Xβ??y?Xβy形式：

??X?X'X???X'y?Py 1.8 y??y?y??y?Py?[I?X?X'X???X']yu????[I?X?X'X???X'](Xβ?u)????Xβ?u?Xβ?X?X'X???X'u????[I?X?X'X???X']u????Mu 1.9

其中，P?X?X'X???X'，称为映射矩阵。Py表示y对X回归的拟合值。M?I?X?X'X???X'，称为零化子矩阵。My表示y对X的残差项。因此，y总是可以表示为y=Py+My。

可以证明，P和M都是对称幂等矩阵，即 M = M '，P = P '

M2 = M ' M = M '，P 2 = P ' P = P ' 1.10

且有

PX=X， MX=0 1.11

M+P=I，PM=0

?)?0，即X'u?'X'u?'u??0。进而可得Y??β??0。即由正规方程组可得X'(y?Xβ(Py)'My?y'P'My?y'PMy?0

1.2.2 FML定理

接下来我们介绍OLS估计量的一个重要性质，即FML定理（Frisch and Waugh(1933)、Lovell (1963)）。这一定理体现了线性回归模型参数的经济含义。在虚拟变量等问题的处理中重要的应用。

将所有的解释变量拆分为两部分。模型表述为：

y?X1β1?X2β2?u 1.12

残差平方和为：

????Xβ?'(y?XβQ?(y?X1β11?X2β2)122)??Xβ????? 1.13 ?y'y?y'(X1β122)?(X1β1?X2β2)'(X1β1?X2β2)??Xβ????????y'y?y'(X1β122)?(β1'X1'X1β1?2β2'X2'X1β1?X2β2β2'X2')对应的正规方程组为：

??Q??X'Xβ??0???????????X1'y?2X1'X1β1122??β??1 1.14 ??Q???X'Xβ??0?????????X2'y?2X2'X2β2211????β2由（1）式可得：

??(X'X)?1X'y?(X'X)?1X'Xβ?β111111122 1.15

?)?(X'X)?1X'(y?Xβ11122??(X'X)?1X'y。即当X2与X1正交时，模型由此可以看出，如果X1'X2?0，则β1111y?X1β1?X2β2?u与y?X1β1?u的参数估计量是完全相同的。

将（2.21）式带入正规方程（2）可得到解：

???X'[I?X?X'X???X']X??1?X'[I?X?X'X???X']y?β211111111222??X2'M1X2??1?X2'M1y? 1.16

其中，M1表示X1的零化矩阵，根据零化矩阵的性质，

??(X'MX)?1(X'My)β212122?(X2'M1'M1X2)?1(X2'M1'M1y) 1.17 ?21'u?21)?1(u?21'u?y1)?(u?21?M1X2表示X2对X1回归的残差项，u?y1?M1y表示y对X1回归的残差项。其中，u由此得到如下定理。

Frisch-Waugh定理：y?X1β1?X2β2?u与M1y?(M1X2)β2?v得到相同的估计量和残差。即，y对X1、X2的回归方程中，X2的参数估计量等价于y对X1回归的残差项对X2对X1回归的残差项进行回归得到的参数估计量，二者的残差也是相同的。

这一定理表明，多元回归模型y?X1β1?X2β2?u中，回归参数β2体现了“排除”（partial out）X1影响后的“净”影响。因此，β2也称作“偏回归系数”，体现了X2对y的净影响，称之为“偏影响”（partial effect）。也正是由于回归参数β2体现了排除X1影响后的“净”影响，因

此把X1称作“控制变量”。也就是说，虽然实际经济环境中，我们几乎不能控制X1的变化。但在多元回归模型中，β2已经把X1的影响排除掉了，因此β2理解为“当其他条件不变的情况下”，X2对y的边际影响。

对于如下结构关系：

X1 X2 y

如果回归模型y??0??1x1??1x2?u，参数?1的估计量不会显著，因为将x2的影响排除后，x1对y不存在任何影响。 1.2.3

参数估计量的分布特征

设真实的DGP为

y = X?0 + u

其中，?0为真实的参数。如果模型设定准确的话，即

y = X? + u

我们来看参数估计量的统计特征。对于模型错误设定的情况，请参见本章“模型的设定分析”部分。

1．一致性

?。如果plimθ??θ，则称θ?具有一致性。一致性意味设模型的参数为θ，估计量为θnnn着随着样本量的增加，参数估计量可以无限接近真实参数，即估计量的分布为真实参数那一点。也就是说，随着样本量的增加，我们可以对真实参数作出越来越精确的推断。一致性是对参数估计量的最低要求。如果估计误差与样本量没有关系，那么很难建立真实参数与参数估计量之间的关系。

??(X'X)?1(X'y)?β?(X'X)?1(X'u)?β?(N?1X'X)?1(N?1X'u) 1.18 β由假定Rank(X)=K和大数定律，样本均值的概率极限等于总体均值，可得：

Plim(N?1X'X)?E(X'X)?APlim(NX'u)?E(X'u)?0?1 1.19

又由Slustky定理，Plim(N?1X'X)?1?A?1。由此可得

??β?A?10?β 1.20 Plimβ?的无偏性 2． β?的随机性来源于u的随机性，因此，将β?写为关于u的表达式。 β??(X'X)?1X'y?(X'X)?1X'(Xβ?u)?β?(X'X)?1X'u 1.21 β00?是随机向量u的线性组合。即β?的期望为：如果X为确定性变量，则β?)?β?E[(X'X)?1X'u]?β?(X'X)?1X'E(u)?0 1.22 E(β00?是?的线性无偏估计量。因此，β但将X做为确定性变量过于简单。大多数情况下，X与y一样，具有明显的随机特征。假定2 u关于X的条件期望为0。E[u|X]=0。假定2也称作X具有严格外生性。具有两个基本含义。

第一个含义是，u的无条件均值也为0。这一特征可以通过迭代期望公式直接导出。

E(u|X) = 0 ? E(u) = E[E(u| X)] = 0 1.23

第二个含义是，u与X以及X的任何函数正交，不相关。

E?g(X)u??E?E?g(X)u|X???E?g(X)E(u|X)??0 1.24

Cov(g(X), u) = E{[g(X)-E(g(X))][u- E(u)]}= E[(X-E(X))u] =E{ [g(X)-E(g(X))]u }= E{ g(X)u –E[g(X)u] } = E[g(X)u]- E[g(X)]E(u) = 0

当g(X)= X时，u与X正交，u与X不相关。

?的有效性 3． β假定3 随机误差项向量u是同方差、无序列相关的。即协方差矩阵为：

?100???22?0?0?

Var (u|X) = ? I = ? 1.27

?001???OLS估计量的方差矩阵为：

?|X)?E[(β??β)(β??β)'|X]Var(β00?????????????????E[(X'X)?1X'uu'X(X'X)?1|X]? 1.28 ??????????????????2(X'X)?1其中，? 2 (X 'X)-1第i行第j列的元素表示第i个参数估计量和和第j个参数估计量的协方差。当i=j时（即对角线上的元素），表示第i个（包括常数项）参数估计量的标准差。高斯马尔科夫定理：在假定1~3成立的条件下，OLS估计量是最有效的线性无偏估计

?|X)?var(β?|X)。 ?是OLS估计量，β?为其他无偏估计量，那么var(β量。即：设β?)?var(β?)。将线性回归模型中OLS估计量称之为最根据迭代期望公式，可以得到var(β

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读，免费范文网，提供经典小说教育文库Chapter1 线性回归模型的OLS估计在线全文阅读。

Chapter1 线性回归模型的OLS估计.doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档

本文链接：https://www.77cn.com.cn/wenku/jiaoyu/938723.html（转载请注明文章来源）

上一篇：2018-2024年中国液晶显示器行业深度调研报告（目录） - 图文
下一篇：MASTERCAM后处理的设置和参数修改