第一讲 普通最小二乘法的代数
一、 问题
y??0??1x??,假定y与x具有近似的线性关系:
其中?是随机误差项。我们对?0、?1这两个参数的值一无所知。我们的任务是利用样本数据去猜测?0、?1的取值。现在,我们手中就有一个样本容量为N的样本,其观测值是:(y1,x1),(y2,x2),...,(yN,xN)。问题是,如何利用该样本来猜测?0、?1的取值?
为了回答上述问题,我们可以首先画出这些观察值的散点图(横轴x,纵轴y)。既然y与x具有近似的线性关系,那么我们就在图中拟合一条直线:
????x。该直线是对y与x的真实关系的近似,???y01?,??分别是对?,?的猜测(估计)而?。问题是,如何0101?,以使我们的猜测看起来是合理的呢? ?与?确定?01笔记:
1、为什么要假定y与x的关系是y??0??1x??呢?一种合理的解释是,某一经济学理论认为x与y具有线性的因果关系。该理论在讨论x与y的关系时认为影响y的其他因素是不重要的,这些因素对y的影响即为模型中的误差项。
2、y??0??1x??被称为总体回归模型。由该模型有:
E(yx)??0??1x?E(?x)。既然?代表其他不重要因素对y
的影响,因此标准假定是:
E(?x)?0。故进而有:
,而E(yx)??0??1x,这被称为总体回归方程(函数)
????x相应地被称为样本回归方程。???由样本回归方程确定y01?与的y?被称为残差??。进而有:y是有差异的,y?y????x???,这被称为样本回归模型。 y??01
二、 两种思考方法
法一:
?1,y?2,...,y?N)?是N维空间的两(y1,y2,...,yN)?与(y?的选择应该是这两点的距离最短。这可以?与?点,?10归结为求解一个数学问题:
2????x)2 ?Min(y?y)?Min(y??iii01i??????NN?0,?1i?1?0,?1i?1?的方?与??i的定义,?i是残差?由于yi?y因此上述获得?10?的值应该使残差平方和最小。 ?与?法即是?01法二:
?i越近越好(最近距离是0)给定xi,看起来yi与y。?i是相当近的时候,然而,当你选择拟合直线使得yi与y?j的距离也许变远了,因此存在一个权衡。一种yj与y简单的权衡方式是,给定x1,x2,..,xN,拟合直线的选择
?2、y2与y?2、...、yN与y?N的距离的平均值应该使y1与y是最小的。距离是一个绝对值,数学处理较为麻烦,
因此,我们把第二种思考方法转化求解数学问题:
2????x)2/N ?Min(y?y)/N?Min(y??iii01i??????NN?0,?1i?1?0,?1i?1?的值?与?由于N为常数,因此法一与法二对于求解?10是无差异的。
三、 求解
????x)2,利用一阶条件,有:定义Q??(yi?? 01ii?1N?Q????x)(?1)?0??2(yi??01i???0????x)?0?(y???i01i(1)
???i?0由(1)也有:
????x y??011在这里y?N笔记:
1Nyi、x??xi ?Ni?1i?1N????这表明:1、样本回归函数y0?x过点(x,y),即穿过??1??y(你能证明吗?)数据集的中心位置;2、y,这意味着,尽
?、??的取值不能保证y?、??的取值能够保证y??i?yi,管?但?0101的平均值与y的平均值相等;3、虽然不能保证每一个残差都为
?、??作0,但我们可以保证残差的平均值为0。从直觉上看,?01为对?0、?1的一个良好的猜测,它们应该满足这样的性质。
?Q????x)(?x)?0??2(yi??01ii???1????x)x?0?(y???i01ii(2)
???x笔记:
ii?0对于简单线性回归模型:y??0??1x??,在OLS法下,由正规方程(1)可知,残差之和为零【注意:只有拟合直线带有截距时才存在正规方程(1)】。由正规方程(2),并结合正规方程(1)有:
???x?0??(?????)xiii见练习(1)提示i??(?????)(x?x)?0ii?,x)?0?Cov(?无论用何种估计方法,我们都希望残差所包含的信息价值很小,如果残差还含有大量的信息价值,那么该估计方法是需要改进的!对模型y??0??1x??利用OLS,我们能保证(1):残差均值为零;(2)残差与解释变量x不相关【一个变量与另一个变量相关是一个重要的信息】。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库计量经济学讲义第一讲(共十讲)在线全文阅读。
相关推荐: