l11??(X1i?X1)(X1i?X1)??(X1i?X1)2?0.08iil12??(X1i?X1)(X2i?X2)?0.03il21??(X2i?X2)(X1i?X1)?0.03i
il22??(X2i?X2)(X2i?X2)??(X2i?X2)2?0.277il10??(X1i?X1)(Yi?Y)?0.08il20??(X2i?X2)(Yi?Y)?0.21i
??0.03b??0.08??0.08b12????0.03b1?0.277b2?0.21 ∴正规方程为?或
???0.08??0.080.03??b1?0.030.277??????0.21??b2???????
(2) 求解正规方程和b0
???方程组求解结果为:b1?0.7461,b2?0.6769,代入4.3.39式后,得出
??1.3956b0。
(3) 建立模型
根据所求系数,预测模型为:
???1.3956?0.7461YX1?0.6769X2
当给定X1、X2,即给定劳动量和木材消耗量时,可预测木器生产的总成本。如
X1?4、X2?3时,总成本Y的预测值为:
???1.3956?0.7461?4?0.6769?3?3.7(千元)Y。
4.3.3.2 多元线性回归分析
多元线性回归分析是研究系统在多个因素的影响下,建立系统总体变化规律预测模型的方法。现在二元回归分析的基础上将其推广,即可得到多元线性回归分析的一般方法。
多元线性回归模型的一般形式是:
(4.3.43)
该方程是m+1维空间的一个超平面,所以它为Y对X的回归超平面方程。 由4.3.39式可知,如果当自变量数由两个增加到m个时,b0的求法可推广到:
?X?b?X???b?X?Y?bb0?Y?b??kXk1122mmk?1m??b?X?b?X???b?X??bY01122mm
(4.3.44)
正规方程组的系数,即L矩阵的元素Lkj为:
lkj??(Xki?Xk)(Xji?Xj)i?1m
正规方程的常数项,即L0向量为:
lk0??(Xki?Xk)(Yi?Y)i?1n
求解正规方程组,即可确定b1,b2,??,bm,代入4.3.45式,求出b0,从而得到预测模型:
??????b?X?b?X???b?X??bY01122mm
4.3.3.3 多元线性回归模型的检验
多元线性回归模型也和一元线性回归分析一样,需要检验模型的适用性。检验的基本思想是,首先对整个多元回归模型进行显著性检验。因多元线性回归分析中自变量的数量多,因此,在总的显著性分析的基础上,还需分析哪些因素对因变量的影响大,哪些因素影响小,哪些可以忽略不计,最后再确定它的区间估计值。
1 全相关系数 多元分析与一元分析相比,一元分析是多元分析在变量数为m=1时的特殊情况。因此,其分析的公式也有相似之处。
多元分析的平方和分解公式仍为
Lyy?U?Q(回归平方和与剩余平方和)
i其中:
经推导得:
??Y)2U??(Yi?lU??bkk0im;
?)2Q??(Yi?Yii
mk
(4.3.46)
?Q?Lyy?U?Lyy??lk0bk剩余标准差:
(4.3.47)
mQ1?)Sy??(Lyy??lk0bkn?m?1n?m?1k
(4.3.48)
相关系数:
(4.3.49)
这里R是衡量整个回归效果的数量指标,称全相关系数,其含意与一元线性回归分析中相关系数r完全一致。
2 回归显著性检验(用F检验)
QUR?1?R?LyyLyy,即
2???若回归无意义,即b1?b2???bm?0,
n?m?1R2F???F1??(m,n?m?1)2m1?R则:
否则:F?F1??(m,n?m?1)。
(4.3.50)
由此式可见当m=1时,就是一元线性回归时的公式4.3.17。
在整个回归显著的基础上,多元分析还必须对多元回归系数进行分析,也就是判断每个自变量与因变量的显著性。因为在多元回归分析中经常出现Y与自变量总体有相关关系,但Y与某个个别自变量Xi可能无关,也就是说,Xi对Y并不起作用或它的作用已被其它Xj所代替。进行这步分析可确定出对Y影响较大的因素和影响较小或没有影响的因素,以决定应该把哪些因素包含在预测模型中,把哪些因素从所确定的模型中
剔除,以便建立一个更简单、更适用、更方便的预测模型。
其检验采用t-检验法:
tk??bkCkk?Sy
(4.3.51)
?1其中:Ckk为正规方程系数矩阵L的逆矩阵L中对角线上的元素。如果:
tk?t1?a(n?m?1)2
则认为Xk对Y有作用,否则无作用,应予以剔除。
从多元线性回归模型中剔除某个影响不大的因素Xk(有时需要研究剔除某个影响
??比较大的因素),是在bk?0的假设下,由t检验确定的,但是决不能从预测模型中以bk?较小为理由简单地删除bkXk项。因为当剔除某一因素后,相当于从原始数据中去掉了这一因素所对应的所有数据,这必导致回归模型的变化,故需重新配合方程。为了避免复杂的计算,数理统计学为我们提供了一个不需重新配合方程的计算公式和算法。其算法如下:
设剔除因素之前的回归模型为:
??b?X?b?X???b?X??bY01122mm
剔除因素后,新回归模型为:
?*?b?*X?b?*X???b?*X?b?*X???b?*X??bY01122i?1i?1i?1i?1mm
则
?*?b??Cijb?bjjiCiij?1,2,?,m;j?i
j?i
?1其中:Cij为L矩阵中相应元素。
当因素剔除后,回归方程变成了新形式,回归平方和也发生了变化。我们把剔除某因素后,回归平方和所发生的变化叫偏回平方和。
?*?Y?bb??*jXj0原回归平方和
?lU??bkk0k,剔除因素后的回归平方和
?*lU???bkk0k?i,则剔除第i个
因素Xi的偏回归平方和为:Ui?U?U?。由数理统计学知:
?2bUi?U?U??kCii
(4.3.53)
由上述可知,回归平方和U体现出所有变量对Y的影响,而偏回归平方和Ui则体现出第i个因素单独对Y的影响。如果因素Xi对Y的影响大,则Ui大,反之则小。 公式4.3.52、4.3.53提供了在一次回归之后,重新进行回归计算的方便条件,可使计算工作大大简化。
在剔除因素得到新模型之后,再经过检验,直到所有剩下的因素都通过t检验为止,即可确定回归系数的区间估计。
其计算公式为:
dk?t1?a2(n?m?1)Ckk?Sy (4.3.54)
??区间为: (bk?dk,bk?dk)
(4.3.55)
?????在X1,X2,?,Xm给出确定值之后,根据Y?b0?b1X1?b2X2???bmXm可预测出Y
值,但尚需估计误差范围。一般采用剩余标准差Sy的二倍,即可保证??0.05的置信度。 故Y的估计误差为:2Sy,区间为:(Y?2Sy,Y?2Sy)。
现举例说明多元回归预测的方法和步骤。 某建筑公司认为平均造价与工程结构有关,现对13个建筑公司高层建筑造价进行调查得表4.3.5,现该公司准备根据该资料建立快速报价估算模型。
表4.3.5 工程编号 1 2 3 4 5 6 7 8 9 10 11 12 13 平均值 机械化施工 比重 (%) 10 11 21 1 1 3 2 7 1 11 11 7 11 7.462 主体结构工程量 比重 (%) 68 66 47 40 31 71 54 26 29 56 31 52 55 48.154 基础工程量 比重 (%) 8 9 4 23 22 17 18 6 15 8 8 6 9 117.69 装饰工程量 比重 (%) 12 12 26 34 44 6 22 60 52 20 47 33 22 30.000 平均造价 (万元) 109.4 113.3 115.9 83.8 72.5 102.7 93.1 78.5 74.3 104.3 87.6 95.9 109.2 95.423 设每千平方米的平均造价为Y,影响平均造价的因素为:机械化施工量的比重X1,主体结构工程量的比重X2,基础工程量的比重X3,装饰工程量的比重X4。 该公司平均造价预测模型的一般形式为:
??b?X?b?X?b?X?b?X??bY011223344
其模型建立过程为:
1、求L矩阵,建立正规方程组
根据
lki??(Xki?X)(Xji?Xj)i和
lk0??(Xki?Xk)(Yi?Y)i
251.08?372.62?290.00??415.23?775.96??251.08?22922905.69?166.54?3041.00?.95?????L?L0???372.62?166.54??618.23?492.3138.00?????.0038.003362.00?;.70? ??290.00?3041??2481得:
正规方程组为:
????415.23b1+251.08b2-372.62b3 -290b4=775.96
251.08b1+2905.69b2-166.54b3-3041.00b4=2292.95 -372.62b1-166.54b2+492.31b3 +38.00b4=-618.23 -290.00b1-3041.00b2 +38.00b3+3362.00b4=-2481.70
?????????????2、 求解正规方程组和求b0 求解结果为: ??1.5511b???b1,2?0.5101,b3?0.1019,b4??0.1441;
根据
??Y?bb??kXk0k,求得b0为:
???62.4062b0 3、 建立预测模型 预测模型为:
Y=62.4052+1.5511X1+0.5101X2+0.1019X3-0.1441X4 4、 回归显著性检验
?l?2667LYY??(Yi?Y)2?2715.76U??b.84kk0ik UR2?LYY为: R2=0.9824,R=0.9911, 全相关系数
采用F检验,求临界值F?和F。
F1??(m,n?m?1)?F0.95(4,8)?3.84
n?m?1R2F???111.3m1?R2,F>F?,故回归显著。
5、 各回归系数检验
剩余平方和Q和剩余标准差Sr为:
Q?LYY?U?47.92,
Sr?Q?2.447n?m?1。
L-1矩阵对角线上元素Ckk为:
C11=0.09276,C22=0.08761,C33=0.09526,C44=0.08408。 将上述数据代入4.3.51式:
??bb12t1??2.081t2??0.7043C22?SyC11?Sy,
??bb34t3??0.1349t4???0.2031C33?SyC44?Sy, 查t分布表,当??0.1时t0.95(n?m?1)?1.860,只有b1显著不为零。
6、 剔除因素
因ti中,t3=0.1349最小,故将X3剔除。按4.3.52式:
???b??C13b??1.4519b113C33???b??C23b??0.4161b223C33???b??C43b???0.2365b443C33???Y?b??X?71.6482b 故新回归方程(预测模型)为:
??71.6482?1.4519X?0.4161YX2?0.2365X4 1j?k0?jj?2bU3?3?0.1090C33偏回归平方和U3为: 新预测模型的回归平方和U??U?U3为:
可见X3的影响很小。如此可一直进行到所有因素均显著为止。但需注意的是每剔
U??2667.84?0.1090?2667.73
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库系统工程常用预测方法和模型(4)在线全文阅读。
相关推荐: