77范文网 - 专业文章范例文档资料分享平台

第八章 相关与回归分析(2)

来源:网络收集 时间:2019-03-15 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

8 66 69 1 1 0 9 68 74 2 5.5 -3.5 10 80 72 7 3.5 3.5 11 75 70 4 2 2 12 87 76 11.5 8 3.5 13 86 76 10 8 2 合计 — — — — — 6Σd2 6×125

ρ= 1 - ----------- = 1 - --------------- = 0.6566

22

n(n - 1) 13×(13 - 1)

说明甲乙两个组售货员对女皮鞋式样的意见有中等相关。

0 12.25 12.25 4 12.25 4 125.0 第三节 一元线性回归分析

一、回归分析(Regession Analysis)的概念

如果现象之间存在着相关关系,比如,变量X增长了,经常能发现变量Y也在增长,变量Y下降的时候,变量X也经常在下降(这表现的就是相关关系),这时,不管人们能否解释X和Y之间的逻辑关系或内在的确定性,他已经知道,可以在某种程度上利用这个规律。一个问题接踵而至——当X增加1%时,Y会增加多少?这就涉及了回归的问题。

“回归”一词不如“相关”一词更直观。Regession意为“衰退”,其最早是用于“特异现象向普通现象复原或倒退”意义上的“回归”,或者说,是“从特异回归到平常”。 ..高尔登(Francis Galton)依据不太精确的经验发现了一个现象:高个子的夫妇一般会生育较高个子的孩子,低个子的夫妇也会生育较低个子的孩子,但比父母更例外的后嗣较为少见。为了探讨这种遗传学问题,他在1885年进行了豌豆试验,以验证关于“个子”的猜想,结果如下:

表5-6 高尔登的香豌豆试验数据 单位:0.01英寸

代别 种子直径 18 上一代 15 16 17 19 20 21 16.下一代 15.4 15.7 16.0 16.6 17.0 17.3 3 小个子豌豆的下一代没那么小,大个子豌豆的下一代不是变得更大,而是比上一代较小些,高尔登称此为“回复变异”。他说:“回复变异是理想平均子型与父型有差异的趋势使回复到可以粗略地也许正确地称之平均祖先型。” ..........

回归分析法在后人手中发扬光大,现在已经成为重要的统计方法。它描述的是一个变量怎样地依赖于另一个变量,或者说,当一个变量发生一定的变动时,另一个变量将会发生怎样的数量变动。回归分析的目标是发现一个能充分解释所研究的事物关系的最简单和最实用的数学模型。

二、回归模型的建立

如果两个变量存在着相关关系,并且一个变量的变化会引起另一个变量的变化,则两个变量间的关系就可以拟合回归模型。本节介绍基本的回归分析方法——一元线性回归模型。

设有以下数据:

表5-7 某产品产量与单位产品成本资料 产品产量(千件) 289 298 316 321 322 327 329 42.9 42.1 39.6 39.1 37.5 38.5 329 38 331 350 单件成本(元) 43.5 38 37 先用上表资料绘制散点图:

4443单位产品成本(元)42414039383736280300320产品产量(千件)340360图5-2 产品产量与产品成本散点图对于这样一幅散点图,很容易看出有一种趋势,而且是直线趋势。但怎样确定这条直线才能使它对这10个点的概括最为准确?

设直线的方程式为 y (5.7)

式中x为自变量,在回归分析中,由于我们要观察的是因变量随自变量的变化而变化的程度,所以可以假定自变量是可控的,不是随机变量,通常是现象研究者事先选定的数值;a为估计直线在纵轴上的截距,它是估计直线通过纵轴

=

a

+

bx

点的y坐标;b为估计直线的斜率,它表示当x增加1个单位时y的平均增加数量;y为估计值。

这条直线的根本目的是要代表那10个散点,那么,代表性最强的直线应该是最恰当的直线。怎样才能做到代表性最强?衡量代表性的原理或原则是什么?要回答这个问题请先回忆一下算术平均数,几个变量值最有代表性的指标是算术平均数(数理统计可进行证明,日常生活经验也使我们相信平均数),它有一个数学性质:各变量值与算术平均数离差的平方和为最小,即 _ ∑(x-x)2 = (5.8)

min

从这个现象中,我们可以得到这样的结论:只有“离差平方和最小”的代表值才是最好的代表值——这成为判别一个回归方程是否准确的基本标准,该方法在统计学中叫做“最小平方法”或“最小二乘法”。得到如下表达式:

(5.9) 即

∑( y – a - bx )2 (5.10)

对a和b求偏导数,并令其为零,整理后得下列方程组: Σ(5.11)

Σxy = aΣx + bΣx2 解方程组得

Σy bΣx _ _

a = ---- - (5.12)

n n

nΣxy - ΣxΣy b = (5.13)

nΣx2 – (Σx)2

拟合回归直线。

表5-8 产品产量与单位成本回归模型计算表

序单位成本产品产量计算栏 y

=

na

+

b

=

(

y

y

)2

=

min

min

Σx

----- = y - bx

----------------

可求出式(5.7)中的a、b,并确定直线回归模型。现根据表5-7中资料

号 y (元) x (千件) 289 298 316 321 322 327 329 329 331 350 3212 xy 12571.5 12784.2 13303.6 12711.6 12590.2 12262.5 12666.5 12502.0 12578.0 12950.0 126920.1 x2 83521 88804 99856 103041 103684 106929 108241 108241 109561 121500 y2 1892.25 1840.41 1772.41 1568.16 1528.81 1406.25 1482.25 1444.00 1444.00 1369.00 1 2 3 4 5 6 7 8 9 10 合计

43.5 42.9 42.1 39.6 39.1 37.5 38.5 38.0 38.0 37.0 396.2 1034378 15747.54 将上表资料代入公式(5.13)和(5.14),解得:

nΣxy – ΣxΣy 10×126920.1 - 3212×396.2 -3393.4 b= ----------------= ----------------------------- = --------- = -0.11264

nΣx2 – (Σx)2 10×1034378 - 32122 26836

Σy bΣx 396.2 3212

a = ---- - ----- = ------- - (-0.1264)------ = 80.22 n n 10 10 得回归方程:

y = 80.22 - 0.1264x 图示如下:

单位产品成本(元)464442403836280300320340360产品产量(千件)图5-3 产品产量与产品成本散点图

三、估计标准误差

建立回归模型,理论基础是最小平方法,事实依据是若干对因变量、自变量的数值。而因变量、自变量的数值在绝大多数情况下都是样本值,虽然自变量是可控的,非随机的,但作为这一对数值却是随机的,与抽样指标相似,仍然存在着样本代表性的问题,同样需要计算这种随机数值的平均误差。其基本原理仍然是计算“离差平方和”(衡量算术平均数的代表性大小时使用此法,衡量抽样指标的代表性大小时延用此法),不同的是,这里的离差指的是实际值与估计值之间的离差。估计标准误差的计算公式为:

________________ / ∑( y – y )2

Sy = / (5.14)

√ n – 2

----------------

仍以表5-8数据为例,计算估计标准误差。

表5-9 产品产量与单位成本回归模型的估计标准误差计算表 序单位成本y2(元) 产品产量x(千件) y (y - y) 号 1 43.5 289 43.69 0.0361 2 42.9 298 42.55 0.1225 3 42.1 316 40.28 3.3124 4 39.6 321 39.65 0.0025 5 39.1 322 39.52 0.1764 6 37.5 327 38.89 1.9321 7 38.5 329 38.63 0.0169 8 38.0 329 38.63 0.3969 9 38.0 331 38.38 0.1444 10 37.0 350 35.98 1.0404 合计

将有关数据代入式(5.15),则回归模型的估计标准误差为 ________________ _________ / ∑( y – y )2 / 7.1806

Sy = / ---------------- = / --------- = 0.947 √ n – 2 √ 10 – 2

在利用式(5.15)计算估计标准误差时,计算很繁琐,可利用已知的a、b值来计算估计标准误差。其公式为:

____________________ / ∑y2 - a∑y - b∑xy

Sy = / (5.15)

396.2 3212 396.20 7.1806 --------------------

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库第八章 相关与回归分析(2)在线全文阅读。

第八章 相关与回归分析(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/521197.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: