交互作用分析
一、交互作用的概念
简单地说,交互作用指当 两个因素都存在时,它们的作用大于(协同)或小于(拮抗)各自作用的和。
要理解交互作用首先要区 别于混杂作用。 混 杂作用
以吸烟(SMK)和饮酒(ALH)对收缩压(SBP)的影响为例,可以建立以下二个模 型: 模型1:SBP = β0+β
2’SMK
模型2:SBP = β0+β1ALH+β2SMK
假设从模型1估计的SMK的作用为β2’,从模型2估计的SMK的作用为β2。如吸烟与饮酒有关(假设吸烟者也 多饮酒),而且饮酒与血压有关,这时可以假想两种可能: 1. 吸烟与血压无关,但因为饮酒的原因,模型1中的β的作用后,SMK的作用β2将不显著。
而模型2’会显著,
2控制了ALH
2. 吸烟与血压有关,模型1中估计的SMK的作用β2’一部分归功于饮酒,模型2估计
的β2是控制了ALH的作用后SMK的作用,因此β2’不等于β2。 是不是β2不等于β混杂作用。
这 只是意味着β2’中有饮酒的2’ 就意味着有交互作用呢?不是的,
那么什么是交互作用呢?
根据吸烟与饮酒将研究对 象分成四组,各组SBP的均数可用下表表示:
不吸烟 吸烟 不饮酒 β0 β0+β2 饮酒 β0+ β1 β0+ β1+β2+β12 吸烟与饮酒对SBP的影响,有无交互作用反映在β12上,检验β12是否等于零就是检验吸烟与饮酒对SBP的影响有无交互作用。而上面的模型2是假设β12等于零所做的回归方程。
交互作用的理解看上去很 简单,但需要意识到的是交互作用的评价与作用的测量方法有关。以高血压发病率为例,看吸烟与饮酒对高血压发病率的影响就有两种情况。
I、相加模型:
不吸烟 吸烟
II、相乘模型:
不吸烟 吸烟 不饮酒 I0 I0*S 饮酒 I0*A I0*S*A*B 不饮酒 I0 I0+Is 饮酒 I0+ Ia I0+Ia+Is+Isa
相加模型检验Isa是否等于零,相乘模型检验B是否等于1,可以想象Isa等于零时B不一定等于1,因此会出现按不同的模型检验得出 的结论不同。在报告交互作用检验结果时,要清楚所用的是什么模型。一般的线性回归的回归系数直接反映应变量的变化,是相加模型,而Logistic回归的回归系数反映比值比的变化, 属相乘模型。 二、交互作用的检验
交互作用检验有两种方法,一是对交 互作用项回归系数的检验(Wald test),二是比较两个回归模 型,一个有交互作用项,另一个没有交互作用项,用似然比检验。本系统采用似然比检验(Log likelihood ratio test)方法。
如以吸烟与饮酒两个两分类变量为 例,可以形成回归方程: 方程1:F(Y)= β0+β1ALH+β2SMK+β
12SMK*ALH
计算该方程似然数(likelihood),似然数表示按得出的模型抽样, 获得所观察的样本的概率。它是一个很小的数,因此一般取对数表示,即Log likelihood,似然数可以简单地理解为拟合度。
如果我们假定吸烟与饮酒 无交互作用,β方程2:F(Y)= β0+β1ALH+β2SMK
如果方程1和方程2得到的似然数没有显著差别,表明β12是多余的,或者说β12与零无显著性差异,吸烟与饮酒对f(Y)无交互作用。反之,吸烟与饮酒对f(Y)有交互作用。
三、交互作用分 析
12等于零,则方程为:
交互作用分析也可以理解为,在分层 分析基础上对分层变量的不同层级水平上,危险因素对结果变量的作用的回归系数差异进行统计学检验。如上表中可以看出,在不吸烟组,饮酒的作用是β1,在吸烟组中饮酒的作用是β1+β12,如β12=0则表示饮酒的作用 在吸烟组与不吸烟组都一样。分析交互作用主要回答的问题是:有哪些因素影响危险因素(X)与结果变量(Y)的关系”?有没有效应修饰因子?参看
流行病学假设检
验的思路。
发现效应修饰因子对助于 我们进一步理解危险因素对结果变量的作用通路。 危险因素可以是连续性变 量,也可以是分类型变量。本系统多要分析的可能的效应修饰因子限于分类型变量。
系统将自动检测结局变量 的类型(如两分类变量、连续变量),再自动默认选择合适的回归模型(如Logistic回归或线性回归模型)。用户可以对 分布类型和联系函数自行定义。
用户可以定义表格输出格 式,包括要报告的结果、行列编排、小数点位置等。 如果危险因素是分类型变 量,系统将:
1. 列出危险因素与效应修饰因子的每种 层级组合(联合亚组),如危险因素分3
组,效应修饰因子分2组,联合亚组就有6组。
2. 如果结果是一个连续性的变量,统计 每个联合亚组内结果变量的均数与标准差;
如果结果是一个二分类的变量,统计频数(百分数)。
3. 运行两种回归模型: A 和 B
模型A 按联合亚组生成指示变量,放入模型 中(如有6个联合亚组,把一组作为参照组,放 入5个指示变量于模型中); ? 模型B不考虑危险因素与效应修饰因子的联 合,分别产生指示变量放入模型中,
如危险因素分3组,把一组作为参照,放入2个指示变量于模型中,效应修饰因子 分2组,一组为参照,放入一个指示变量 于模型中,共3个指示变量。
?
然后进行似然比检验比较模型A与模型B,报告P值,即交互作用的P值。
如果危险因素是连续性变 量,系统将:
1. 运行两种回归模型: A 和 B。
模型A 按效应修饰因子的每个层级产生危险 因素参数。如效应修饰因子为SMK分2组(吸烟与不吸烟),危险因素为BMI(体重指数),产生2个BMI(BMI1与BMI2),当SMK=0(不吸烟)时,BMI1=BMI, BMI2=0;当SMK=1(吸烟)时,BMI2=BMI, BMI1=0。把BMI1与BMI2同时放入模型中。 ? 模型B只有一个危险因素参数。
?
然后进行似然比检验比较模A与模型B,报告P值,即交互作用的P值。 系统将自动检测结局变量 的类型(如两分类变量、连续变量),再自动默认选择合适的回归模型(如Logistic回归或线性回归模型)。用户可以对 分布类型和联系函数自行定义。
用户可以定义表格输出格 式,包括要报告的结果、行列编排、小数点位置等。
例1:
输出结果:
交互作用检验
交互作用的 P值 吸烟 -> N 性别 = 男 否 是 合计
一秒肺活-0.05 (-0.06, -0.06 (-0.07, -0.06 (-0.07, 366 量 -0.04) <0.001 -0.05) <0.001 -0.05) <0.001 最大肺活-0.04 (-0.05, -0.05 (-0.06, -0.05 (-0.05, 366 量 -0.02) <0.001 -0.04) <0.001 -0.04) <0.001 性别 = 女 0.039 0.029 0.608 0.854 一秒肺活-0.03 (-0.04, -0.03 (-0.05, -0.03 (-0.04, 364 量 -0.02) <0.001 0.00) 0.030 -0.02) <0.001 最大肺活-0.03 (-0.04, -0.03 (-0.05, -0.03 (-0.04, 364 量 -0.02) <0.001 -0.01) 0.009 -0.02) <0.001 合计 一秒肺活-0.04 (-0.04, -0.06 (-0.07, -0.05 (-0.05, 730 量 -0.03) <0.001 -0.05) <0.001 -0.04) <0.001 最大肺活-0.03 (-0.04, -0.05 (-0.06, -0.04 (-0.04, 730 量 -0.02) <0.001 -0.04) <0.001 -0.03) <0.001 <0.001 <0.001 回归系数(95%可信区间) p 值 / 比值比/危险度比(95%可信区间) p 值 结局变量: 一秒肺活量 和 最大肺活量 危险因素: 年龄 分层变量: 性别
模型I: 调整变量: 文化程度, 饮酒, 职业 和 被动吸烟 分组合计 后的分析也调整了: 性别
交互作用 的 P值由对数似然比检验比较两个相嵌模 型得出
于 2012-05-08 使用《易侕统计》软件(www.empowerstats.com)和R软件生成。 例2:
输出结果:
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库交互作用分析在线全文阅读。
相关推荐: