1、单因素方差分析:
是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。
例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。
单因素方差分析的第一步是明确观测变量和控制变量。例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。
单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=SSA+SSE。
单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给野散戚观测变量带来了显著影响。
单因素方差分析基本步骤:
提出原假设;选择检验统计量;计算检验统计量的观测值和概率P值;给定显著性水平,并作出决策。
2、双因素方差分析
双因素方差分析(Double factor variance analysis) 有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。
例如,若假定不同地区的消费者对某种品牌有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。这里介绍无交互作用的双因素方差分析。
双因素方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
3、多因素方差分析
多因素方差分析实质也采用了统计推断的方法,其基本步骤与假设检验完全一致 。
(1)提出原假设
多因素方差分析的第一步是明确观测颂陵变量和若干个控制变量,并在此基础上提出原假设。
多因素方差分析的原假设是:各控制变量不同水平下观测变量各总体的均值无显著性差异,控制变量各效应和交互作用效应同时为0,即控制变量和它们的交互作用没有对观测变量产生显著影响。
(2)观测变量方差的分解
在多因素方差分析中,观测变量取值的变动会受到三个方面的影响:第一,控制变量独立作用的影响,指单个控制变量独立作用对观测变量的影响;第二,控制变量交互作用的影响,指多个控制变量相互搭配后对观测变量产生的影响;
第三,随机因素的影响,主要指抽样误差带来的影响。基于上述原则,多因素方差分析将观测变量的总变差分解为(以两个控制变量为例):SST=SSA+SSB+SSAB+SSE。
其中,SST为观测变量的总变差;SSA、SSB分别为控制变量A、B独立作用引起的变差;SSAB为控制变量A、B两两交互作用引起的变差;SSE为随机因掘贺素引起的变差。通常称SSA+SSB+SSAB为主效应,SSAB为N向(N-WAY)交互效应,SSE为剩余。
(3)比较观测变量总离差平方和各部分所占的比例,计算检验统计量的观测值和相伴概率P值
多因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量以及控制变量的交互作用是否给观测变量带来了显著影响。
容易理解,在观测变量总离差平方和中,如果SSA所占比例较大,则说明控制变量A是引起观测变量变动的主要因素之一,观测变量的变动可以部分地由控制变量A来解释;反之,如果SSA所占比例较小,则说明控制变量A不是引起观测变量变动的主要因素,观测变量的变动无法通过控制变量A来解释。对SSB和SSAB同理。
在多因素方差分析中,控制变量可以进一步划分为固定效应和随机效应两种类型。其中,固定效应通常指控制变量的各个水平是可以严格控制的,它们给观测变量带来的影响是固定的;随机效应是指控制变量的各个水平无法作严格的控制,它们给观测变量带来的影响是随机的。一般来说,区分固定效应和随机效应比较困难。
由于这两种效应的存在,多因素方差分析模型也有固定效应模型和随机效应模型之分。这两种模型分解观测变量变差的方式是完全相同的,主要差别体现在检验统计量的构造方面。多因素方差分析采用的检验统计量仍为F统计量。如果有A、B两个控制变量,通常对应三个F检验统计量。
4.给定显著性水平,并做出决策
给定显著性水平,与检验统计量的相伴概率P值作比较。在固定效应模式中,如果FA的相伴概率P值小于或等于给定的显著性水平,则应拒绝原假设,认为控制变量A不同水平下观测变量各总体均值有显著差异,控制变量A的各个效应不同时为0,控制变量A的不同水平对观测变量产生了显著影响;
相反,如果FA的相伴概率P值大于给定的显著性水平,则不应拒绝原假设,认为控制变量A不同水平下观测变量各总体均值无显著差异,控制变量A的各个效应同时为0,控制变量A的不同水平对观测变量没有产生显著影响。对控制变量B和A、B交互作用的推断同理。在随机模型中,应首先对A、B的交互作用是否显著进行推断,然后再分别依次对A、B的效应进行检验。
参考资料来源:百度百科-方差分析
参考资料来源:百度百科-双因素方差分析
参考资料来源:百度百科-多因素方差分析