当前位置：文档库 › SPSS学习系列22.方差分析

SPSS学习系列22.方差分析

22. 方差分析

一、方差分析原理

1. 方差分析概述

方差分析可用来研究多个分组的均值有无差异，其中分组是按影响因素的不同水平值组合进行划分的。

方差分析是对总变异进行分析。看总变异是由哪些部分组成的，这些部分间的关系如何。

方差分析，是用来检验两个或两个以上均值间差别显著性（影响观察结果的因素：原因变量（列变量）的个数大于2，或分组变量（行变量）的个数大于1）。一元时常用F检验（也称一元方差分析），多元时用多元方差分析（最常用Wilks’∧检验）。

方差分析可用于：

（1）完全随机设计（单因素）、随机区组设计（双因素）、析因设计、拉丁方设计和正交设计等资料；

（2）可对两因素间交互作用差异进行显著性检验；

（3）进行方差齐性检验。

要比较几组均值时，理论上抽得的几个样本，都假定来自正态总体，且有一个相同的方差，仅仅均值可以不相同。还需假定每一个观察值都由若干部分累加而成，也即总的效果可分成若干部分，而每一部分都有一个特定的含义，称之谓效应的可加性。所谓的方差是离均差平方和除以自由度，在方差分析中常简称为均方（Mean Square）。

2. 基本思想

基本思想是，将所有测量值上的总变异按照其变异的来源分解为多个部份，然后进行比较，评价由某种因素所引起的变异是否具有统计学意义。

根据效应的可加性，将总的离均差平方和分解成若干部分，每一部分都与某一种效应相对应，总自由度也被分成相应的各个部分，各部分的离均差平方除以各自的自由度得出各部分的均方，然后列出方差分析表算出F检验值，作出统计推断。

方差分析的关键是总离均差平方和的分解，分解越细致，各部分的含义就越明确，对各种效应的作用就越了解，统计推断就越准确。

效应项与试验设计或统计分析的目的有关，一般有：主效应（包括各种因素），交互影响项（因素间的多级交互影响），协变量（来自回归的变异项），等等。

当分析和确定了各个效应项S后，根据原始观察资料可计算出各个离均差平方和SS，再根据相应的自由度df，由公式MS=SS/df，求出均方MS，最后由相应的均方，求出各个变异项的F值，F值实际上是两个均方之比值，通常情况下，分母的均方是误差项的均方。

根据F值的分子、分母均方的自由度f1和f2，在确定显著性水平为α情况下，由F(f1, f2)临界值表查得单侧Fα界限值。当Fα，不拒绝原假设H0，说明不拒绝这个效应项的效应为0的原假设，也即这个效应项是可能对总变异没有实质影响的；若F>Fα则P值≤α，拒绝原假设H0，也即这个效应项是很可能对总变异有实质影响的。

3.方差分析的实验设计

为了确定方差分析表中各个有关效应项，需要在试验设计阶段就作出安排，再根据设计要求进行试验，得出原始观察值，按原来设计方案算出方差分析表中的各项。

在试验设计阶段通常需要考虑如下4个方面：

（1）研究的主要变量（因变量）

即试验所要观察的主要指标，一次试验时可以有多个观察指标，方差分析时也可以同时对多个因变量进行分析；

（2）因素和水平

试验的因素（factor）可以是品种、人员、方法、时间、地区等等，因素所处的状态叫水平（level）。在每一个因素下面可以分成若干水平。

例如，某工厂的原料来自4个不同地区，那么用不同地区的原料生产的产品质量是否一致呢？所要比较的地区就是因素，4个地区便是地区这一因素的4个水平。当某个主要因素的各个水平间的主要因

变量的均值呈现统计显著性时，必要时可作两两水平间的比较，称为均值间的两两比较。

（3）因素间的交互影响

多因素的试验设计，有时需要分析因素间的交互影响（interaction），2个因素间的交互影响称为一级交互影响（A×B）；3个因素间的交互影响称为二级交互影响（A×B×C）。

当交互影响项呈现统计不显著时，表明各个因素独立，当呈现统计显著时，就需要列出这个交互影响项的效应，以助于作出正确的统计推断。

二、单因素方差分析

1个因变量，1个影响因素：

总差异Y ij = 平均差异μ + 因素差异αi + 随机差异εij 例1比较4种品牌的胶合板的耐磨性，各抽取5个样品，相同转速磨损相同时间测得磨损深度（mm），如下：

比较4个品牌胶合板的耐磨性有无差异？

总差异Y ij= 平均磨损μ + 品牌差异αi + 随机差异εij

1. 【分析】——【一般线性模型】——【单变量】，打开“单变量”窗口，将变量“wear磨损深度”选入【因变量】框，“brand品牌”选入【固定因子】框；

2. 点【两两比较】，打开“观测均值的两两比较”子窗口，勾选【假定方差齐性】下的“LSD”、“S-N-K”，点【继续】；

3. 点【选项】，打开“选项”子窗口，勾选“描述统计”、“方差齐性检验”，点【继续】；

点【确定】，得到

描述性统计量

因变量: 磨损深度(mm)

地板品牌均值标准偏差N

A 2.4100 .11269 5

B 2.4040 .11760 5

C 2.0460 .11216 5

D 2.5720 .03271 5

总计 2.3580 .21771 20

给出每个品牌的均值、标准差、样本数。

方差齐性检验结果，P值=0.311>0.05, 故接受原假设H0：方差齐。

方差分析结果，“校正模型”是整个方差分析模型的检验，原假设H0：所有系数（μ, αi, εij）都=0；P值<0.001<0.05, 故拒绝原假设。

“截距”检验均值μ, 原假设H0：μ=0（即不考虑品牌时，平均磨损为0）；P值<0.001<0.05, 故拒绝原假设。

“brand”对因素品牌的检验，原假设H0：按因素水平值的各分组的因变量无差异，即品牌因素对磨损深度无影响；P值<0.001<0.05, 故拒绝原假设，即不同品牌的耐磨性有差异。

B列为各品牌均值与均值μ（截距）的差。

截距

参数对比

截距 1

[brand=A] .250

[brand=B] .250

[brand=C] .250

[brand=D] .250

此矩阵的缺省显示是相应的L

矩阵的转置。

基于III 型平方和。

估计常数项时使用的L矩阵，均为0.25即总样本的均值是按四种品牌等量混合的情况计算的。

brand