王保进 多变量分析 MANOVA -10

多变量方差分析(MANOVA )

第一节 基本原理

多变量方差分析(MANOVA)可以说是单变量方差分析(ANOVA)之扩大,目的也是在检验自变量不同处理水平或类别的样本在等距以上因变量的测量值的差异情形,或是诸如“样本在多个Y 变量上的得分(表现)不因X 变量的不同哦你个人有显著差异”的假设。但单变量方差分析一次仅处理一个因变量,而多变量方差分析则一次可以处理多个因变量。两种方法在因变量数目的不同,使得假设检验就有所不同,在ANOVA 是,检验k 个实验处理样本在一个因变量平均数差异的零假设为:

k μμμ=== 210:H

而在MANOVA 时,检验k 个实验处理样本在p 个因变量平均数差异的零假设为:

?????????????

?==??????????????=??????????????=pk k

k p p μμμμμμμμμ 2122212121110H

有关ANOVA 的基本原理,读者可以参阅王保进(2001),至于MANOVA 的基本原理,以下分别说明。

一、基本假设

在进行ANOVA 时,必须符合包括:

① 观测值要独立(independence );

② 样本所来自的总体在因变量上的概率分布呈正态分布(normality );

③ 方差齐性(homogeneity of variance )等三个基本假设,分析结果才具有效度。同样的,在进行MANOVA 时,也必须符合下列三个基本假设:

(一) 独立性

所谓独立性是指总体中各样本在因变量上的测量值应该要彼此独立,没有相关存在。违反独立性的假设最常出现在时间系列(time series )的纵贯性调查中,或是一群具有相同背景条件(例如同样处在噪音的环境中)的观测值,以致对某些因变量测量表现出相似的反应(Hair et al., 1998;Stevens, 1992)。违反独立性的假设是MANOVA 中最严重,也是最应该避免的假设,因此研究者应该尽可能的加以检验并做必要的校正,唯目前对违反独立性假设的检验还缺乏一致性的检验方法。当出现观测值分数彼此相关时,可行的校正方法是以平均数来代替一群具相同北京条件的观测值分数,或是将该可能干扰源作为另一个自变量,进行区组设计(blocking design );当然,采取更小的α值(如0.01),也可以解决部分的问题。

(二) 正态性

在ANOVA 时,正态性的假设是指样本所来自的总体,在因变量上的概率分布呈正态分布.而MANOVA 的正态性假设,则是指样本所来自的总体在多个因变量上的概率分布呈多变量正态分布(multivariate normal distribution ),亦即两个以上的因变量的联合概率密度函数(joint probability density function)呈现正态分布.多变量正态分布几乎是所有多变量分析统计方法共同的基本假设,但目前仍缺乏一个有效的检验方法(Hair et al . , 1998;Tabachnick&Fidell,2001),一般都是对个别因变量分别进行正态性假设检验,若全部因变量均符合正态假设,则就算无法确定符合多变量正态分布的假设但造成之偏误在具鲁棒性(robustness) 的F 检验下,特别是采用大样本时,都可以不予以理会. (三) 方差协方差齐性

在ANOVA时,因为只处理一个因变量,所以只要来自同一整体的各实验处理组样本在因变量得分的方差具有齐性,即??????即可.但在MANOVA时,因为同时处理多个因变量,所以除了实验处理各组样本在各因变量得分的方差外,还可以计算各因变量间的协方差,因此MANOVA必须符合方差协方差齐性的假设.有关方差协方差齐性的假设最常用的检验方法就是Box(19540根据Bartlett-Box单变量齐性检验法所类化发展的检验方法,惟此一方法对正态性的假设相当敏感,因此在使用时必须先确定因变量符合正态性的假设.Stevens(1992)指出,Box检验法的结果近似卡方分布或F分布,当全部样本数大于20,因变量数在六个以下及实验处理数在六组以下时,以采用卡方分布检验值较为精确,其他情形则以F分布检验值较为可靠.

二假设检验步骤

MANOVA的假设检验的原理与ANOVA几乎是相一致,都必须先决定方差来源,然后计算每一个方差来源的方差量.不同的是,在ANOVA时,因为因变量只有一个,所以只要计算离均差平方和即可;但在MANOVA时,因为因变量在一个以上,因此除了离均查平方的计算外,也需计算因变量彼此间的交叉乘积(crosspruduct).为此,方差来源方差量的计算,就必须改以矩阵的方式来表示,亦即”离均查平方和交叉乘积(SSCP)矩阵”[有关SSCP的计算,请参阅王保进(2001)].以下根据自变量个数与实验处理组数的多寡,将MANOVA的假设检验方法分别说明如下.

第四节多组样本多变量平均数的显著性检验

王保进 多变量分析 MANOVA -10

由于Hotelling’s 检验只适用于两组样本的多变量平均数差异检验,若是碰到自变量分为三个处理

王保进 多变量分析 MANOVA -10

水平(组)或三组以上时,Hotelling’s 检验就不再适用,而必须改用多变量方差分析(MANOVA)的方

法,多变量方差分析根据研究者所操作自变量个数的多少,可以分为单因子(一个自变量)及多因子(两个以上自变量)MANOVA。虽说MANOVA不限制研究者选择自变量的个数,当自变量越多,则模型就变得越复杂,除了造成研究取样及操作的不方便外,当自变量间的效果有交互作用(interaction)产生时,解释也极为困难,因此一般在行为科学的研究中,自变量的个数通常不超过三个。本节就以实际的例子说明如何利用SPSS统计软件进行案例分析,并解释报表结果。

一、单因子MANOVA检验

SPSS窗口12.0版用来处理MANOVA的对话框是General Linear Model下的Multivariate指令对话框。以下以一个假设性资料为例2-2,说明如何利用Multivariate指令对话框,进行MANOVA检验。

例2-2(资料档为EX2-2.SAV)

王保进 多变量分析 MANOVA -10

(一)操作程序

根据例2-2,由于问题在检验三种不同社会发展程度(自变量)国家在七个社经发展指标上的差异情形,自变量共有三种类别,而因变量则是七种指标,因此可以进行单因子MANOVA。

原始资料如图2-12.

王保进 多变量分析 MANOVA -10

图2-12 例2-2的原始资料

进行MANOVA分析时,在数据档读进SPSS资料编辑窗口后,应开启分析(Analyze)菜单的General Linear Model 下的Mulitivariate 指令的对话框,并在来源变量清单中,点击七个因变量urban、lifeexpf、literacy、babymor、gdp_cap、aids_rt、he,并移至Dependent Variable的方格中,并将自变量group移至Fxed Factor 的方格中,如图2-13。

Hoc语句的按钮,开启对话框,点击事后比较方法(本例选择LSD及Ducan

王保进 多变量分析 MANOVA -10

法说明),再按2-13的对话框。最后,再点击图2-13中Options语句的按钮,开启其对话框,并点选其中的描述统计(Descriptive statistics)与齐性检验(Homogeneity test)等两个选项,再按

王保进 多变量分析 MANOVA -10

2-13的对话框。

王保进 多变量分析 MANOVA -10

完成上述界定工作后,使用者只要点击图2-13中的SPSS即会执行

王保进 多变量分析 MANOVA -10

图2-13 完成自变量与因变量界定的Multivariate 指令的对话框

单因子MANOVA 的统计分析,并自动开启结果输出窗口,将统计分析结果输出到窗口中。

综合上述操作程序,可将三种不同社会发展程度(自变量)国家在七个社经发展指标上差异性检验的MANOVA 检验的程序摘要如下:

Analyze

General Linear Model

Multivariate ……界定因变量与自变量 Post Hoc ……界定事后比较方法

Options ……点击输出描述统计量与齐性检验

王保进 多变量分析 MANOVA -10

(二)报表解释

当使用者点击按钮执行统计分析,则SPSS 会自动开启结果输出窗口,将统计分析结果输出到窗口中。例2-2执行的结果与报表解释如下:

王保进 多变量分析 MANOVA -10

王保进 多变量分析 MANOVA -10

SPSS所输出自变量“发展程度”的观测值个数统计,因数据档中已将编码值界定标签,因此在Value Label 一栏中,会分别输出自变量编码值的标签。其中1代表“欠发达国家”有8个,2代表“发展中国家”有28个,3代表“发达国家”有12个。

SPSS所输出不同社经发展程度国家在七个(因变量)的描述统计结果(见下表)。相关解释参见例2-2,此处不再赘述。值得注意的是“发达国家”在多个因变量的标准差都是最小,这是研究者可以解释或推测可能原因,以作为进一步研究的方向。

王保进 多变量分析 MANOVA -10

王保进 多变量分析 MANOVA -10

SPSS所输出的Box多变量方差齐性检验结果。由表可知,Box’s M值为251.994,p值为0.000,已达0.05显著性水平,表示自变量三组国家在七个因变量的方差违反齐性假设,此时若各组样本数差异过大,研究者应该进行校正工作,校正方法可参阅Stevens(1992)的著作。

王保进 多变量分析 MANOVA -10

SPSS所输出的单因子MANOVA显著性检验结果。由表可知,自变量的MANOVA四种统计检验量,P 值均小于0.05,已达显著水平,表示不同社会发展程度国家在七个因变量的平均数有显著差异。至于不同发展程度国家究竟在哪几个因变量的平均数有显著差异,则可以进行多组区别分析,或是单变量ANOVA,以找出三组样本在因变量上平均数的差异情形。由于例2-2共有七个因变量,因此应该进行七次单变量ANOVA,若ANOVA的检验结果F值大显著的因变量,则进一步进行事后比较。若使用者要另外利用分析(Analyze)菜单的Compare下的Means下的One-Way ANOVA指令进行,做法可参阅王保进(2001),此处不再赘述。

至于MANOVA指令也提供简要的ANOVA及事后比较大结果,说明如下。

王保进 多变量分析 MANOVA -10

SPSS所输出的单变量one-way ANOVA检验结果。由表可知,不同发展程度国家在七个变量平均数差异,除了在“每十万人口AIDS数”上F值为2.396,未达0.05显著水平外,其他六个因变量的F值均已达显著水平,因此需进一步进行事后比较。至于其他报表的解释,请参阅2-1。

王保进 多变量分析 MANOVA -10

SPSS所输出的LSD事后比较检验结果。事后比较是采两两配对的方式,因此表的第一列就是自变量各组的编码值,第二列是两组平均数的差量,第三列是标准误,第四列则是显著

水平,最后一列则是95%置信区间估计值。以LSD法第一行为例,是比较第一组(欠发达国家)与第二组(发展中国家)间平均数的差异,两组平均数之差为-26.05(参见描述统计部分报表可计算出),已达到0.001的显著水平,表示两组国家在因变量“都市化程度”的平均数有显著差异。当然,利用95%置信区间估计值也可以看出两组平均数是否达显著差异,若置信区间值未包含0这个点,表示两组样本平均数达显著差异;反之,若置信区间值包含0这个点,表示两组样本平均数未达显著差异。

王保进 多变量分析 MANOVA -10

SPSS所输出不同社经发展程度国家在因变量“都市化程度”的Duncan法事后比较结果。此种事后比较的呈现方式是每一个因变量分别呈现,且格式与上一个报表中的LSD法并不相同,第一列是自变量各组的编码值,第二列则是各组之样本数,最后各列则是事后比较的结果。由表可知,第一组(欠发达国家)共8个、第二组(发展中国家)为28个、第三组(发达国家)为12个国家。至于各列事后比较结果的解释,若任两组的平均数位在同一列,则表示两组平均数间并无显著差异;反之,若两组的平均数位在不同的列,则表示两组平均数间有显著差异。由表可知,本例中三组样本的平均数都位在不同的列,表示任两组的配对比较均达到显著水平;即各组间的平均数均有显著差异。

至于其他五个F值达显著差异因变量的Duncan法事后比较结果,为节省篇幅,以下不再呈现。

相关推荐
相关主题
热门推荐