文档库 最新最全的文档下载
当前位置:文档库 › 多因子方差分析与正交试验设计原理

多因子方差分析与正交试验设计原理

多因子方差分析与正交试验设计原理
多因子方差分析与正交试验设计原理

CH3. 多因子方差分析与正交试验设计原理

3.1多因子方差分析

在前两章中我们讨论了单因子方差分析模型和完全平衡的(包括有、无重复)双因子方差分析模型。在这两种模型中,试验数据的统计分析有以下两大优点:1) 因子水平(或水平组合)参数的估计有简单的表达形式;

2) 因子效应(包括主效应和交互效应)和随机误差效应可以用平方和分解的方法进行分离,进而用F统计量进行检验。

在此我们要指出两种模型的一个重要区别:对单因子方差分析模型,我们不要求在每个水平上的试验次数相同;而对双因子方差分析模型,在每对因子水平组合上,试验的平衡性(即等重复性)是一个重要条件,不然的话,平方和分解公式就不成立,这样在方差分析时就会产生一定的困难。在多因子试验中也有同样的问题。因此,我们只考虑平衡的多因子试验。

双因子试验的方差分析模型中所包含的统计思想和方法可以一般地推广到多因子试验的场合。以三因子模型为例,设有三个因子对响应变量有影响,分别记为A、B、C,它们的水平数分别为I、J、K。全面地考虑,这三个因子对响应变量的影响可以分成以下三种:

1) 各因子的主效应,即单个因子的不同水平对响应变量产生的影响;

2) 一阶交互效应(双因子交互效应),即在扣除主效应的影响之后,任意两个因子的不同水平组合(AB、AC、BC)对响应变量产生的联合影响;

3) 二阶交互效应(三因子交互效应),即在扣除主效应和一阶交互效应的影响之后,三个因子的不同水平组合(ABC)对响应变量产生的联合影响。

与双因子的情况类似,如果在三个因子的每个水平组合上作相同的L次试验,则当L>1(有重复)时,可以用全模型(即包含全部上述三种效应的模型)进行方差分析;而当L=1(无重复)时,二阶交互效应无法分析,而只能分析主效应和一阶交互效应。读者可以仿照上一节中的作法,对这两种情况下三个因子方差分析的全部过程列出结果(模型、平方和分解、自由度、F统计量,等等)。进而可以考虑四因子、五因子、乃至一般m个因子的情况。无论有多少个因子,如果在所有因子的每个水平组合上都作至少一次试验,则试验是完全的。为便于进行方差分析,试验应该是等重复的。为能够分析最高阶(m-1阶)交互效应,试验应该是有重复的(重复数大于1)。

3.2 正交试验设计原理

虽然我们在理论上可以容易地将双因子方差分析的模型和方法推广到多因子方差分析的情况,但是,在实践中,作多个因子的完全试验会有实际的困难,因为完

全试验所要求的试验次数太多,乃至无法实现。例如,假定要考虑五个三水平因子,则完全试验(重复数为1)要求作35=243次试验;假如再加一个四水平因子,则完全试验(同样重复数为1)要作972次试验。如果要能够分析全部交互效应,同时还能够作平方和分解,则试验次数还需加倍!显然,如此大的试验次数在实际中几乎是无法实施的。如何解决这个困难呢?我们先提出如下的思路供思考。

在对一个因子试验所建立的线性模型中,独立参数(总均值、主效应、交互效应等)的个数k与试验次数n之间有下面的关系:当n>k时,有足够的自由度k来估计参数,同时还有剩余自由度来估计误差的方差(n-k>0);当n=k时,有足够的自由度来估计参数,但是没有剩余自由度来估计误差的方差n-k=0;当nk)。对这样一个思路,我们不想在此作理论上的论证,读者可以结合双因子试验中有重复和无重复的两种情况来领会。在双因子有重复试验中,试验次数大于交互效应模型中独立参数的总数,因此有剩余的自由度来估计误差方差;而在双因子无重复试验中,试验次数等于交互效应模型中独立参数的总数,因此没有剩余自由度来估计误差方差。此时,要估计误差就只能用可加效应模型。

根据上述的思路,只要试验总次数$N$大于独立参数的个数$M$就可以有足够的自由度来估计参数,同时还有剩余的自由度来估计误差方差,进而作假设检验。这是因子试验设计中要考虑的第一件事。

第二件事是要使参数估计和检验统计量有好的性质和形式,关键是要使各组效应的参数估计之间相互独立,同时使相应的平方和之间相互独立。但是,在一个线性模型中,参数(主效应及各种交互效应)的数目是由实际问题本身决定的,而不是由人主观决定的。在大量的因子试验的实践中,人们发现:在很多情况下,因子之间只有主效应,至多存在某些一阶交互效应(即两因子的交互效应)。高阶交互效应在很多情况下是不存在的。在这种情况下,多因子试验的模型中包含的参数实际上并不多,可能远远少于全模型的参数。比如有6个二水平因子,如果考虑所有可能的交互作用就有26=64个独立参数(包括总均值),但是如果只考虑主效应则只有6+1=7个独立参数。因此对6个二水平因子的可加效应模型,理论上只需作8次试验就可以有多余的自由度来估计误差方差。

如何安排试验,使得上述的两个想法很好地实现呢?从双因子无重复试验的可加模型的分析中得到启示。在这个模型中,由于两个因子的所有水平组合都作了相同次试验(一次),因此两组因子主效应的参数估计不仅有简单的形式,而且还是相互独立的,因而平方和之间也是相互独立的。因此,对于多因子试验的无交互效应模型(只考虑主效应),如果我们能如此安排试验,使得对任何一对因子,它们的所有水平组合都作了相同次试验,则对任何一对因子,两组因子主效应的参数估计和平方和也应具有上述性质。进而,如果试验的总次数n超过参数的总个数k,则还有多余的自由度来估计误差,进行方差分析。实际上,这就是“正交因子设计”原理的基本思路。

下面我们先来研究一个实例。

例3.2.1

假定在一个农业试验中要考察三个小麦品种、三种不同的肥料和三种播种方式对小麦产量的影响,并假定有九个地力基本相同的试验小区。在这个问题中有三个可能影响小麦产量的因子:品种、肥料和播种方式,每个因子有三个水平。如果要作完全试验就需要3×3×3=27个小区。而实际上总共只有9个小区。显然,完全试验在当前的情况下行不通。因此我们退一步考虑,按照上述的想法,要求品种、肥料和播种方式中的任意两个(品种与肥料、品种与播种方式、肥料与播种方式)的不同水平的搭配都出现一次。这样的试验设计存在吗?对此,答案是肯定的。表

4.3.1就是这样一个试验的设计表。

表3.2.1 三个三水平因子9次试验的正交试验设计表

试验序号品种肥料播种方式

1234

5

6

7

8

91112223331231231231

2

3

231312

按照这张表来安排试验的方法如下:

表的每一行代表一次试验,第一列为试验的编号,后三列每一列代表一个因子。表中的元素1、2、3分别表示相应因子的第一、二、三水平。按照这个规定,容易安排试验。例如,表的第1行为(1,1,1),相应地,在序号1的试验中每个因子都取1水平。又例如,表的第5行为(2,2,3),相应在序号5的试验中安排第一因子的2水平,第二因子的2水平,第三因子的3水平,等等。仔细观察表

3.2.1的结构,不难看出按照这个表来安排试验就满足我们前面提到的要求。具体地说,表中任意两列的1、2、3的9种不同组合出现相同次数(各1次)。

满足这种性质的试验就是“正交试验”。假定因子对小麦单产的影响满足可加效应模型(只有主效应,而没有一阶和二阶交互效应),对上述的试验安排我们建立如下的模型。记y i 为第i 次试验中小麦单产(公斤/亩),并记j α为品种因子的第j 水平对小麦单产的影响,j β为肥料因子的第j 水平对小麦单产的影响,j γ为播种方式因子的j 水平对小麦单产的影响,j =1,2,3。根据表3.2.1容易写出这个模型如下:

y 1=μ +α1 +β 1 +γ 1 + e 1

y 2=μ +α1 +β 2 +γ 2 + e 2

y 3=μ +α1 +β 3 +γ 3 + e 3

y 4=μ +α2 +β 1 +γ 2 + e 4

y 5=μ

+α2 +β 2 +γ 3

+ e 5y 6=μ

+α2 +β 3 +γ 1 + e 6y 7=μ

+α3 +β 1 +γ 3 + e 7y 8=μ

+α3 +β 2 +γ

1 + e 8

y 9=μ +α3 +β 3 +γ2 + e 9其中e i , i =1,… ,9为独立、),0(2σN 分布的随机误差;μ为总均值。如同在全面试验的方差分析模型中的作法一样,假定模型中的参数满足下面的约束条件:

α1 +α2 +α3 =0,

β 1 +β 2 +β 3 =0,

γ 1 +γ 2 + γ 3 =0.

在上述模型和约束条件下,我们来分析各组效应。先考虑参数估计。总均值μ的估计为样本均值:

μ?=?y =∑=919

1i i y 这是μ的无偏估计,因为在总共9次试验值的期望中都有μ,且所有主效应参数各出现3次,根据上面的约束条件可以验证E (μ?)=μ。再考虑因子主效应的估计,以β 1 ,β 2 ,β3的估计为例。在表3.2.1中的第2列上,元素1,4,7为1,元素2,5,8为2,元素3,6,9为3。据此可以得到β 1 ,β 2 ,β3的估计为

β?1=??++y y y y )(3

1741β?2=??++y y y y )(3

1852β?3=??++y y y y )(31963根据上面的约束条件可以验证E (β

?j )= βj , j =1,2,3. 因此是无偏估计。不难看出,这个结果得益于设计的 “正交性”。上述估计方法可以概括如下:某个因子第j水平的参数估计是该因子第j水平所对应的yi的算术平均减去总平均?y 。容易根据此方法构造其它参数的估计。 可以证明:对于这样的设计,三组主效应的参数估计之间是相互独立的。

得到参数估计之后,为检验因子效应的显著性,还要进行方差分析。总平方和为

SST =∑=??9

12)(i i y y ,SST 的自由度为f SST =9-1=8。

因子效应的平方和分别为

SSA =3∑=312?j j α,SSB =3∑=312?j j β,SSC =3∑=312?j j γ,

它们的自由度分别为3-1=2(水平数减1)。

残差平方和

SSE =SST -SSA -SSB -SSC ,

其自由度为8-3-3-3=2(SST 的自由度减去所有因子效应的自由度)。不难看出:

因子效应平方和=重复数×(参数估计)2

残差平方和=总平方和-(因子效应平方和的和)根据平方和与自由度的分解结果我们可以计算均方,进而构造F统计量,对三个因子的主效应是否显著进行检验。

上面我们用一个例子来说明了正交试验设计的基本特点和分析方法。下面给出一般性的陈述。考虑设计一个试验,安排m个因子,作n次试验,若它满足下面两个条件,则这个试验称为正交试验:

1)每一因子的不同水平在试验中出现相同次数(均衡性);

2)任意两因子的不同水平组合在试验中出现相同次数(正交性).

就定义来说,等重复的完全试验显然满足(4.3.4)中的条件,因此当然是正交试

验。但是,如果因子的水平数分别为t

1, t

2

,…, t

m

, 则完全试验至少要作N= t

1

,t

2

,…t

m

次试验,由于要求的试验次数太多,实际上很难实施。我们通常所说的正交试验设计是指既满足上述两条件,同时试验次数n又远远小于N的设计。

正交试验设计的方案可以用一张表来表示, 这张表就称为正交设计表. 表3.2.1就是一张正交设计表. 一般, 正交设计表第一行为表头, 标明每列所代表的因子, 最左一列标明试验的序号(并不表示试验的时间先后顺序, 先后顺序要按照随机化原则来安排), 由1到n. 表中每列中的数字代表相应因子的水平序号; 每行的数字代表在相应试验中各因子的水平序号. 在正交设计表中,

1)每列中不同数字出现的次数相同(试验的均衡性);

2)每两列中不同的数字组合出现的次数相同(试验的正交性).

这两条性质符合正交试验设计的定义.

假定因子对响应变量的影响无交互效应(许多实际情况正是这样),正交试验的优点是在很少的试验次数(与全面试验相比)中,所得数据可以简便而有效地对因子效应进行参数估计和方差分析。其方法可一般地归纳如下:

1)总均值的估计=试验数据的总平均值,

2)某因子的某个主效应的估计=该因子的该主效应所出现的试验数据的平均值-

总平均值,

3)总平方和=(试验数据-总平均值)的平方和, 自由度=n-1,

4)某因子的主效应平方和=重复数×参数估计的平方和, 自由度=水平数-1,

5) 残差平方和=总平方和-(因子效应平方和的和), 自由度=总平方和-(因子效应自由度的和).

正交试验设计及其方差分析

第三节正交试验设计及其方差分析 在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果. 1.正交试验设计的基本方法 正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表. 正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义: (1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2. 列数 ↓ L4 (23) ↑↑ 行数水平数 (2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个. 最多能安排的因素数 ↓ L4(23) ↑↑ 试验次数水平数 (3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的. L4(23) ↑↑ 实际试验数理论上的试验数 正交表的特点: (1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次. (2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,

正交试验方差分析(通俗易懂)

第十一章正交设计试验资料的方差分析 在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。 正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 第一节、正交设计原理和方法 (一) 正交设计的基本概念 正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。 例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、A3 3个水平; B因素是磷肥施用量,设B1、B2、B3 3个水平; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。 如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。 正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。 如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 一、正交设计的基本原理 表11-1 33试验的全面试验方案

正交试验方差分析(通俗易懂)

第十一章正交设计试验资料得方差分析 在实际工作中,常常需要同时考察3个或3个以上得试验因素,若进行全面试验,则试验得规模将很大,往往因试验条件得限制而难于实施。 正交设计就是安排多因素试验、寻求最优水平组合得一种高效率试验设计方法. 第一节、正交设计原理与方法 (一)正交设计得基本概念 正交设计就是利用正交表来安排多因素试验、分析试验结果得一种设计方法。它从多因素试验得全部水平组合中挑选部分有代表性得水平组合进行试验,通过对这部分试验结果得分析了解全面试验得情况,找出最优水平组合. 例如,研究氮、磷、钾肥施用量对某小麦品种产量得影响: A因素就是氮肥施用量,设A1、A2、A3 3个水平; B因素就是磷肥施用量,设B1、B2、B3 3个水平; C因素就是钾肥施用量,设C1、C2、C3 3个水平。 这就是一个3因素每个因素3水平得试验,各因素得水平之间全部可能得组合有27种。 如果进行全面试验,可以分析各因素得效应,交互作用,也可选出最优水平组合。 但全面试验包含得水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验得主要目得就是寻求最优水平组合,则可利用正交设计来安排试验. 正交设计得基本特点就是:用部分试验来代替全面试验,通过对部分试验结果得分析,了解全面试验得情况。 正交试验就是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用得混杂。 如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合得全面试验得情况,找出最佳得生产条件。 一、正交设计得基本原理 表11-1 33试验得全面试验方案

利用SPSS 进行方差分析以及正交试验设计

实验设计与分析课程论文 题目利用SPSS 软件进行方差分析和正交试验设计 学院 专业 年级 学号 姓名 2012年6月29日

一、SPSS 简介 SPSS 是世界上最早的统计分析软件,1984年SPSS 总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL 及DBF 数据文件,现已推广到多种各种操作系统的计算机上,它和SAS 、BMDP 并称为国际上最有影响的三大统计软件。 SPSS 输出结果虽然漂亮,但不能为WORD 等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS 软件的缺陷。 二、方差分析 例如 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。对照组为组一,锻炼组为组二,药物组为组三。 第一步:打开 SPSS 软件 表1 三组战士的第一秒用力肺活量(L) 对照组 锻炼组 药物组 合计 3.25 3.66 3.44 3.32 3.64 3.62 3.29 3.48 3.48 3.34 3.64 3.36 3.16 3.48 3.52 3.64 3.20 3.60 3.60 3.62 3.32 3.28 3.56 3.44 3.52 3.44 3.16 3.26 3.82 3.28

正交试验方差分析(通俗易懂)复习过程

正交试验方差分析(通 俗易懂)

第十一章正交设计试验资料的方差分析 在实际工作中,常常需要同时考察 3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。 正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 第一节、正交设计原理和方法 (一) 正交设计的基本概念 正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响: A因素是氮肥施用量,设A1、A2、A3 3个水平; B因素是磷肥施用量,设B1、B2、B3 3个水平; C因素是钾肥施用量,设C1、C2、C3 3个水平。 这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。 如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。 但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。 如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。

正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表 L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 一、正交设计的基本原理 表11-1 33试验的全面试验方案

第8章 正交试验设计的方差分析例题

8.3.2 考虑交互作用的三水平正交试验的方差分析(因学时有限和正交表太大L27(313),不讲解!只讲解二水平情况,因为二水平会,三水平自然也会!) 例8-4 运动发酵单细胞菌是一种酒精生产菌。为了确定其发酵培养基的最佳配方,进行了四因素三水平正交试验,试验指标为酒精浓度(g/ml)。表8-12给出了因素水平表,要求考察交互作用A×B、A×C和A×D。查附表7可得,本试验应选用L27(313)正交表,表头设计应按照“L27(313)二列间的交互作用表”进行。本例只考虑一级交互作用(p=1),所以每个三水平交互作用应占(m-1)P=(3-1)1=2列,即A ×B、A×C,和A×D在L27(313)正交表中各占二列。 表8-12 因素水平表 表头设计时应避免混杂,试验方案及试验结果见表8-13。 由交互作用表可知,将因素A、B安排在第1、2列之后,第3、4列为A×B交互作用列;再将C安排在第5列后,A×C交互作用在第6、7列;最后将D安排在第9列,则A×D交互作用类落在第8、10列(当然也可将D安排在第8列,则第9、10列为A×D交互作用列)。 表8-13 试验方案及结果分析 L27(313)

一、计算(计算过程省略) 1.计算各列各水平的K ij 值(K 1j ,K 2j ,K 3j )和K 2 ij (K 21j ,K 22j ,K 23j ) 各列各水平对应的试验数据之和K 1j ,K 2j ,K 3j ,及其平方和K 21j , K 22j , K 23j ,列于表8-13中,例如 K 1A = ∑=9 1 i i X =0.20+0.50*2+1.50+1.10+1.20*2+1.60*2=9.40=K 11 , K 2 11= 88.36 K 2A =∑=9 1i i X =0.40+0.50+……+6.15=33.05= K 21 , K 221=1092.30 K 3A =∑=9 1 i i X =0.40+0.30+……+2.80=25.80= K 31 , K 231 =665.64 表示A ×B 的有两列,即第3,4列,计算后可知 K 13 =32.75, K 23 =17.90; K 33 =17.60 K 14 =26.40; K 24 =24.55, K 34 =17.30 2.计算各列的偏差平方和(S j )及其自由度(f j ) 由式(8-4),可知: S j =CT Q n T K r j m i ij -=-∑=2 2 11 r=n/m=27/3=9; CT=T 2/n=1/27×68.252=172.52

正交试验的方差分析实例1

正交试验设计实例分析 正交试验设计是使用正交表来安排多因素、多水平试表验,并采用统计学方法分析实验结果的一种实验设计方法[1]。对于多因素、多水平的问题,人们一般希望通过若干次的实验找出各因素的主次关系和最优搭配条件,用正交表合理地安排实验,可以省时、省力、省钱,同时又能得到基本满意的实验效果。因此,这种方法在改进产品质量、优化工艺条件及研发新产品等诸多方面广泛应用。但是,很多研究人员在使用该方法时,有些细节往往容易被忽视。作者以姜黄素的提取为例具体阐述这一方法的使用和注意事项。 1.实例: 姜黄素是姜黄中的主要活性成分,在优化其提取工艺时,首先应确定正交试验需要考察的因素和水平。尤本明等[2]考察了三个因素,因素A(作为溶媒的乙醇浓度)、因素 B(溶媒的量)、因素C(渗漉速度),每个因素取三个水平。试验设计时,一般还应考虑各因素间的交互作用,也就是因素之间的联合作用,这点不可忽视。根据以往经验可知,本例中因素之间的交互作用可以忽略,故采用 L9(34)正交表来安排试验(见表1)。该表共有4列,将因素 A 、B 、C 分别安排在正交表的第2、3、4列上,第1列为空白列。在试验前,各因素及水平在正交表中的位置必须交待清楚,以确定各次试验的条件,避免不必要的错误。 1 正交试验设计与结果 2 .直观分析法: 表1中的 K1、K2、K3分别表示在各因素各水平下姜黄素提取量的总和,K分别表示在各因素各水平下姜黄素提取量的平均值。由于有时会遇到各因素水平数不等的情况,因此,一般用提取量的平均值大小来反映同一个因素的各个不同水平对试验结果(提取量)影响的大小,并以此确定该因素应取的最佳水平。用同一因素各水平下平均提取量的极差R(极差=平均提取量

第8章 正交试验设计的方差分析

第8章正交试验设计的方差分析 前面我们讨论了如何安排正交试验以及用极差分析法(即直观分析法)对试验结果进行计算分析.极差分析法简单明了,通俗易懂,计算工作量少,便于普及推广.但这种方法不能把试验中由于试验条件的改变引起的数据波动,同试验误差引起的数据波动区分开来.也就是说,不能区分因素各水平对应的试验结果间的差异,究竟是由于因素水平不同引起的,还是由于试验误差引起的,即不知道试验的精度.同时,对影响试验结果的各个因素的重要程度,既不能给出精确的定量估计,也不能提供一个标准,用来判断所考察的因素的作用是否显著. 为了弥补极差分析法的不足,对试验结果的分析可采用方差分析法. 8.1 正交试验方差分析的基本步骤 在第2章中我们已经介绍过,方差分析的基本思想是将数据的总偏差平方和(S T)分解为因素的偏差平方和(S A、S B)和误差的偏差平方和(S e),然后将偏差平方和除以相对应的自由度(f)得到方差(V A、V B),最后利用因素方差与误差方差之比(V A/V e,V B/V e),作F检验,即可判断因素的作用是否显著.正交试验设计的方差分析也是按这样的步骤进行的,所不同的是这是考虑的是多因素试验的方差分析,而第2章中只考虑单因素和双因素试验的方差分析. 一、计算 1.偏差平方和与自由度的计算

方差分析的关键是偏差平方和的分解,现在以最简单的L 4(23)正交表上安排的试验为例来说明(见表8-1,板书).不考虑哪些因素安排在哪些列上(即表头设计时),设试验结果为x 1、x 2、x 3和x 4. 总的偏差平方和: 4 )(2 4 1 221 212 _T x n T x x x S i i n i i n i i T - =- =-=∑∑∑=== T=∑=n i i x 1 =(x 21+x 22+x 23+x 24)-4 1 (x 4321x x x +++)2 整理后可得 43 = (24232221x x x x +++) 2 1 - (434232413121x x x x x x x x x x x x +++++) 第1列各水平偏差平方和为 S 1=22 _ 21_ 2 _11_ )(2)(x K x K -+- =2[221211)4 2()42( T K T K -+-] =2[T K T K T K T K 2111222122114 1 41164164--+++] =22 2121141)(21T K K -+ )(211141 K K x T i i +==∑= =24321243221)(41])()[(21x x x x x x x x +++-+++ =)(2 1)(414321423241312 42322 21x x x x x x x x x x x x x x x x --+++-+++ 表8-1 L 4(23)正交表及计算表

相关文档
相关文档 最新文档