文档库 最新最全的文档下载
当前位置:文档库 › 正交实验举例20160729

正交实验举例20160729

正交实验举例20160729
正交实验举例20160729

回首页

正交试验设计法

正交试验设计法的基本思想

正交表

正交表试验方案的设计

试验数据的直观分析

正交试验的方差分析

常用正交表

1.正交试验设计法的基本思想

正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。它简单易行,计算表格化,使用者能够迅速掌握。下边通过一个例子来说明正交试验设计法的基本想法。

[例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围:

A:80-90℃

B:90-150分钟

C:5-7%

试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。试制定试验方案。

这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平:A:Al=80℃,A2=85℃,A3=90℃

B:Bl=90分,B2=120分,B3=150分

C:Cl=5%,C2=6%,C3=7%

当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。

这个三因子三水平的条件试验,通常有两

种试验进行方法:

(Ⅰ)取三因子所有水平之间的组合,即

AlBlC1,A1BlC2,A1B2C1,……,A3B3C3,

共有

33=27次

试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。

全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。

图1 全面试验法取点..........

(Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化之:

↗A1

B1C1 →A2

↘A3 (好结果)

如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之:

↗B1

A3C1 →B2 (好结果)

↘B3

得出结果以B2为最好,则固定B于B2,A于A3,使C变化之:

↗C1

A3B2→C2 (好结果)

↘C3

试验结果以C2最好。于是就认为最好的工艺条件是A3B2C2。

这种方法一般也有一定的效果,但缺点很多。首先这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。

简单对比法的最大优点就是试验次数少,例如六因子五水平试验,在不重复时,只用5+(6-1)×(5-1)=5+5×4=25次试验就可以了。

考虑兼顾这两种试验方法的优点,从全面试

验的点中选择具有典型性、代表性的点,使

试验点在试验范围内分布得很均匀,能反映

全面情况。但我们又希望试验点尽量地少,

为此还要具体考虑一些问题。

如上例,对应于A有Al、A2、A3三个平面,

对应于B、C也各有三个平面,共九个平面。

则这九个平面上的试验点都应当一样多,即

对每个因子的每个水平都要同等看待。具体

来说,每个平面上都有三行、三列,要求在每行、每列上的点一样多。这样,作出如图2所示的设计,试验点用⊙表示。我们看到,在9个平面中每个平面上都恰好有三个点而每个平面的每行每列都有一个点,而且只有一个点,总共九个点。这样的试验方案,试验点的分布很均匀,试验次数也不多。

当因子数和水平数都不太大时,尚可通过作图的办法来选择分布很均匀的试验点。但是因子数和水平数多了,作图的方法就不行了。

试验工作者在长期的工作中总结出一套办法,创造出所谓的正交表。按照正交表来安排试验,既能使试验点分布得很均匀,又能减少试验次数,图2正交试验设计图例

而且计算分析简单,能够清晰地阐明试验条件与指标之间的关系。

用正交表来安排试验及分析试验结果,这种方法叫正交试验设计法。

2.正交表

本书附录给出了常用的正交表。为了叙述方便,用L代表正交表,常用的有L8(27),L9(34),L16(45),L8(4×24),L12(211),等等。此符号各数字的意义如下:

L8(27)

7为此表列的数目(最多可安排的因子数)

2为因子的水平数

8为此表行的数目(试验次数)

L18(2×37)

有7列是3水平的

有1列是2水平的

L18(2×37)的数字告诉我们,用它来安排试验,做18个试验最多可以考察一个

2水平因子和7个3水平因子。

在行数为mn型的正交表中(m,n是正整数),

试验次数(行数)=Σ(每列水平数一1)+l (1)

如L8(27),

8=7×(2-1)+l

利用上述关系式可以从所要考察的因子水平数来决定最低的试验次数,进而选择合适的正交表。比如要考察五个3水平因子及一个2水平因子,则起码的试验次数为

5×(3-1)+1×(2-1)+1=12(次)

这就是说,要在行数不小于12,既有2水平列又有3水平列的正交表中选择,

L18(2×37)适合。

正交表具有两条性质:(1)每一列中各数字出现的次数都一样多。(2)任何两列所构成的各有序数对出现的次数都一样多。所以称之谓正交表。

例如在L9(34)中(见表1),各列中的l、2、3都各自出现3次;任何两列,例如第3、4列,所构成的有序数对从上向下共有九种,既没有重复也没有遗漏。其他任何两列所构成的有序数对也是这九种各出现一次。这反映了试验点分布的均匀性。

返回

3.试验方案的设计

安排试验时,只要把所考察的每一个因子任意地对应于正交表的一列(一个因子对应一列,不能让两个因子对应同一列),然后把每列的数字"翻译"成所对应因子的水平。这样,每一行的各水平组合就构成了一个试验条件(不考虑没安排因子的列)。

对于[例1],因子A、B、C都是三水平的,试验次数要不少于

3×(3-1)+1=7(次)

可考虑选用L9(34)。因子A、B、C可任意地对应于L9(34)的某三列,例如A、B、C分别放在l、2、3列,然后试验按行进行,顺序不限,每一行中各因素的水平组合就是每一次的试验条件,从上到下就是这个正交试验的方案,见表2。这个试验方案的几何解释正好是图2。

三个3水平的因子,做全面试验需要33=27次试验,现用L9(34)来设计试验方案,只要做9次,工作量减少了2/3,而在一定意义上代表了27次试验.。

再看一个用L9(34)安排四个3水平因子的例子。

[例2]某矿物气体还原试验中,要考虑还原时间(A)、还原温度(B)、还原气体比例(D)、气体流速(C)这四个因子对全铁合量X〔越高越好)、金属化率Y(越高超好)、二氧化钛含量Z(越低越好)这三项指标的影响。希望通过试验找出主要影响因素,确定最适工艺条件。

首先根据专业知以确定各因子的水平:

时间:A1=3(小时),A2=4(小时),A3=5(小时)

温度:B1=1000(℃),B2=1100(℃),B3=1200(℃)

流速:Cl=600(毫升/分),C2=400(毫升/分),

C3=800(毫升/分)

CO:H2:D1=1:2,D2=2:1,D3=1:1

这是四因子3水平的多指标(X、Y、Z)问题,如果做全面试验需34=81次试验,而用L9(34)来做只要9次。具体安排如表3。

同全面试验比较,工作量少了8/9。由于缩短了试验周期,可以提高试验精度,时间越长误差于扰越大。并且对于多指标问题,采用简单对比法,往往顾此失彼,最适工艺条

件很难找;而应用正交表来设计试验时可对各指标通盘考虑,结论明确可靠。

返回

4.试验数据的直观分析

正交表的另一个好处是简化了试验数据的计算分折。还是以[例1]为例来说明。按照表2的试验方案进行试验,测得9个转化率数据,见表4。

通过9次试验,我们可以得两类收获。第一类收获是拿到手的结果。第9号试验的转化率为64,在所做过的试验中最好,可取用之。因为通过L9(34)已经把试验条件均衡地打散到不同的部位,代表性是好的。假如没有漏掉另外的重要因素,选用的水平变化范围也合适的话,那么,这9次试验中最好的结果在全体可能的结果中也应该是相当好的了,所以不要轻易放过。

第二类收获是认识和展望。9次试验在全体可能的条件中(远不止33=27个组合,在试验范围内还可以取更多的水平组合)只是一小部分,所以还可能扩大。精益求精。寻求更好的条件。利用正交表的计算分折,分辨出主次因素,预测更好的水平组合,为进一步的试验提供有份量的依据。

其中I、Ⅱ、Ⅲ分别为各对应列(因子)上1、2、3水平效应的估计值,其计算式是:

Ⅰi(Ⅱi,Ⅲi)=第i列上对应水平1(2,3)的数据和

K1 为1水平数据的综合平均=Ⅰ/水平1的重复次数

Si为变动平方和=

[例1]的转化率试验数据与计算分析见表4。

先考虑温度对转比率的影响。但单个拿出不同温度的数据是不能比较的,因为造成数据差异的原因除温度外还有其他因素。但从整体上看,80℃时三种反应时间和三种用碱量全遇到了,86℃时、90℃时也是如此。这样,对于每种温度下的三个数据的综合数来说,反应时间与加碱量处于完全平等状态,这时温度就具有可比性。所以算得三个温度下三次试验的转化率之和:

80℃:ⅠA=xl+x2+x3=31+54+38=123;

85℃:ⅡA=x4+x5+x6=53+49+42=144;

90℃:ⅢA=x7+x8+x9=57+62+64=183。

分别填在A列下的Ⅰ、Ⅱ、Ⅲ三行。再分别除以3,表示80℃、85℃、90℃时综合平均意义下的转化率,填入下三行Kl、K2、K3。R行称为极差,表明因子对结果的影响幅度。

同样地,为了比较反应时间;用碱量对转化率的影响,也先算出同一水平下的数据和IB、ⅡB、ⅢB,Ic、Ⅱc、Ⅲc,再计算其平均值和极差。都填入表4中;由此分别得出结论:温度越高转化率越好,以90℃为最好,但可以进一步探索温度更好的情况。反应时间以120分转化率最高。用碱量以6%转化率最高。

所以最适水平是A3B2C2。

返回

5.正交试验的方差分析

(一)假设检验

在数理统计中假设检验的思想方法是:提出一个假设,把它与数据进行对照,判断是否舍弃它。其判断步骤如下:

(1)设假设H。正确,可导出一个理论结论,设此结论为R。;

(2)再根据试验得出一个试验结论,与理论结论相对应,设为R1;

(3)比较R。与Rl,若R。与Rl没有大的差异,则没有理由怀疑H。,从而判定为:"不舍弃H。"(采用H。);若R。与R1有较大差异,则可以怀疑H。,此时判定为:"舍弃H。"。

但是,R1/R。比l大多少才能舍弃H。呢?为确定这个量的界限,需要利用数理统计中关于F分布的理论。

若yl服从自由度为φ1的χ2分布,y2服从自由度为φ2的χ2分布,并且yl、y2相互独立,则(y1/φ1)/(y2/φ2)服从自由度为(φ1,φ2)的F分布。F分布是连续分布,分布模数是两个自由度(φ1,φ2)。称φ1为分子自由度,称φ2为分母自由度。在自由度为(φ1,φ2)的F分布中,某点右侧面积为p,也就是F比此值大的概率为p,把这个值写为 (p)。若检验的显著性水平(或危险率)给定为α时,则可以把 (α)作为临界值来检验假设。

这里,Se/σ2服从自由度为φe,的χ2分布;当H。成立,σ2=0时,SA/σ2也服从自由度为φA的χ2分布;又SA与Se相互成立,所以(SA/(φAσ2)/ Se/(φeσ2))=VA/Ve服从自由度为(φA,φe)的F分布。这就是假定H。正确时的理论结论R。。而试验结论Rl要与理论结论R。相比较。由给定的显著性水平,通常是α=0.05;分子自由度φ1=φA=a-l,分母自由度φ2=φe=a(n-1);查F分布表得出 (α)。所以H。:αl=α2=……=αa=0(σA2=0)的检验是:(显著性水平α)

FA=VA/Ve> (α) → 舍弃H。

FA=VA/Ve≤ (α) → 不舍弃H。

通常, (α)一般性地表示成Fα(φA,φB)。

假设因子A对试验结果的影响不显著,那么A的两个水平的效应该表现为相等或相近,即假设H。:α1=α2=0。如果因子A显著,则舍弃假设。

为了判断因子A是否显著,首先要计算比值

显然,这个比值越大,因子A对指标的影响越显著;反之,因子A就不显著。在给定置信度α后,如α=0.05,查F分布表,自由度φA是因子A的,自由度φe是误差的,其临界值Fα(φA,φe),如果

FA>Fα(φA,φe)

就舍弃假设,可以认为因子A是显著的;如果

FA≤Fα(φA,φe)

就没有理由否定假设,而只能认为因子A是不显著的。因为按照F分布表的物理念义,F值小于Fα(φA,φe)的概率是95%,即有95%的机会出现小于

Fα(φA,φe)的F值,既然出现了这种情况,就有了95%的把握,所以就没有理由否定假设,只能接受假设,认为因子A不显著。另一方面,F值大于

Fα(φA,φe)的概率是5%,也就是只有5%的机会出现大于Fα(φA,φe)的F 值,这是小概率事件,如果小概率事件居然发生了,则可认为情况异常,假设不可信,必须否定假设,因子A是显著的。

对其他因子的显著性检验完全类似。

(二)方差分析表

由总平方和与各因素平方和即可求得误差平方和,亦称剩余平方和。是总平方和减各因素平方和所得。如正交表有一空列,则该列的平方和就量误差平方和。但在正交表饱和试验的情况下,即所有各列全部排满时,误差平方和一般用各因素平方和中几个最小的平方和之和来代替,同时,这几个因素不再作进一步的分析。自由度:φT=试验次数一1

φA,B…=水平数一1

φA×B=φA×φB

φe=φT-φA-φB-……-φD

正交实验法详解

正交实验法的由来 一、正交表的由来 拉丁方名称的由来 古希腊是一个多民族的国家,国王在检阅臣民时要求每个方队中每行有一个民族代表,每列也要有一个民族的代表。 数学家在设计方阵时,以每一个拉丁字母表示一个民族,所以设计的方阵称为拉丁方。 什么是n阶拉丁方? 用n个不同的拉丁字母排成一个n阶方阵(n<26 ),如果每行的n个字母均不相同,每列的n个字母均不相同,则称这种方阵为n*n拉丁方或n阶拉丁方。每个字母在任一行、任一列中只岀现一次。 什么是正交拉丁方? 设有两个n阶的拉丁方,如果将它们叠合在一起,恰好岀现n2个不同的有序数对,则称为这两个拉 丁方为互相正交的拉丁方,简称正交拉丁方。 例如:3阶拉丁方(图1) ABC ABC B C A 和CAB CAS B C A 用数字替代拉丁字母:(图2) 1 2 3 (l f l) (2,2)(艮可 3 12 -> (2r3) (3r l) (1.2) 2 3 1 (3 辺(13) (2A) 二、正交实验法

正交试验设计(Orthogonal experimental design) 是研究多因素多水平的又一种设计方法,它是根 据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备了“均匀分散,齐 整可比”的特点,正交试验设计是分式析因设计的主要方法。是一种高效率、快速、经济的实验设计方法。日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素 三水平的实验,按全面实验要求,须进行33=27种组合的实验,且尚未考虑每一组合的重复数。若按 L9(33)正交表按排实验,只需作9次,按L18(37)正交表进行18次实验,显然大大减少了工作量。因而正交实验设计在很多领域的研究中已经得到广泛应用。 利用因果图来设计测试用例时,作为输入条件的原因与输岀结果之间的因果关系,有时很难从软件需求规格说明中得到。往往因果关系非常庞大,以至于据此因果图而得到的测试用例数目多的惊人,给软件测试带来沉重的负担,为了有效地,合理地减少测试的工时与费用,可利用正交实验设计方法进行测试用例的设计。 正交实验设计方法:依据Galois理论,从大量的(实验)数据(测试例)中挑选适量的、有代表性的点(例),从而合理地安排实验(测试)的一种科学实验设计方法。类似的方法有:聚类分析方法、因子方法方法等。 三、利用正交实验设计测试用例的步骤: (1)提取功能说明,构造因子--状态表 把影响实验指标的条件称为因子,而影响实验因子的条件叫因子的状态。 利用正交实验设计方法来设计测试用例时,首先要根据被测试软件的规格说明书找岀影响其功能实现 的操作对象和外部因素,把他们当作因子;而把各个因子的取值当作状态。对软件需求规格说明中 的功能要求进行划分,把整体的、概要性的功能要求进行层层分解与展开,分解成具体的有相对独立性的、基本的功能要求。这样就可以把被测试软件中所有的因子都确定下来,并为确定每个因子的 权值提供参考的依据。确定因子与状态是设计测试用例的关键。因此要求尽可能全面的、正确的确

正交试验设计方法 讲义及举例

正交试验设计方法讲义及举例 第5章 正交试验设计方法 5.1 试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 对此实例该如何进行试验方案的设计呢? 很容易想到的是全面搭配法方案(如图5-1所示): 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33=27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数 愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T 表示,下标1、2、3表示因素的不同水平,分别记为T 1、T 2、T 3。

常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢? 先固定T 1和p 1,只改变m ,观察因素m 不同水平的影响,做了如图2-2(1)所示的三次实验,发现 m =m 2时的实验效果最好(好的用 □ 表示),合格产品的产量最高,因此认为在后面的实验中因素m 应取m 2水平。 固定T 1和m 2,改变p 的三次实验如图5-2(2)所示,发现p =p 3时的实验效果最好,因此认为因素p 应取p 3水平。 固定p 3和m 2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T 2水平。 因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T 2p 3m 2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m 值(或p 值,或T 值)的三次实验中,说m 2(或p 3或T 2 )水平最好是有条件的。在T ≠T 1,p ≠p 1时,m 2 水平不是最好的可能性是有的。②在改变m 的三次实验中,固定T =T 2,p =p 3 应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。 运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。 正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L 9(34),其试验安排见表5-2。 所有的正交表与L 9(34)正交表一样,都具有以下两个特点: (1) 在每一列中,各个不同的数字出现的次数相同。在表L 9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。 (2) 表中任意两列并列在一起形成若干个数字对, 不同数字对出现的次数也都相同。

正交试验设计方法讲义及举例

正交试验设计方法讲义及举例 第5章正交试验设计方法 5.1 试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 对此实例该如何进行试验方案 的设计呢 很容易想到的是全面搭配法方 案(如图5-1所示): 此方案数据点分布的均匀 性极好,因素和水平的搭配十分全 面,唯一的缺点是实验次数多达33 =27次(指数3代表3个因素,底 数3代表每因素有3个水平)。因素、 水平数愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。 表5-1 因素水平 水 平 因 素 温 度℃ 压力Pa加碱量kg 符 号 T p m 1 2 3 T1 (80 ) T2(10 p1 p2 p3 m 1 m2 m3 图5-1 全面搭配法方案

温度用T表示,下标1、2、3表示因素的不同水平,分别记为T1、T2、T3。 常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢 先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2-2(1)所示的三次实验,发现m=m2时的实验效果最好(好的用□表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。 固定T1和m2,改变p的三次实验如图5-2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。 固定p3和m2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T2水平。 因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2p3m2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m值(或p值,或T值)的三次实验中,说m2(或p3或T2)水平最好是有条件的。在T≠T1,p≠p1时,m2水平不是最好的可能性是有的。②在改变m的三次实验中,固定T=T2,p=p3应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。 运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。 正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L9(34),其试验安排见表5-2。 所有的正交表与L9(34)正交表一样,都具有以下两个特点: (1)在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。 图5-2 简单比较法

正交实验结果如何进行数据分析57070

正交实验如何数据分析 我们把在试验中考察的有关影响试验指标的条件称为因素(也叫因子),把在试验中准备考察的各种因索的不同状态(或配方)称为水平。在研究比较复杂的工程问题中,往往都包含着多个因素,而且每个因素要取多个水平。 对于包含五个因素、五个水平的工程项目,理论计算必须进行55=3125次试验。显然,所需要的试验次数太多了,工作量太大。实践告诉我们,合理安排试验和科学分析试验,是试验工作成败的关键。 试验方案设计的好,试验次数就少,周期也短,这样不仅节省了大量人力、物力、财力和时间,而且可以得到理想的结果。相反,如果试验设计安排的不好,即使进行了很多次试验,浪费了大量材料、人力和时间,也不一定能够得到预期的结果。 正交试验法,就是在多因素优化试验中,利用数理统计学与正交性原理,从大量的试验点中挑选有代表性和典型性的试验点,应用“正交表”科学合理地安排试验,从而用尽量少的试验得到最优的试验结果的一种试验设计方法。 正交试验法也叫正交试验设计法,它是用“正交表”来安排和分析多因素问题试验的一种数理统计方法。这种方法的优点是试验次数少,效果好,方法筒单,使用方便,效率高。 由于试验次数大大减少,使得试验数据处理非常重要。我们可以从所有的试验数据中找到最优的一个数据,当然,这个数据肯定不是最佳匹配数据,但是肯定是最接近最佳的了。

用正交表安排的试验具有均衡分散和整齐可比的特点。均衡分散,是指用正交表挑选出来的各因素和各水平组合在全部水平组合中的分布是均衡的。整齐可比是说每一因素的各水平间具有可比性。 最简单的正交表L4(23)如表-1所示。 表-1 记号L4(23)的含意如下: “L”代表正交表; L下角的数字“4”表示有4横行(简称为行),即要做四次试验; 括号内的指数“3”表示有3纵列(简称为列),即最多允许安排的因素个数是3个; 括号内的数“2”表示表的主要部分只有2种数字,即因素有两种水平l与2,称之为l水平与2水平。 表L4(23)之所以称为正交表是因为它有两个特点: 1、每一列中,每一因素的每个水平,在试验总次数中出现的次数

正交试验设计法[17]

正交试验设计法[17] 正交试验设计是利用“正交表”选择试验的条件,并利用正交表的特点进行数据分析,找出最好的或满意的试验条件,适用于多因素的设计问题。正交试验法的理论基础是正交拉丁方理论与群论。在工作中可用的多因素寻优工作方法,一类是从优选区某一点开始试验,一步一步到达较优点,这类实验方法叫序贯试验法,如因素轮换法、爬山法等;另一类是,在优选区内一次布置一批试验点,通过对这批试验结果的分析,逐步缩小优选范围从而达到较优点,如正交试验法等。科研中普遍采用正交试验法,因其具有如下优点: ①实用上按表格安排试验,使用方便; ②布点均衡、试验次数较少; ③在正交试验法中的最好点,虽然不一定是全面试验的最好点,但也往往是相当好的点。特别在只有一两个因素起主要作用时,正交试验法能保证主要因素的各种可能都不会漏掉。这点在探索性工作中很重要,其他试验方法难于作到; ④正交试验法提供一种分析结果(包括交互作用)的方法,结果直观易分析。且每个试验水平都重复相同次数,可以消除部分试验误差的干扰; ⑤因其具有正交性,易于分析出各因素的主效应。 名词解释: 1 试验因素:影响考核指标取值的量称为试验因素(因子),一般记为:A,B,C等。有定量的因素,可控因素,定性的因素,不可控因素等。 2 因素的位级(水平):指试验因素所处的状态。 4 考核指标:根据试验目的而选定的用来衡量试验效果的量值(指标)。 5 完全因素位级组合:指参与实验的全部因素与全部位级相互之间的全部组合次数,即全部的实验次数。

6 部分因素位级组合:⑴单因素转换法⑵正交试验法 7 正交表的符号:正交表是运用组合数学理论在正交拉丁名的基础上构造的一种规格化的表格。符号:Ln(ji) 其中: L--正交表的符号 n--正交表的行数(试验次数,试验方案数) j--正交表中的数码(因素的位级数) i--正交表的列数(试验因素的个数) N=ji--全部试验次数(完全因素位级组合数) 总之,利用正交试验法的设计方案,结合代数方法对数据进行分析,可达到使试验收敛速度加快、试验的效率非常高的效果。可利用试验结果获取更多信息,准确掌握效应的趋势规律,而且优选点可超越所选水平范围和精度,从而可大大减少试验次数。这种联用技术,对于可获得定量结果或结果容易定量化,以及试验代价高时,很有效。 正交实验设计 当析因设计要求的实验次数太多时,一个非常自然的想法就是从析因设计的水平组合中,选择一部分有代表性水平组合进行试验。因此就出现了分式析因设计(fractional factorial designs),但是对于试验设计知识较少的实际工作者来说,选择适当的分式析因设计还是比较困难的。 正交试验设计(Orthogonal experimental design)是研究多因素多水平的又一种设计方法,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备了“均匀分散,齐整可比”的特点,正交试验设计是分式析因设计的主要方法。是一种高效率、快速、经济的实验设计方法。日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素三水平的实验,按全面实验要求,须进行33=27种组合的实验,且尚未考虑每一组合的重复数。若按L9(3)3正交表按排实验,只需作9次,按L18(3)7正交表进行18次实验,显然大大减少了工作量。因而正交实验设计在很多领域的研究中已经得到广泛应用。 1.正交表

正交实验法及其应用

正交实验法及其应用 为了研制新产品,提高产品的质量和数量,降低原材料消耗,都需要做试验。一项试验如何安排,就得选择方法。一个好的试验方法,只要用少量试验既能得到较好的效果和分析出较为正确的结论;如果试验方法不好,不但试验次数多,而且结果还不一定理想。正交试验法就是利用一套规格化的表(正交表)来安排试验方案,使得试验次数尽可能地少;并通过对试验数据的简单分析,有助于我们在复杂的影响因素中抓住主要因素,从而找出较好的实验方案。“正交试验法”应用的范围非常广泛,现已成为比较简便、易行的一种应用数学方法。这里分两部分:简单介绍正交试验的基本方法和利用该方法对芦荟多糖提取条件进行优化。其中第一部分包括:正交试验法解决的问题;涉及的相关术语;如何用正交表安排试验以及怎样分析试验结果。另外,有时试验过程中不仅因素的水平变化对指标有影响,而且,有些因素间各水平的联合搭配对指标也产生影响,这种联合搭配作用称为交互作用,这里不作介绍。第二部分应用正交实验法对芦荟多糖提取条件进行了优化,得到很好的试验结果,大大加快了试验的进程,并节约了试验的耗材。 第一部分正交试验的基本方法 一、什么是“正交试验法” 采用什么样的实验设计方案能够做到优质、高产、低稍耗?要使实验顺利进行应该改进哪些实验条件……?由于实验结果是受许多方面的因素的影响,往往需要进行试验来增加对具体实验的认识,以便摸索其中的规律性。 凡是要做试验就存在着如何安排试验和如何分析试验结果的问题。科学的实验安排应能做到两点:1)在试验安排上尽可能地减少试验次数2)在进行较少次数试验的基础上,能够利用所得到的试验数据,分析出指导下一步实验的正确结论,并得到较好的结果。 “正交试验法”就是一种科学地安排与分析多因素试验的方法。下面通过一个例子初步说明一下它是解决什么问题的。 例. 研究人参皂苷的提取工艺试验。 根据经验,乙醇用量、乙醇浓度、提取时间、回流次数等对人参皂苷的提取有显著影响。所以在提取过程中需要考察乙醇用量(A)、乙醇浓度(B)、回流时间(C)、回流次数(D)这四个因素。每个因素比较三种不同的条件(见表) 类似这样的问题,在实验中经常遇到。这类问题称之为多因素试验问题。“正交试验法”正是解决这类问题的行之有效的一种方法。 为了叙述的方便,下面介绍一下涉及到的术语和符号。一般,把试验需要考察的结果称为指标。如产品的性能、质量、成本、产量等均可做为衡量试验效果的指标。本例中的人参皂苷的量就是试验的指标。把在试验中要考察的对试验指标可能有影响的因素简称为因素。本例中的乙醇用量(A)、乙醇浓度(B)、回流时间(C)、回流次数(D)就是四个因素。把

试验设计与数据处理

试验设计与数据处理方法总述及总结 王亚丽 (数学与信息科学学院 08统计1班 081120132) 摘要:实验设计与数据处理是一门非常有用的学科,是研究如何经济合理安排 试验可以解决社会中存在的生产问题等,对现实生产有很重要的指导意义。因此本文根据试验设计与数据处理进行了总述与总结,以期达到学习、理解、掌握的以及灵活运用的目的。 1 试验设计与数据处理基本知识总述 1.1试验设计与数据处理的基本思想 试验设计与数据处理是数理统计学中的一个重要分支。它是以概率论、数理统计及线性代数为理论基础,结合一定的专业知识和实践经验,研究如何经济、合理地安排实验方案以及系统、科学地分析处理试验结果的一项科学技术,从而解决了长期以来在试验领域中,传统的试验方法对于多因素试验往往只能被动地处理试验数据,而对试验方案的设计及试验过程的控制显得无能为力这一问题。 1.2试验设计与数据处理的作用 (1)有助于研究者掌握试验因素对试验考察指标影响的规律性,即各因素的水平改变时指标的变化情况。 (2)有助于分清试验因素对试验考察指标影响的大小顺序,找出主要因素。(3)有助于反映试验因素之间的相互影响情况,即因素间是否存在交互作用。(4)能正确估计和有效控制试验误差,提高试验的精度。 (5)能较为迅速地优选出最佳工艺条件(或称最优方案),并能预估或控制一定条件下的试验指标值及其波动范围。 (6)根据试验因素对试验考察指标影响规律的分析,可以深入揭示事物内在规律,明确进一步试验研究的方向。

1.3试验设计与数据处理应遵循的原则 (1)重复原则:重可复试验是减少和估计随机误差的的基本手段。 (2)随机化原则:随机化原则可有效排除非试验因素的干扰,从而可正确、无偏地估计试验误差,并可保证试验数据的独立性和随机性。 (3)局部控制原则:局部控制是指在试验时采取一定的技术措施方法减少非试验因素对试验结果的影响。用图形表示如下: 2试验设计与数据处理方法总述和总结 2.1方差分析 (1)概念:方差分析是用来检验两个或两个以上样本的平均值差异的显著程度。并由此判断样本究竟是否抽自具有同一均值的总体。 (2)优点:方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。 (3)缺点:对所检验的假设会发生错判的情况,比如第一类错误或第二类错误的发生。 (4)基本原理:方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的第一个估计值;另一方面再考虑在同一水平下不同试验数据对于这一水平的均值的方差,由此计算出对由所有试验数据所组成的全部数据的总体方差的第 二个估计值。比较上述两个估计值,如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假设;否则,说明因素的不同水平下的均值间的差异比较大。

正交实验举例

正交试验设计法 正交试验设计法的基本思想 正交表 正交表试验方案的设计 试验数据的直观分析 正交试验的方差分析 常用正交表 1.正交试验设计法的基本思想 正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。它简单易行,计算表格化,使用者能够迅速掌握。下边通过一个例子来说明正交试验设计法的基本想法。 [例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80-90℃ B:90-150分钟 C:5-7% 试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。试制定试验方案。 这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平:A:Al=80℃,A2=85℃,A3=90℃ B:Bl=90分,B2=120分,B3=150分 C:Cl=5%,C2=6%,C3=7% 当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。 这个三因子三水平的条件试验,通常有两 种试验进行方法: (Ⅰ)取三因子所有水平之间的组合,即 AlBlC1,A1BlC2,A1B2C1,……,A3B3C3,

33=27次 试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。 全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。 图1 全面试验法取点.......... (Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化之: ↗A1 B1C1 →A2 ↘A3 (好结果) 如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之: ↗B1 A3C1 →B2 (好结果) ↘B3 得出结果以B2为最好,则固定B于B2,A于A3,使C变化之: ↗C1 A3B2→C2 (好结果) ↘C3 试验结果以C2最好。于是就认为最好的工艺条件是A3B2C2。 这种方法一般也有一定的效果,但缺点很多。首先这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。 简单对比法的最大优点就是试验次数少,例如六因子五水平试验,在不重复时,只用5+(6-1)×(5-1)=5+5×4=25次试验就可以了。 考虑兼顾这两种试验方法的优点,从全面试 验的点中选择具有典型性、代表性的点,使 试验点在试验范围内分布得很均匀,能反映 全面情况。但我们又希望试验点尽量地少, 为此还要具体考虑一些问题。 如上例,对应于A有Al、A2、A3三个平面, 对应于B、C也各有三个平面,共九个平面。 则这九个平面上的试验点都应当一样多,即 对每个因子的每个水平都要同等看待。具体

正交实验计算方法

正交试验设计方法(1)(2008-12-17 12:59:39) 标签:正交设计杂谈分类:其他 5.1试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 表5-1因素水平

对此实例该如何进行试验方案的设计呢 很容易想到的是全面搭配法方案(如图5-1所示): 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33=27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。

图5-1 全面搭配法方案 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T表示,下标1、2、3表示因素的不同水平,分别记为T1、T2、T3。

常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢

(完整word版)正交试验设计方法

第5章 正交试验设计方法 5.1 试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 对此实例该如何进行试验方案的设计呢? 很容易想到的是全面搭配法方案(如图5-1所示): 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33 =27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数 愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。 试验设计方法常用的术语定义如下。 试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。 因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。 水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T 表示,下标1、2、3表示因素的不同水平,分别记为T 1、T 2、T 3。 常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试

验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点 用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢? 先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2-2(1)所示的三次实验,发现m=m2时的实验效果最好(好的用□表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。 固定T1和m2,改变p的三次实验如图5-2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。 固定p3和m2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T2水平。 因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2p3m2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m值(或p值,或T值)的三次实验中,说m2(或p3或T2)水平最好是有条件的。在T≠T1,p≠p1时,m2水平不是最好的可能性是有的。②在改变m的三次实验中,固定T=T2,p=p3应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。 运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。 正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L9(34),其试验安排见表5-2。 所有的正交表与L9(34)正交表一样,都具有以下两个特点: (1)在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。 (2)表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。在表L9(34)中,任意两列并列在一起形成的数字对共有9个:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。

正交试验原理

正交实验的原理 我们知道如果有很多的因素变化制约着一个事件的变化,那么为了弄明白哪些因素重要,哪些不重要,什么样的因素搭配会产生极值,必须通过做实验验证(仿真也可以说是试验,只不过试验设备是计算机),如果因素很多,而且每种因素又有多种变化(专业称法是:水平),那么试验量会非常的大,显然是不可能每一个试验都做的。那我们这个试验来讲,影响主轴温升的因素很多,比如转速、预紧力、油气压力、喷油间隙时间、油品等等;每种因素的水平也很多,比如转速从8Krpm到20Krpm,等等,坤哥算了一下,所有因素都做,大概一共要900次试验,按一天3次试验计,要不停歇的做10个月,显然是不可能的。 能够大幅度减少试验次数而且并不会降低试验可行度的方法就是使用正交试验法。首先需要选择一张和你的试验因素水平相对应的正交表,已经有数学家制好了很多相应的表,你只需找到对应你需要的就可以了。所谓正交表,也就是一套经过周密计算得出的现成的试验方案,他告诉你每次试验时,用那几个水平互相匹配进行试验,这套方案的总试验次数是远小于每种情况都考虑后的试验次数的。比如3水平4因素表就只有9行,远小于遍历试验的81次;我们同理可推算出如果因素水平越多,试验的精简程度会越高。 建立好试验表后,根据表格做试验,然后就是数据处理了。由于试验次数大大减少,使得试验数据处理非常重要。首先可以从所有的试验数据中找到最优的一个数据,当然,这个数据肯定不是最佳匹配数据,但是肯定是最接近最佳的了。这是你能得到一组因素,这是最直观的一组最佳因素。接下来将各个因素当中同水平的试验值加和(注:正交表的一个特点就是每个水平在整个试验中出现的次数是相同的),就得到了各个水平的试验结果表,从这个表当中又可以得到一组最优的因素,通过比较前一个因素,可以获得因素变化的趋势,指导更进一步的试验。各个因素中不同水平试验值之间也可以进行如极差、方差等计算,可以获知这个因素的敏感度。等等等等...还有很多处理数据的方法。然后再根据统计数据,确定下一步的试验,这次试验的范围就很小了,目的就是确定最终的最优值。当然,如果因素水平很多,这种寻优过程可能不止一次。 讲了这么多,你也许会问,你说那个表很准,能代表大趋势,为什么呢?这个问题是有证明的,不过我们不必去看那个证明(很复杂,看不懂:P),我的考虑是这样的,如果我们将

什么叫正交试验法

正交试验法 我们知道如果有很多的因素变化制约着一个事件的变化,那么为了弄明白哪些因素重要,哪些不重要,什么样的因素搭配会产生极值,必须通过做实验验证(仿真也可以说是试验,只不过试验设备是计算机),如果因素很多,而且每种因素又有多种变化(专业称法是:水平),那么试验量会非常的大,显然是不可能每一个试验都做的。那我们这个试验来讲,影响主轴温升的因素很多,比如转速、预紧力、油气压力、喷油间隙时间、油品等等;每种因素的水平也很多,比如转速从8Krpm到20Krpm,等等,坤哥算了一下,所有因素都做,大概一共要900次试验,按一天3次试验计,要不停歇的做10个月,显然是不可能的。 能够大幅度减少试验次数而且并不会降低试验可行度的方法就是使用正交试验法。首先需要选择一张和你的试验因素水平相对应的正交表,已经有数学家制好了很多相应的表,你只需找到对应你需要的就可以了。所谓正交表,也就是一套经过周密计算得出的现成的试验方案,他告诉你每次试验时,用那几个水平互相匹配进行试验,这套方案的总试验次数是远小于每种情况都考虑后的试验次数的。比如3水平4因素表就只有9行,远小于遍历试验的81次;我们同理可推算出如果因素水平越多,试验的精简程度会越高。 建立好试验表后,根据表格做试验,然后就是数据处理了。由于试验次数大大减少,使得试验数据处理非常重要。首先可以从所有的试验数据中找到最优的一个数据,当然,这个数据肯定不是最佳匹配数据,但是肯定是最接近最佳的了。这是你能得到一组因素,这是最直观的一组最佳因素。接下来将各个因素当中同水平的试验值加和(注:正交表的一个特点就是每个水平在整个试验中出现的次数是相同的),就得到了各个水平的试验结果表,从这个表当中又可以得到一组最优的因素,通过比较前一个因素,可以获得因素变化的趋势,指导更进一步的试验。各个因素中不同水平试验值之间也可以进行如极差、方差等计算,可以获知这个因素的敏感度。等等等等...还有很多处理数据的方法。然后再根据统计数据,确定下一步的试验,这次试验的范围就很小了,目的就是确定最终的最优值。当然,如果因素水平很多,这种寻优过程可能不止一次。 讲了这么多,你也许会问,你说那个表很准,能代表大趋势,为什么呢?这个问题是有证明的,不过我们不必去看那个证明(很复杂,看不懂:P),我的考虑是这样的,如果我们将所有的试验情况排列成一条线,正交表所取得那些试验点,就肯定正好为于这条线的一组均分点上,由此就可以大致估算出整个试验的大致走向了,不过均分为多少个点倒是问题,取多了失去正交试验的意义,少了无法代表趋势,这点我还没考虑清楚。我师弟的考虑到是有道理,他认为取的这些点是所有试验点的一组最小正交基,也就是说所有试验点都可以由这几个基本点衍生表示,故而考虑基的性质就能推断所有的点的性质了,我觉得这个是个最好的解释了,呵呵。 在生产和科研中,为了研制新产品,改革生产工艺,寻找优良的生产条件,需要做许多多因素的试验。在方差分析中对于一个或两个因素的试验,我们可以对不同因素的所有可能的水平组合做试验,这叫做全面试验。当因素较多时,虽然理论上仍可采用前面的方法进行全面试验后再做相应的方差分析,但是在实际中有时会遇到试验次数太多的问题。例如,生产化工产品,需要提高收率(产品的实际产量与理论上投入的最大产量之比),认为反应温度的高低、加碱量的多少、催化剂种类等多种因素,都是造成收率不稳的主要原因。根据以往经验,选择温度的三个水平:800C、850C、

试验设计与数据处理作业----333333

试验设计与数据处理 题目正交实验方差分析法确定优方案 学院名称化学化工学院 指导教师范明舫 班级化工081班 学号20084540104 学生姓名陈柏娥

2011年04月20日 《实验设计与数据处理》课程的收获与体会 《实验设计与数据处理》课程具有公式多、计算多、图表多等特点,涉及较多概率论基础知识,课程本身的繁杂性决定了理解和掌握起来难度较大。一开始的时候,我还有点担心这一门课会学不好,因为我的概率论和数理统计的知识基础薄弱,可能会对里面的内容产生难以理解的心理,有点感觉他是郁闷枯燥乏味的课程。不过,在老师的指导下我否认了之前的观点。 这门课的安排很合理,从简单到复杂,由浅入深的思维发展规律,现将单因素试验、双因素试验、正交试验、均匀实验设计等常用实验设计方法及常规数据处理方法、再讲误差理论、方差分析、回归分析等数据处理的理论知识、最后讲得出的方差分析、回归分析等结论和处理方法直接应用到实验设计方法。老师也让我们先熟悉实验设计方法,并掌握常规数据处理方法,使我较早的感受到应用试验设计方法指导实践的“收获”,从而激发并维持学习兴趣。 通过学习,我初步认识了这一门课。这门课是研究如何合理而有效地获得数据资料的方法。讨论如何合理安排实验、取得数据、然后进行综合的科学分析,从而达到尽快获得最优方案的目的,即实验的最优设计。实验设计方法是数据统计学的应用方法之一。一般的数据统计方法主要是对已获得的数据资料尽可能精确的判断。如果试验安排得好且分析得当,就能以较少的试验次数、较短的试验时间、较低的费用,得到较满意的实验结果;反之,如果试验安排的不得当,分析不得当,则试验次数增加,试验时间延长,浪费人力、物力、财力,难以达到预期的结果,甚至导致实验失败。通过这门课程的学习,是我对误差理论、方差分析、正交试验设计与应用、回归分析都有了一个很好的理解,并且将它们做了笔记。 比如方差分析的理解:方差分析市实验设计中的重要分析方法,应用非常广泛,它是将不同因素,不同水平组合下的实验数据作为不同总体的样本数据,进行统计分析,找出对实验结果影响大的因素及其影响程度。对于单因素试验的数据进行统计分析,找出对试验指标影响大的因素及其影响程度。对于单因素试验的方差分析,主要步骤如下:1,建立线性统计模型,提出需要检验的假设。2,总离差平方和的分析与计算。3,统计分析,列出方差分析表。对于双因素试验的方差分析,分为两种,一种无交互作用的方差分析,另一种有交互作用的方差分析,对于这两种类型分别有各自的设计方法,但是总体步骤都和单因素试验的方差分析一样。 我们又通过正交试验设计合理安排实验,他是尽快有效的获得最优方案的一种设计方法。了解了他是避免做全面试验,再多因素多水平实验中选择最有代表性的搭配。否则花费时间过长,人力,物力,财力消耗太多。尤其是一些长周期、高费用或破坏性试验,更不要做全面性试验。 我觉得学习了这门课我得到了很大的收获,特别是在分析方面。我学习到的科学方法相对于以前高中学到的观点有了很大的进步,扩展了我认识的视野。而且从这一门课程中,

正交法实验

一、正交表的由来 1、拉丁方名称的由来 古希腊是一个多民族的国家,国王在检阅臣民时要求每个方队中每行有一个民族代表,每列也要有一个民族的代表。 数学家在设计方阵时,以每一个拉丁字母表示一个民族,所以设计的方阵称为拉丁方。 2、什么是n阶拉丁方? 用n个不同的拉丁字母排成一个n阶方阵(n<26 ),如果每行的n个字母均不相同,每列的n个字母均不相同,则称这种方阵为n*n拉丁方或n阶拉丁方。每个字母在任一行、任一列中只出现一次。 3、什么是正交拉丁方? 设有两个n阶的拉丁方,如果将它们叠合在一起,恰好出现n2个不同的有序数对,则称为这两个拉丁方为互相正交的拉丁方,简称正交拉丁方。 例如:3阶拉丁方 A B C A B C B C A 和 C A B C A B B C A 用数字替代拉丁字母: 1 2 3 1 2 3 (1,1)(2,2)(3,3) 2 3 1 和 3 1 2 ---> (2,3)(3,1)(1,2) 3 1 2 2 3 1 (3,2)(1,3)(2,1) 二、正交试验法介绍 人类在认识自然界的过程中,进行着多方面的探索,试验是构成学习过程的一个重要要素。 爱迪生一生艰苦奋斗,经历了无数次的失败之后,为人类发明了许多重要的科技成果。他的座右铭是:“天才靠的是百分之一的灵感和百分之九十九的汗水”。他的助手在他去世后的第二天说:“如果在爱迪生工作的黑屋中能有一支蜡烛照亮他前进的方向,以他蜜蜂般地努力,他会获得远比他发明多的多的成果”。就是说如果有一点理论知识和计算能帮助爱迪生,他会节省90%的精力。爱迪生是边试验边分析后决定下次试验,这种方法速度太慢。 正交试验设计是研究多因子(术语解释:把实验中影响响应变量的那些变量称为实验中的因子,因子分为可控因子和非可控因子)多水平(术语解释:把因子不同的取值称为水平)的一种试验方法,它是根据正交性从全面试验中挑选出有代表性的点进行试验,正交试验具备了“均匀分散,齐整可比”的特点,正交试验设计是分式析因设计的主要方法。 日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素三水平的实验,按全面实验要求,须进行33=27种组合的实验,且尚未考虑每

相关文档