文档库 最新最全的文档下载
当前位置:文档库 › 回归分析在Minitab和MS

回归分析在Minitab和MS

回归分析在Minitab和MS
回归分析在Minitab和MS

回归分析在Minitab和MSExcel中的实现

(2012-09-0919:10:50)

转载▼

在质量管理中分析两个变量之间的关系是经常要碰到的问题,而回归分析是一种分析两个变量之间关系的统计技术,通过回归分析可以以量化的方式阐明变量之间存在怎样的关系,再通过拟合曲线可以让人形象的感知,以数据为依据,有的放矢,事半而功倍。

现以实例说明如何进行回归分析。

例:有两组数据如下:

Minitab软件是进行回归分析的便捷工具,不多说,上图。

依次点击菜单“统计——回归-回归”。

弹出一对话框

在“响应”栏中选择C3列“Y10MPa”为因变量,再选择C2列“X(%)”为自变量,点击“确定”即可,在会话窗口显示结果:

回归分析:Y10MPa与X(%)

回归方程为

Y10MPa=28.5+131X(%)

系数标

自变量系数准误TP

常量28.4931.58018.040.000

X(%)130.8359.68313.510.000

S=1.31945R-Sq=94.8%R-Sq(调整)=94.3%

方差分析

来源自由度SSMSFP

回归1317.82317.82182.550.000

残差误差1017.411.74

合计11335.23

都全了,不错的线性关系。

再依次点击菜单“统计——回归-拟合线图”,方程曲线就出来了。

如果电脑中没有安装Minitab,也可以在MSExcel中计算出方程。下图是公式:

下图是计算结果:

将计算结果代入方程Y=a+bx即可求解,而方差分析的一些内容也是可以用Excel的公式方便的求解。

说明:

S:在拟合线图中叫优度,是表示曲线拟合程度的参数,而在方差分析中S叫标准方差。R-Sq:相关指数,是pearson相关系数r的平方,表示回归模型误差占总误差的百分比,取值在0-1之间,数值越大说明因素越显著,也说明回归模型与数据拟合的越好。

R-Sq(调整):Minitab调整的R-Sq,取值也在0-1之间,R-Sq(调整)与R-Sq越接近,表明回归模型越可靠。一般来说若>75%,存在相关性,我们可以谨慎使用,若85%以上则关系显著。

pearson相关系数r的计算公式:

其实回归模型中的一元线性方程的完整形式为Y=a+bx+ε,Y称为响应变量,x称为解释变量或协变量(由其引起的误差可以观测并解释),ε是一个不可观测的随机误差。既然不可观测,人们通常只研究可以观测的部分,所以实际应用中只采用公式Y=a+bx。

SS:离差平方和

MS:均方差,等于SS/自由度

F:=MS1/MS2

P:显著性水平,当P<0.05时,存在显著性相关

所谓残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,ζ2)。(δ-残差的均值)/残差的标准差,称为标准化残差,以δ*表示。δ*遵从标准正态分布N(0,1)。实验点的标准化残差落在(-2,2)区间以外的概率≤0.05。若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归线拟合。

显然,有多少对数据,就有多少个残差。残差分析就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰。

回归分析中SS,MS,F,P,S、R-Sq和R-Sq(调整)是什么意思,有什么意义?

S:回归模型误差的标准方差。

R-Sq:回归模型误差占总误差的百分比。取值在0%和100%之间,数值越大,表明回归模型与数据吻合得越好。

R-Sq(adj):调整的R-Sq,取值也在0%和100%之间。R-Sq(adj)与R-Sq 越接近,表明回归模型越可靠。

SS:离散差平方和

MS:均方差,=SS/自由度

F=MS1/MS2

P:显著性水平,当P小于0.05时,存在显著性相关

R-sq值越大越好,后面r-sq是minitab调整后的值,若大于百分之七十,存在相关性,我们可以使用,但需谨慎,85%以上,关系显著,也可以对话框的p值,=0.05,关系显著。

怎样用MINITAB进行过程能力分析

过程能力概述 一旦过程处于统计操纵状态,同时是连续生产,那么你可能想明白那个过程是否有能力满足规范的限制,生产出好的零件(产品),通过比较过程变差的宽度和规范界限的宽度能够确定过程能力。在评估过程能力之前,过程必须受控。假如过程不受控,你将得到不正确的过程能力值。 .你能通过画能力柱状图和能力图来评估过程能力。这些图形能够关心你评估数据的分布和检验过程是否受控。你也能够可能包括规范公差与正常过程变差之间比率的能力指数。能力指数或统计指数差不多上评估过程能力的一种方法,因为它们都没有单位,因此,能够用能力统计表来比较不同过程的能力。 选择能力命令 MINITAB提供了一组不同的能力分析命令,你能够依照数据的性质和分布从中选择命令,你能够对以下情况进行能力分析:——正态或Weibull概率模式(关于测量数据) ——不同子组之间可能有专门强变差的正态数据

——二项式或Poisson概率模式(关于计数数据或属性数据)当进行能力分析时,选择正确的公式是差不多要求,例如,MINITAB提供基于正态或Weibull分布模型上的能力分析工具,使用正态概率模型的命令提供了更完全的统计设置,然而,适用的数据必须近似于正态分布. 例如,利用正态概率模型,能力分析(正态)能够可能预期零件的缺陷PPM数。这些统计分析建立在两个假设的基础上,1、数据来自于一个稳定的过程,2、数据服从近似的正态分布,类似地,能力分析(Weibull)计算零件的缺陷的PPM值利用的是Weibull分布。在这两个例子中,统计分析正确性依靠于假设分布模型的正确性。 假如数据是歪斜特不严峻,那么用正态分布分析将得出与实际的缺陷率相差专门大的结果。在这种情况下,把那个数据转化比正态分布更适当的模型,或为数据选择不同的概率模式.用MINITAB,你能够使用Box-Cox能力转化或Weibull概率模型,非正态数据比较了这两种方法.

如何用MINITAB进行过程能力分析

过程能力概述 一旦过程处于统计控制状态,并且是连续生产,那么你可能想知道这个过程是否有能力满足规范的限制,生产出好的零件(产品),通过比较过程变差的宽度和规范界限的宽度可以确定过程能力。在评估过程能力之前,过程必须受控。如果过程不受控,你将得到不正确的过程能力值。 .你能通过画能力柱状图和能力图来评估过程能力。这些图形能够帮助你评估数据的分布和检验过程是否受控。你也可以估计包括规范公差与正常过程变差之间比率的能力指数。能力指数或统计指数都是评估过程能力的一种方法,因为它们都没有单位,所以,可以用能力统计表来比较不同过程的能力。 选择能力命令 MINITAB提供了一组不同的能力分析命令,你可以根据数据的性质和分布从中选择命令,你可以对以下情况进行能力分析: ——正态或Weibull概率模式(对于测量数据) ——不同子组之间可能有很强变差的正态数据 ——二项式或Poisson概率模式(对于计数数据或属性数据) 当进行能力分析时,选择正确的公式是基本要求,例如,MINITAB提供基于正态或Weibull分布模型上的能力分析工具,使用正态概率模型的命令提供了更完全的统计设置,但是,适用的数据必须近似于正态分布. 例如,利用正态概率模型,能力分析(正态)可以估计预期零件的缺陷PPM 数。这些统计分析建立在两个假设的基础上,1、数据来自于一个稳定的过程,2、数据服从近似的正态分布,类似地,能力分析(Weibull)计算零件的缺陷的PPM值利用的是Weibull分布。在这两个例子中,统计分析正确性依赖于假设分布模型的正确性。 如果数据是歪斜非常严重,那么用正态分布分析将得出与实际的缺陷率相差很大的结果。在这种情况下,把这个数据转化比正态分布更适当的模型,或为数据选择不同的概率模式.用MINITAB,你可以使用Box-Cox能力转化或Weibull概率模型,非正态数据比较了这两种方法. 如果怀疑过程中子组之间有很强的变差来源,可以使用能力分析(组间/组内)或SIXpack能力分析(组间/组内)。除组内数据具有随机误差外,组间还可能有随机变差。明白了子组变差的来源,可以为你提供过程更真实的潜在能力评估。能力分析(组间/组内)或SIXpack能力分析(组间/组内)既计算组内标准偏差也计算组间标准偏差,然后,集中它们来计算总的标准偏差。

用minitab软件进行测量的说明

用MINITAB软件进行测量系统分析 质量部陈志明 摘要数据分析在质量管理和过程控制活动中已得到了广泛的应用,而数据的质量又取决于测量系统的能力。本文以空调公司平衡型量热计空调系统性能测试平台的“GR&R”研究为例,介绍用MINITAB 进行测量系统分析的方法,供大家参考。 关键词数据分析MINITAB软件测量系统分析(MSA) 一测量系统分析概述 测量系统是对测量单元进行量化或对被测的特性进行评估,其所用的仪器或量具、标准、操作、方法、夹具、软件、人员、环境及假设的集合,也就是说用来获得测量结果的过程。理想的测量系统在每次使用时应只产生正确的测量结果:与一个标准值相符。而事实上,理想的测量系几乎是不存在的:用一把校准好的卡尺,不同的人测量同一件零件都会产生不同的结果。低质量的测量系统产生的测量结果往往本身就有较大的偏差,从而可能掩盖被分析过程的偏差,这种结果用于质量验证、质量改进和过程控制分析显然是不恰当的。 测量系统的质量经常使用其测得数据的统计特性来确定,测量系统必须处于统计控制中,也就说测量系统产生的偏差只能是由普通原因造成,而不应由于特殊原因导致。 测量系统分析就是用统计的方法分析测量系统所测数据的统计特性,而确定其质量水平。通常,我们用下述五个指标来评价测量系统的统计特性,它们是: 1)偏倚: 测量观察平均值与该零部件采用精密仪器测量的标准平均值的差值; 2)线性:表征量具预期工作范围内偏倚值的差别; 3)稳定性:表征测量系统对于给定的零部件或标准件随时间变化系统便倚中的总偏差量,与通常意义上的统计稳定性是有区别的; 4)重复性:指同一个评价人,采用同一种测量仪器,多次测量同一零件的同一特性时获得的测量值(数据)的偏差。 5)再现性:指由不同的评价人,采用相同的测量仪器,测量同一零件的同一特性时测量平均值的偏差。 通常,前三种指标用于评价测量系统的准确性,后两种指标用于评价测量系统的精确性。测量系统的准确性可以通过对设备的校准等比如参照ISO9000或ISO/TS16949关于测量系统的相关要求在体系上对测量系统进行维护、监控。也就是说,通过对测量系统的分辨率、偏倚、线性和稳定性进行分析后进行校准后可以解决其准确性问题,工程上通常用测量系统的精确性亦即其重复性和再现性来研究其统计特性,就是通常所说的“GR&R研究”。 二测量系统分析流程及方法 测量系统分析是一项重要的系统工程。通常需要根据测量过程的可重复性(破坏性或非破坏性)、测量结果性质(记数型数据或计量型数据)、待测单元的数量大小、过程的成本、仪器或量具的状态及测量过程输出的重要性等因素来确定分析的方法和流程。限于篇幅,本文仅就空调公司系统性能测试平台(量热计平衡室)的分析结合笔者对测量系统分析的了解做简要介绍,详细方法可参阅本文的参考文献(1)。 测量系统分析步骤: 1.验证“量具(gage)”的校准; 2.选择工件和测量者执行测量; 3.用MINITAB软件进行数据评估; 4.分析数据,解释结果,得出结论; 5.检查是否有不合格的测量单位,制定长期量具保持/改进计划。 量具必须经过校准且才处在正常状态,没有经过校准或者已经过了校准期限的量具是处于不正常状态的,其测量所得数据不能用于测量系统分析。 为保证数据的统计独立性,视测量过程的时间、费用等因素,一般随机选择代表整个过程的10件工

Minitab DOE数据分析

————— 2014/5/15 9:16:17 ————————————————————欢迎使用 Minitab,请按 F1 获得有关帮助。 结果: DOE_热处理(全因).MTW 拟合因子: 强度与加热温度, 加热时间, 转换时间, 保温时间 (Step3:回归系统的统计质量) 强度的估计效应和系数(已编码单位) 系数标 项效应系数准误 T P 常量 541.319 1.841 293.98 0.000 加热温度 20.038 10.019 1.841 5.44 0.032 加热时间 16.887 8.444 1.841 4.59 0.044 转换时间 3.813 1.906 1.841 1.04 0.409 保温时间 11.113 5.556 1.841 3.02 0.095 加热温度*加热时间 0.737 0.369 1.841 0.20 0.860 加热温度*转换时间 -0.487 -0.244 1.841 -0.13 0.907 加热温度*保温时间 3.062 1.531 1.841 0.83 0.493 加热时间*转换时间 1.263 0.631 1.841 0.34 0.764 加热时间*保温时间 7.113 3.556 1.841 1.93 0.193 转换时间*保温时间 0.837 0.419 1.841 0.23 0.841 加热温度*加热时间*转换时间 2.612 1.306 1.841 0.71 0.552 加热温度*加热时间*保温时间 -5.288 -2.644 1.841 -1.44 0.288 加热温度*转换时间*保温时间 1.787 0.894 1.841 0.49 0.675 加热时间*转换时间*保温时间 1.038 0.519 1.841 0.28 0.805 加热温度*加热时间*转换时间*保温时间 1.838 0.919 1.841 0.50 0.667 Ct Pt 1.981 4.634 0.43 0.711 (Step2:观察回归效果) S = 7.36546 (是西格玛希望越小越好) PRESS = * R-Sq = 97.17% R-Sq(预测) = *% R-Sq(调整) = 74.56% (step1:至少有两个主效应因子的P值大于等于0.05)

minitab基础知识解读

第一章基础知识 第一节数据类型及设置 在MINITAB系统中,有3种基本数据类型供用户选择,分别是:数值型数据、文本型数据和日期/时间型数据。 一般来说,不同类型的数据应采用不同的统计分析方法进行数据分析。所以,在应用MINITAB统计分析软件之前,应能够有效地识别不同类型的数据。 1.1.1 数值型(Numeric)数据 ⑴计量数据(Measurement Data) 计量数据,为观测每个观察单位某项指标的大小而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。假如一个数据的所有可能取值充满数轴上一个区间(a,b),则称这样的数据为计量数据,其中a可以是-∞,b可以是+∞,通常称这类数据是连续数据(Continuous Data)。这种类型的数据往往既可以取整数、小数、分数,有时候(虽然不是全部)还可以取负数。例如:长度、重量、温度、湿度、体积、误差、速度、时间、寿命等等。它的统计分析与连续随机变量(Continuous random variable)的分布有关。在MINITAB 统计分析功能中,这种数据是主要的分析对象,统计分析时,常用的参数和方法有:均值、标准差、t检验、方差分析、回归分析等。 ⑵计数数据(Enumeration Data) 计数数据又称为定性数据或分类数据(Categorical Data),是将观察单位按某种属性或类别分组计数,分别汇总各组观察单位后而得到的数据,其变量值是定性的,表现为互不相容的属性或类别。这类数据仅取数轴上有限个点或可列个点,一般只取非负整数,不取小数、分数,更不取负数。例如:某一单位面积内某一种缺陷的个数、一批产品中不合格品的个数、一个超市每天进入的人数、一个麦穗上的麦粒数等等。它的统计分析是与具有离散随机变量(Discrete random variable)的分布有关。在MINITAB的统计分析功能中,常采用非参数分析、2 χ检验、二项分布、超几何分布、泊松分布等统计方法。 以上两种数据的分类是相对的,在某些情况下,两种数据可以互相转化。例如:当观察某一特定人群的年龄时,年龄这个变量是连续的计量值数据,但是在实际统计分析时,为了使统计分析简化,往往按年、月、日进行分类,就变成了计数数据。 ⑶等级数据(Ranked Data) 例如:对产品的质量情况进行分类,可以分为合格品、不合格品,或者分为一级品、二级品、等外品等等。在统计分析时这类数据常用比率、等级相关、非参数检验等统计分析方法。 ⑷有序数据(Ordinal Data) 有序数据又称为有序分类数据(Ordinal Categories)。例如:评定某种酒或茶叶的品质时,只能评出一个顺序,又如布料和毛皮的手感程度等等。

Minitab统计分析(上)

Minitab统计分析(上) Minitab介绍 1.Minitab是众多统计软件当中比较简单易懂的软件之一; 2.相对来讲,Minitab在质量管理方面的应用是比较适合的; 3.Minitab的功能齐全,一般的数据分析和图形处理都可以应付自如。Minitab与6 Sigma的关系1.在上个世纪80年代Motolora开始在公司内推行6 Sigma,并开始借助Minitab 使6 Sigma得以最大限度的发挥;2.6 Sigma的MAIC阶段中,很多分析和计算都可以都通过Minitab简单的完成;3.即使是对统计的知识不怎么熟悉,也同样可以运用Minitab 很好的完成各项分析。Minitab的功能 1.计算功能(1)计算器功能(2)生成数据功能(3) 概率分布功能(4)矩阵运算2.数据分析功能 (1)基本统计(2)回归分析(3)方差分析(4)实验设计分析(5)控制图(6)质量工 具(7)多变量分析时间序列;列联表,非参数估计,EDA,概率与样本容量。3.图形分析(1)直方图 (2)散布图(3)时间序列图(4)条形图(5)箱图(6)矩阵图(7)轮廓图三维图,点图,饼图,边际图,概率图,茎叶图,特征图。课程内容安排1.由于时间有限,很多内容只是做简单的介绍;2.在两天的时间里,主要的课程内容安

排如下:Minitab界面和基本操作介绍 数据的生成(Make Random Data)数据的生成结果生成有规律的数据 Select:计算>产生模板化数据>简单数集结果输出数据类型的转换(Change Data Type)Select: 数据> 更改数据类型> 数字到文本数据类型的转换结果数据的堆栈(Stack&Unstack)Select: 数据> 堆叠> 列数据的堆栈结果数据块的堆栈(Stack Blocks)Select: 数据> 堆叠> 列的区组数据块的堆栈结果转置栏(Transpose Columns)Select: 数据> 转置列转置结果连接(Concatenate)Select: 数据> 合并连接结果编码(Code) Select: 数据> 编码>数字到文本编码结果Minitab 之常用图形QC手法常用的图形如下:(1)特性要因图(2)控制图(参见SPC部分)(3)柏拉图(4)散布图(5)直方图(6)时间序列图特性要因图练习输入表中Select: 统计> 质量工具> 因果填好各项需要的参数柏拉图练习输入数据Select: 统计> 质量工具> Pareto 图结果输出练习下表为STS冷轧工厂ZRM不良现状,试做分析散布图练习输入数据 Select: 图形> 散点图输入参数输出图形直方图练习输入数据

相关文档
相关文档 最新文档