文档库 最新最全的文档下载
当前位置:文档库 › 解读Minitab的正态概率图

解读Minitab的正态概率图

解读Minitab的正态概率图
解读Minitab的正态概率图

解读Minitab的正态概率图

P值是MINITAB通过某种分布(F、T等)转换过来的一个值,正是由于概率中有太多的分布,一般对统计学不是很清楚的人是很难记住这些分布的。通过转换,在MINITAB中,就只需看一个值,即P值,一般取0.05。通过它来做假设检验,而假设检验又有很多类型,不是一下子能讲清楚的。

就LZ问题而言,从图中得出来的P值为0.84,大于0.05,可认为数据为正态分布(虽然样本量少了点)。至于P值到底如何而来,AD值代表何意,就个人见解而言,LZ可以先不到这个深度。

Anderson-Darling 统计量,测量数据服从特定分布的程度。分布与数据拟合越好,此统计量越小。使用Anderson-Darling 统计量可比较若干分布的拟合情况,以查看哪种分布是最佳分布,或者检验数据样本是否来自具有指定分布的总体。例如,可以使用Anderson-Darling 统计量为可靠性数据分析在Weibull 和对数正态分布之间进行选择,或者检验数据是否符合t 检验的正态性假设。其实看一下Minitab帮助什么都有。

AD值代表你的真实的量测数据的累计分布与理论正态的累计正态分布的面积差,AD值越小,说明你的数据越接近正态分布数据。

在DOE、Regression、统计检定时常需要用到正态分布的假设,检定一组数据是否取自正态分布,进行常态性检定最简单方法就是采用正态概率图。

最近很多贴文询问Minitab正态概率图的坐标系统、意义与手工绘制等议题,因涉及分配概率图的理解与使用,因此撰文剖析,如下图是以一组14个样本数据所画的正态概率图

本图原始数据,经排序后如下

34,35,36,37,38,39,40,40,41,42,43,44,45,46

图上有5个注解,依序说明之

注解1:Probability Plot of x,表示此图是一组数据,放在名为x的栏位上,下方有Normal表示本项检定的H0是Normal –正态分布,当然H1就是非正态分布

注解2:Mean 40表示数据平均值,StDev 3.742(计算结果3.74166)表示数据标准差,N 14表示数据数,这些计算式依据一般基本统计的公式计算而得

注解3:蓝色直线是画在正态分布机率图纸上,是一条参考线,以判断是否H0

成立

详细解说如下

1) 鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表

2) Percent与x数值表中,Percent为正态分布累积分配函数(CDF),数值是介于0与1之间,表上数值为%值,习惯上是以F(x)表式之,而x为F(x)的反函数

3) 若直接以Percent与x( inv F(x))数值表作散布图不会得到依直线,而是S型曲线

4) 在Percent与x( inv F(x))数值表多加一栏z,其值为x( inv F(x))的标准化,z=( inv F(x)) – 40)/3.74166

5) 以x( inv F(x))为横轴,z为纵轴作散布图+回归线,可得一直线,将每个点以Percent作为数据卷标

6) 隐藏纵轴z,改用Percent的数据标签,就是一般的正态概率图纸

** 此处须要另文说明解读正态概率图-正态概率图纸的秘密 **

注解4:红色散布图图点是将样本数据排序后,以median rank估计出该点的CDF 值,根据CDF数值求出标准正态分布的反函数z值,再以x vs z 绘出散布图(参考注解3)

** 此处须要另文说明解读正态概率图-绘制小样本数据检验常态性**

注解5:Anderson-Darling 常态性检定以辅助图型判断

** 此处须要另文说明解读正态概率图- Anderson-Darling檢定**

正态概率图(normal probability plot)

正态概率图(normal probability plot) 方法演变:概率图,分位数-分位数图( Q- Q) 概述 正态概率图用于检查一组数据是否服从正态分布。是实数与正态分布数据之间函数关系的散点图。如果这组实数服从正态分布,正态概率图将是一条直线。通常,概率图也可以用于确定一组数据是否服从任一已知分布,如二项分布或泊松分布。 适用场合 ·当你采用的工具或方法需要使用服从正态分布的数据时; ·当有50个或更多的数据点,为了获得更好的结果时。 例如: ·确定一个样本图是否适用于该数据; ·当选择作X和R图的样本容量,以确定样本容量是否足够大到样本均值服从正态分布时;·在计算过程能力指数Cp或者Cpk之前; ·在选择一种只对正态分布有效的假设检验之前。 实施步骤 通常,我们只需简单地把数据输入绘图的软件,就会产生需要的图。下面将详述计算过程,这样就可以知道计算机程序是怎么来编译的了,并且我们也可以自己画简单的图。 1将数据从小到大排列,并从1~n标号。 2计算每个值的分位数。i是序号: 分位数=(i-0.5)/n 3找与每个分位数匹配的正态分布值。把分位数记到正态分布概率表下面的表A.1里面。然后在表的左边和顶部找到对应的z值。 4根据散点图中的每对数据值作图:每列数据值对应个z值。数据值对应于y轴,正态分位数z值对应于x轴。将在平面图上得到n个点。 5画一条拟合大多数点的直线。如果数据严格意义上服从正态分布,点将形或一条直线。将点形成的图形与画的直线相比较,判断数据拟合正态分布的好坏。请参阅注意事项中的典型图

形。可以计算相关系数来判断这条直线和点拟合的好坏。 示例 为了便于下面的计算,我们仅采用20个数据。表5. 12中有按次序排好的20个 值,列上标明“过程数据”。 下一步将计算分位数。如第一个值9,计算如下: 分位数=(i-0.5)/n=(1-0.5)/20=0.5/20=0.025 同理,第2个值,计算如下: 分位数=(i-0.5)/n=(2-0.5)/20=1.5/20=0.075 可以按下面的模式去计算:第3个分位数=2.5÷20,第4个分位数=3 5÷20 以此类推直到最后1个分位数=19. 5÷20。 现在可以在正态分布概率表中查找z值。z的前两 个阿拉伯数字在表的最左边一列,最后1个阿拉伯数 字在表的最顶端一行。如第1个分位数=0. 025,它位 于-1.9在行与0.06所在列的交叉处,故z=-1.96。 用相同的方式找到每个分位数。 如果分位数在表的两个值之间,将需要用插值法 进行求解。例如:第4个分位数为0. 175,它位于0.1736 与0.1762之间。0.1736对应的z值为-0.94,0.1762 对应的z值为-0.93,故 这两数的中间值为z=-0.935。 现在,可以用过程数据和相应的z值作图。图表5. 127显示了结果和穿过这些点的直线。注意:在图形的两端,点位于直线的上侧。这属于典型的右偏态数据。图表5.128显示了数据的直方图,可进行比较。 概率图( probability plot) 该方法可以用于检验任何数据的已知分布。这时我们不是在正态分布概率表中查找分位数,而是在感兴趣的已知分布表中查找它们。 分位数-分位数图(quantile-quantile plot) 同理,任意两个数据集都可以通过比较来判断是否服从同一分布。计算每个分布的分位数。一个数据集对应于x轴,另一个对应于y轴。作一条45°的参照线。如果这两个数据集来自同一分布,那么这些点就会靠近这条参照线。 注意事项 ·绘制正态概率图有很多方法。除了这里给定的程序以外,正态分布还可以用概率和百分数来表示。实际的数据可以先进行标准化或者直接标在x轴上。 ·如果此时这些数据形成一条直线,那么该正态分布的均值就是直线在y轴截距,标准差就是直线斜率。 ·对于正态概率图,图表5.129显示了一些常见的变形图形。 短尾分布:如果尾部比正常的短,则点所形成的图形左边朝直线上方弯曲,右边朝直线下方弯曲——如果倾斜向右看,图形呈S型。表明数据比标准正态分布时候更加集中靠近均值。 长尾分布:如果尾部比正常的长,则点所形成的图形左边朝直线下方弯曲,右边朝直线上方弯曲——如果倾斜向右看,图形呈倒S型。表明数据比标准正态分布时候有更多偏离的数据。

Minitab软件过程能力概述与分析

过程能力概述 一旦过程处于统计操纵状态,同时是连续生产,那么你可能想明白那个过程是否有能力满足规范的限制,生产出好的零件(产品),通过比较过程变差的宽度和规范界限的宽度能够确定过程能力。在评估过程能力之前,过程必须受控。假如过程不受控,你将得到不正确的过程能力值。 .你能通过画能力柱状图和能力图来评估过程能力。这些图形能够关心你评估数据的分布和检验过程是否受控。你也能够可能包括规范公差与正常过程变差之间比率的能力指数。能力指数或统计指数差不多上评估过程能力的一种方法,因为它们都没有单位,因此,能够用能力统计表来比较不同过程的能力。 选择能力命令 MINITAB提供了一组不同的能力分析命令,你能够依照数据的性质和分布从中选择命令,你能够对以下情况进行能力分析:——正态或Weibull概率模式(关于测量数据) ——不同子组之间可能有专门强变差的正态数据

——二项式或Poisson概率模式(关于计数数据或属性数据)当进行能力分析时,选择正确的公式是差不多要求,例如,MINITAB提供基于正态或Weibull分布模型上的能力分析工具,使用正态概率模型的命令提供了更完全的统计设置,然而,适用的数据必须近似于正态分布. 例如,利用正态概率模型,能力分析(正态)能够可能预期零件的缺陷PPM数。这些统计分析建立在两个假设的基础上,1、数据来自于一个稳定的过程,2、数据服从近似的正态分布,类似地,能力分析(Weibull)计算零件的缺陷的PPM值利用的是Weibull分布。在这两个例子中,统计分析正确性依靠于假设分布模型的正确性。 假如数据是歪斜特不严峻,那么用正态分布分析将得出与实际的缺陷率相差专门大的结果。在这种情况下,把那个数据转化比正态分布更适当的模型,或为数据选择不同的概率模式.用MINITAB,你能够使用Box-Cox能力转化或Weibull概率模型,非正态数据比较了这两种方法.

如何检验数据是否服从正态分布

如何检验数据是否服从正态分布 一、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵 坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐 标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 以上两种方法以Q-Q图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 二、计算法 1、偏度系数(Skewness)和峰度系数(Kurtosis) 计算公式: g1表示偏度,g2表示峰度,通过计算g1和g2及其标准误σg1及σg2然后作U检验。两种检验同时得出U0.05的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近0……可以认为……近似服从正态分布”并不严谨。 2、非参数检验方法 非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk(W 检验)。 SAS中规定:当样本含量n≤2000时,结果以Shapiro – Wilk(W检验)为准,当样本含量n >2000时,结果以Kolmogorov – Smirnov(D检验)为准。 SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位 于3和50之间时,计算Shapiro-Wilk统计量。对于无权重或整数权重,在加权 样本大小位于3和5000之间时,计算该统计量。由此可见,部分SPSS教材里面关于“Shapiro –Wilk适用于样本量3-50之间的数据”的说法是在是理解片面,误人子弟。(2)单样本Kolmogorov-Smirnov检验可用于检验变量(例如income)是否为正态分布。 对于此两种检验,如果P值大于0.05,表明资料服从正态分布。 三、SPSS操作示例

如何用MINITAB进行过程能力分析

过程能力概述 一旦过程处于统计控制状态,并且是连续生产,那么你可能想知道这个过程是否有能力满足规范的限制,生产出好的零件(产品),通过比较过程变差的宽度和规范界限的宽度可以确定过程能力。在评估过程能力之前,过程必须受控。如果过程不受控,你将得到不正确的过程能力值。 .你能通过画能力柱状图和能力图来评估过程能力。这些图形能够帮助你评估数据的分布和检验过程是否受控。你也可以估计包括规范公差与正常过程变差之间比率的能力指数。能力指数或统计指数都是评估过程能力的一种方法,因为它们都没有单位,所以,可以用能力统计表来比较不同过程的能力。 选择能力命令 MINITAB提供了一组不同的能力分析命令,你可以根据数据的性质和分布从中选择命令,你可以对以下情况进行能力分析: ——正态或Weibull概率模式(对于测量数据) ——不同子组之间可能有很强变差的正态数据 ——二项式或Poisson概率模式(对于计数数据或属性数据) 当进行能力分析时,选择正确的公式是基本要求,例如,MINITAB提供基于正态或Weibull分布模型上的能力分析工具,使用正态概率模型的命令提供了更完全的统计设置,但是,适用的数据必须近似于正态分布. 例如,利用正态概率模型,能力分析(正态)可以估计预期零件的缺陷PPM 数。这些统计分析建立在两个假设的基础上,1、数据来自于一个稳定的过程,2、数据服从近似的正态分布,类似地,能力分析(Weibull)计算零件的缺陷的PPM值利用的是Weibull分布。在这两个例子中,统计分析正确性依赖于假设分布模型的正确性。 如果数据是歪斜非常严重,那么用正态分布分析将得出与实际的缺陷率相差很大的结果。在这种情况下,把这个数据转化比正态分布更适当的模型,或为数据选择不同的概率模式.用MINITAB,你可以使用Box-Cox能力转化或Weibull概率模型,非正态数据比较了这两种方法. 如果怀疑过程中子组之间有很强的变差来源,可以使用能力分析(组间/组内)或SIXpack能力分析(组间/组内)。除组内数据具有随机误差外,组间还可能有随机变差。明白了子组变差的来源,可以为你提供过程更真实的潜在能力评估。能力分析(组间/组内)或SIXpack能力分析(组间/组内)既计算组内标准偏差也计算组间标准偏差,然后,集中它们来计算总的标准偏差。

正态分布概率表

参考医学 正态分布概率表 1 — f? 0( u )= t P⑴t F(t)t F(0t卩⑴0.00 0.000 00.230. 181 9 0.46 0.354 5 W9 0. 50 9 8 0.01 0.008 00.24 0. 1H9 70.47 0.361 6 0.70 0,516 1 0+02 0,0160 0. 25 0,197 4 0,48 0.368 80+71 0.522 3 0.03 0*023 9(1. 26 0.205 1 0.49 0.375 9 0.72 0. 52 8 5 044 0.031 9(1.27 0,212 8 0.50O.3R2 9 0.73 "4 6 0R5 0039 90.28 0.220 5 0,51 0.389 9 0.74 0.540 7 0.06 0.047 80.29 0.228 20.52 036 9 0.75 0*546 7 0+07 0 €55 g0,30 0,235 8 0,53 0.403 9 276 0.552 7 0+08 0.063 80 31 0.243 4 0.54 0.410 8 0+77 0.558 7 0+09 (1.(171 7(J. 32 0.251 00.55 0.417 70.78 0.564 6 0. 10 0.0797 fl. 33 0.258 6 0.56 0,424 50.79 0.570 5 0.110,(J87 60.34 0.266 1 0.57 0.431 3 0.B0 0.576 3 0.12 0.09$ 50. 35 0.273 7 0.5S 0.43S 10.S1 O.5S2 1 0+13 OJ03 40. 36 0.281 20.59 0.444 8 0+82 0.587 8 0+14 (1.111 3 0. 37 0.288 6 0.60 0.451 5 M3 0.593 5 0.15 0J19 2 0. 38 0.296 1 0.61 0.458 10.84 0.599 1 0+160.127 10.39 0. 303 50.62 0.464 7 0.85 0.604 7 0.17 0.135 0 040 0330 8 0.63 0.471 3 0.S6 0.610 2 0+18 0.142 S0.41 0.318 20,64 0.477 8 0.87 0.6157 0+19 0.150 7 0 42 0, 325 50.650.484 3 0.88 0.621 1 0,20 0J58 5(J. 43 0. 332 8 0.66 0.490 10.89 0 . 62 6 5 0,21 0J66 3(J.44 0,340 1 0.67 0.497 10.90 0.631 9 0 + 220.174 10.45 0347 3 0.68 0.503 50.91 0.637 2

用minitab软件进行测量的说明

用MINITAB软件进行测量系统分析 质量部陈志明 摘要数据分析在质量管理和过程控制活动中已得到了广泛的应用,而数据的质量又取决于测量系统的能力。本文以空调公司平衡型量热计空调系统性能测试平台的“GR&R”研究为例,介绍用MINITAB 进行测量系统分析的方法,供大家参考。 关键词数据分析MINITAB软件测量系统分析(MSA) 一测量系统分析概述 测量系统是对测量单元进行量化或对被测的特性进行评估,其所用的仪器或量具、标准、操作、方法、夹具、软件、人员、环境及假设的集合,也就是说用来获得测量结果的过程。理想的测量系统在每次使用时应只产生正确的测量结果:与一个标准值相符。而事实上,理想的测量系几乎是不存在的:用一把校准好的卡尺,不同的人测量同一件零件都会产生不同的结果。低质量的测量系统产生的测量结果往往本身就有较大的偏差,从而可能掩盖被分析过程的偏差,这种结果用于质量验证、质量改进和过程控制分析显然是不恰当的。 测量系统的质量经常使用其测得数据的统计特性来确定,测量系统必须处于统计控制中,也就说测量系统产生的偏差只能是由普通原因造成,而不应由于特殊原因导致。 测量系统分析就是用统计的方法分析测量系统所测数据的统计特性,而确定其质量水平。通常,我们用下述五个指标来评价测量系统的统计特性,它们是: 1)偏倚: 测量观察平均值与该零部件采用精密仪器测量的标准平均值的差值; 2)线性:表征量具预期工作范围内偏倚值的差别; 3)稳定性:表征测量系统对于给定的零部件或标准件随时间变化系统便倚中的总偏差量,与通常意义上的统计稳定性是有区别的; 4)重复性:指同一个评价人,采用同一种测量仪器,多次测量同一零件的同一特性时获得的测量值(数据)的偏差。 5)再现性:指由不同的评价人,采用相同的测量仪器,测量同一零件的同一特性时测量平均值的偏差。 通常,前三种指标用于评价测量系统的准确性,后两种指标用于评价测量系统的精确性。测量系统的准确性可以通过对设备的校准等比如参照ISO9000或ISO/TS16949关于测量系统的相关要求在体系上对测量系统进行维护、监控。也就是说,通过对测量系统的分辨率、偏倚、线性和稳定性进行分析后进行校准后可以解决其准确性问题,工程上通常用测量系统的精确性亦即其重复性和再现性来研究其统计特性,就是通常所说的“GR&R研究”。 二测量系统分析流程及方法 测量系统分析是一项重要的系统工程。通常需要根据测量过程的可重复性(破坏性或非破坏性)、测量结果性质(记数型数据或计量型数据)、待测单元的数量大小、过程的成本、仪器或量具的状态及测量过程输出的重要性等因素来确定分析的方法和流程。限于篇幅,本文仅就空调公司系统性能测试平台(量热计平衡室)的分析结合笔者对测量系统分析的了解做简要介绍,详细方法可参阅本文的参考文献(1)。 测量系统分析步骤: 1.验证“量具(gage)”的校准; 2.选择工件和测量者执行测量; 3.用MINITAB软件进行数据评估; 4.分析数据,解释结果,得出结论; 5.检查是否有不合格的测量单位,制定长期量具保持/改进计划。 量具必须经过校准且才处在正常状态,没有经过校准或者已经过了校准期限的量具是处于不正常状态的,其测量所得数据不能用于测量系统分析。 为保证数据的统计独立性,视测量过程的时间、费用等因素,一般随机选择代表整个过程的10件工

Minitab DOE数据分析

————— 2014/5/15 9:16:17 ————————————————————欢迎使用 Minitab,请按 F1 获得有关帮助。 结果: DOE_热处理(全因).MTW 拟合因子: 强度与加热温度, 加热时间, 转换时间, 保温时间 (Step3:回归系统的统计质量) 强度的估计效应和系数(已编码单位) 系数标 项效应系数准误 T P 常量 541.319 1.841 293.98 0.000 加热温度 20.038 10.019 1.841 5.44 0.032 加热时间 16.887 8.444 1.841 4.59 0.044 转换时间 3.813 1.906 1.841 1.04 0.409 保温时间 11.113 5.556 1.841 3.02 0.095 加热温度*加热时间 0.737 0.369 1.841 0.20 0.860 加热温度*转换时间 -0.487 -0.244 1.841 -0.13 0.907 加热温度*保温时间 3.062 1.531 1.841 0.83 0.493 加热时间*转换时间 1.263 0.631 1.841 0.34 0.764 加热时间*保温时间 7.113 3.556 1.841 1.93 0.193 转换时间*保温时间 0.837 0.419 1.841 0.23 0.841 加热温度*加热时间*转换时间 2.612 1.306 1.841 0.71 0.552 加热温度*加热时间*保温时间 -5.288 -2.644 1.841 -1.44 0.288 加热温度*转换时间*保温时间 1.787 0.894 1.841 0.49 0.675 加热时间*转换时间*保温时间 1.038 0.519 1.841 0.28 0.805 加热温度*加热时间*转换时间*保温时间 1.838 0.919 1.841 0.50 0.667 Ct Pt 1.981 4.634 0.43 0.711 (Step2:观察回归效果) S = 7.36546 (是西格玛希望越小越好) PRESS = * R-Sq = 97.17% R-Sq(预测) = *% R-Sq(调整) = 74.56% (step1:至少有两个主效应因子的P值大于等于0.05)

正态分布、概率

信息系统项目管理师重点知识点:完工概率计算总结 例图: 活动BCD的乐观(m)工期都是9天,最可能(o)工期为12天,最悲观(p)工期都是15天,那么在14天内完成单项活动的概率和完成全部这三项活动的概率是多少 首先计算平均工期(PERT):公式--(乐观时间+4*最可能时间+悲观时间)/ 6 (9+4*12+15)/6=12天; 其次计算标准差:公式--(悲观时间-乐观时间)/ 6 ; (15-9)/6=1天 再计算偏离平均工期:方法--[给出的天数计算(14)-计算出来的平均工期(12)]/标准差(1) (14-12)/1=2 备注:此时得出来的为几,之后就是使用几西格玛 (Sigma)(1σ=68,37%)(2σ=95.46%)(3σ=99.73%)(6σ=99.99966%百万分之三点四) 计算每一项活动在14天内完工的概率是:方法--正态分布概率+西格玛/偏离平均工期数 50%+95.46%/2=97.73% 备注:50%参考正态分布图,95.46参考2西格玛值; 计算全部活动在14天内完工概率是:方法--每一项活动的概率相乘 97.73%*97.73%*97.73%=93.34% 下图为简要正态分布图:

备注:正态分布有50%成功,有50%不成功 如计算将上面的14天,修改为13天; 偏离平均工期就是1天,计算方法:(13-12)/1=1天,则应该使用1西格玛; 计算每一项活动在13天内完工的概率是:方法--正态分布概率+西格玛/偏离平均工期数 50%+68.37%/2=84.19% 备注:50%参考正态分布图,68.37参考1西格玛值; 计算全部活动在13天内完工概率是:方法--每一项活动的概率相乘 84.19%*84.19%*84.19%=59.67% 如果计算为11-15天的概率:最小值的概率+最大值的概率 68.37/2+99.75/2=84.06%

解读Minitab的正态概率图

解读Minitab的正态概率图 已有371 次阅读2009-11-5 20:41 |个人分类:Minitab|关键词:Minitab 在DOE、Regression、统计检定时常需要用到正态分布的假设,检定一组数据是否取自正态分布,进行常态性检定最简单方法就是采用正态概率图。 最近很多贴文询问Minitab正态概率图的坐标系统、意义与手工绘制等议题,因涉及分配概率图的理解与使用,因此撰文剖析,如下图是以一组14个样本数据所画的正态概率图 本图原始数据,经排序后如下 34,35,36,37,38,39,40,40,41,42,43,44,45,46 图上有5个注解,依序说明之 注解1:Probability Plot of x,表示此图是一组数据,放在名为x的栏位上,下方有Normal 表示本项检定的H0是Normal –正态分布,当然H1就是非正态分布 注解2:Mean 40表示数据平均值,StDev 3.742(计算结果3.74166)表示数据标准差,N 14表示数据数,这些计算式依据一般基本统计的公式计算而得 注解3:蓝色直线是画在正态分布机率图纸上,是一条参考线,以判断是否H0成立 详细解说如下 1)鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表

2) Percent与x数值表中,Percent为正态分布累积分配函数(CDF),数值是介于0与1之间,表上数值为%值,习惯上是以F(x)表式之,而x为F(x)的反函数 3)若直接以Percent与x( inv F(x))数值表作散布图不会得到依直线,而是S型曲线 4)在Percent与x( inv F(x))数值表多加一栏z,其值为x( inv F(x))的标准化,z=( inv F(x)) –40)/3.74166 5)以x( inv F(x))为横轴,z为纵轴作散布图+回归线,可得一直线,将每个点以Percent作为数据卷标 6)隐藏纵轴z,改用Percent的数据标签,就是一般的正态概率图纸 ** 此处须要另文说明解读正态概率图-正态概率图纸的秘密** 注解4:红色散布图图点是将样本数据排序后,以median rank估计出该点的CDF值,根据CDF数值求出标准正态分布的反函数z值,再以x vs z绘出散布图(参考注解3) ** 此处须要另文说明解读正态概率图-绘制小样本数据检验常态性** 注解5:Anderson-Darling常态性检定以辅助图型判断 ** 此处须要另文说明解读正态概率图- Anderson-Darling检定** 延伸阅读: 用Excel做简易的正态概率图(Normal probability plot)例

利用Excel软件绘制正态概率纸的方法_图文(精)

数理统计分靳与应用 , 偏差O-,能够直观地分析出工序的过程能力,求出工序的过程能力指数Cr值或Cm值.并且还可咀估计工序的不合格品率。因此,利用正态概率纸分析工序的方法,具有多功能的优点(参阅文献『1]): 利用正态概率纸分析工序,有着直观、简单、快速和易于掌握等诸多优点,在生产现场中使用备受欢迎,但由于它是一种图算法,精度相对较差,然而在现场使用其精度也已足够。如能提高正态概率纸本身的绘制精度,将有助于弥补正态概率纸的这一缺点。 但是采用正态概率纸分析 j 工序,其前提是必须首先有正态j 概率纸,因此,就必须首先解决i 正态概率纸的绘制问题。 过去绘制正态概率纸都是手工放大绘图,然后缩小印制成专用坐标纸再供现场使用,不仅麻烦,而且误差较大,更加影响了使用精度。现在由于电脑的普及,采用电子表格软件Excel绘 态概率纸纵坐标上各代表点的位置问题。 根据文献[2]所提供的手工绘制正态概率纸的步骤,对之加咀改造和发展,形成下列利用Excel绘制正态概率纸的方法和步骤: 1.选纵坐标值中有代表性的点(正态分布函数值“):

0.0l%,0.02%,…,0.09%;0.10%.0.20%,…,0.90%:1.00%,2.00%.….9.00%;1000%.11.00%. ….19.00%;20.00%,22.00%.….28.00%(取偶数);30.00%,32.00%, ?一,38.00%(取偶数);40.00%,42.00%,…,48.00%(取偶数);50.00%,52.00%,…,58.00%(取偶 数):60.00%,62.00%,…,68瑚%(取偶数);70肿%.72.00%,….78.00%f取偶数);80.oo%,81肿%,?一, 89.00%;90.00%,91.00%,….99.00%;99.10%,99.20%, …, 99.90%:99.91%.9992%,….99.99%。 2.查正态分布函数表,查出上 刻度之间的间距)的方法来绘制表格的,故我们需要将原始纵坐标的数据转化成行高数据,以便于纵坐标的绘制;横坐标是等间距的,故一般设为lOO列,间距 即列宽为0.38。 纵坐标数据的转化公式:(1)算出相邻两个Zct之间的差值X。 X=Za..一ZⅡ+l (I)

解读Minitab的正态概率图

解读Minitab的正态概率图 P值是MINITAB通过某种分布(F、T等)转换过来的一个值,正是由于概率中有太多的分布,一般对统计学不是很清楚的人是很难记住这些分布的。通过转换,在MINITAB中,就只需看一个值,即P值,一般取0.05。通过它来做假设检验,而假设检验又有很多类型,不是一下子能讲清楚的。 就LZ问题而言,从图中得出来的P值为0.84,大于0.05,可认为数据为正态分布(虽然样本量少了点)。至于P值到底如何而来,AD值代表何意,就个人见解而言,LZ可以先不到这个深度。 Anderson-Darling 统计量,测量数据服从特定分布的程度。分布与数据拟合越好,此统计量越小。使用Anderson-Darling 统计量可比较若干分布的拟合情况,以查看哪种分布是最佳分布,或者检验数据样本是否来自具有指定分布的总体。例如,可以使用Anderson-Darling 统计量为可靠性数据分析在Weibull 和对数正态分布之间进行选择,或者检验数据是否符合t 检验的正态性假设。其实看一下Minitab帮助什么都有。 AD值代表你的真实的量测数据的累计分布与理论正态的累计正态分布的面积差,AD值越小,说明你的数据越接近正态分布数据。 在DOE、Regression、统计检定时常需要用到正态分布的假设,检定一组数据是否取自正态分布,进行常态性检定最简单方法就是采用正态概率图。 最近很多贴文询问Minitab正态概率图的坐标系统、意义与手工绘制等议题,因涉及分配概率图的理解与使用,因此撰文剖析,如下图是以一组14个样本数据所画的正态概率图 本图原始数据,经排序后如下

34,35,36,37,38,39,40,40,41,42,43,44,45,46 图上有5个注解,依序说明之 注解1:Probability Plot of x,表示此图是一组数据,放在名为x的栏位上,下方有Normal表示本项检定的H0是Normal –正态分布,当然H1就是非正态分布 注解2:Mean 40表示数据平均值,StDev 3.742(计算结果3.74166)表示数据标准差,N 14表示数据数,这些计算式依据一般基本统计的公式计算而得 注解3:蓝色直线是画在正态分布机率图纸上,是一条参考线,以判断是否H0 成立 详细解说如下 1) 鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表 2) Percent与x数值表中,Percent为正态分布累积分配函数(CDF),数值是介于0与1之间,表上数值为%值,习惯上是以F(x)表式之,而x为F(x)的反函数 3) 若直接以Percent与x( inv F(x))数值表作散布图不会得到依直线,而是S型曲线 4) 在Percent与x( inv F(x))数值表多加一栏z,其值为x( inv F(x))的标准化,z=( inv F(x)) – 40)/3.74166 5) 以x( inv F(x))为横轴,z为纵轴作散布图+回归线,可得一直线,将每个点以Percent作为数据卷标 6) 隐藏纵轴z,改用Percent的数据标签,就是一般的正态概率图纸 ** 此处须要另文说明解读正态概率图-正态概率图纸的秘密 ** 注解4:红色散布图图点是将样本数据排序后,以median rank估计出该点的CDF 值,根据CDF数值求出标准正态分布的反函数z值,再以x vs z 绘出散布图(参考注解3) ** 此处须要另文说明解读正态概率图-绘制小样本数据检验常态性** 注解5:Anderson-Darling 常态性检定以辅助图型判断 ** 此处须要另文说明解读正态概率图- Anderson-Darling檢定**

正态分布概率公式(部分)

Generated by Foxit PDF Creator ? Foxit Software https://www.wendangku.net/doc/9812863129.html, For evaluation only.
图 62正态分布概率密度函数的曲线 正态曲线可用方程式表示。 n 当 →∞时,可由二项分布概率函数方程推导出正态 分布曲线的方程:
fx= (61 ) () .6
式中: x—所研究的变数; fx —某一定值 x出现的函数值,一般称为概率 () 密度函数 (由于间断性分布已转变成连续性分布,因而我们只能计算变量落在某 一区间的概率, 不能计算变量取某一值, 即某一点时的概率, 所以用 “概率密度” 一词以与概率相区分),相当于曲线 x值的纵轴高度; p—常数,等于 31 .4 19……; e— 常数,等于 2788……; μ 为总体参数,是所研究总体 5 .12 的平均数, 不同的正态总体具有不同的 μ , 但对某一定总体的 μ 是一个常数; δ 也为总体参数, 表示所研究总体的标准差, 不同的正态总体具有不同的 δ , 但对某一定总体的 δ 是一个常数。 上述公式表示随机变数 x的分布叫作正态分布, 记作 N μ ,δ2 ), “具 ( 读作 2 平均数为 μ,方差为 δ 的正态分布”。正态分布概率密度函数的曲线叫正态 曲线,形状见图 62。 (二)正态分布的特性
1、正态分布曲线是以 x μ 为对称轴,向左右两侧作对称分布。因 =

数值无论正负, 只要其绝对值相等, 代入公式 61 ) ( .6 所得的 fx 是相等的, () 即在平均数 μ 的左方或右方,只要距离相等,其 fx 就相等,因此其分布是 () 对称的。在正态分布下,算术平均数、中位数、众数三者合一位于 μ 点上。

正态分布概率公式(部分)

图 6-2 正态分布概率密度函数的曲线 正态曲线可用方程式表示。当n→∞时,可由二项分布概率函数方程推导出正态分布曲线的方程: f(x)= (6.16 ) 式中: x —所研究的变数; f(x) —某一定值 x 出现的函数值,一般称为概率密度函数(由于间断性分布已转变成连续性分布,因而我们只能计算变量落在某一区间的概率,不能计算变量取某一值,即某一点时的概率,所以用“概率密度”一词以与概率相区分),相当于曲线 x 值的纵轴高度; p —常数,等于 3.14 159 ……; e —常数,等于 2.71828 ……;μ为总体参数,是所研究总体的平均数,不同的正态总体具有不同的μ,但对某一定总体的μ是一个常数;δ也为总体参数,表示所研究总体的标准差,不同的正态总体具有不同的δ,但对某一定总体的δ是一个常数。 上述公式表示随机变数 x 的分布叫作正态分布,记作 N( μ , δ2 ) ,读作“具平均数为μ,方差为δ 2 的正态分布”。正态分布概率密度函数的曲线叫正态曲线,形状见图 6-2 。 (二)正态分布的特性 1 、正态分布曲线是以 x= μ为对称轴,向左右两侧作对称分布。因的数值无论正负,只要其绝对值相等,代入公式( 6.16 )所得的 f(x) 是相等的,即在平均数μ的左方或右方,只要距离相等,其 f(x) 就相等,因此其分布是对称的。在正态分布下,算术平均数、中位数、众数三者合一位于μ点上。

2 、正态分布曲线有一个高峰。随机变数 x 的取值范围为( - ∞,+ ∞ ),在( - ∞ ,μ)正态曲线随 x 的增大而上升,;当 x= μ时, f(x) 最大;在(μ,+ ∞ )曲线随 x 的增大而下降。 3 、正态曲线在︱x-μ︱=1 δ处有拐点。曲线向左右两侧伸展,当x →± ∞ 时,f(x) →0 ,但 f(x) 值恒不等于零,曲线是以 x 轴为渐进线,所以曲线全距从 -∞到+ ∞。 4 、正态曲线是由μ和δ两个参数来确定的,其中μ确定曲线在 x 轴上的位置 [ 图 6-3] ,δ确定它的变异程度 [ 图 6-4] 。μ和δ不同时,就会有不同的曲线位置和变异程度。所以,正态分布曲线不只是一条曲线,而是一系列曲线。任何一条特定的正态曲线只有在其μ和δ确定以后才能确定。 5 、正态分布曲线是二项分布的极限曲线,二项分布的总概率等于 1 ,正态分布与 x 轴之间的总概率(所研究总体的全部变量出现的概率总和)或总面积也应该是等于 1 。而变量 x 出现在任两个定值 x1到x2(x1≠x2)之间的概率,等于这两个定值之间的面积占总面积的成数或百分比。正态曲线的任何两个定值间的概率或面积,完全由曲线的μ和δ确定。常用的理论面积或概率如下: 区间μ ± 1 δ面积或概率 =0.6826 μ ± 2 δ =0.9545 μ ± 3 δ=0.9973 μ± 1.960δ=0.9500 μ ±2.576 δ =0.9900

正态分布下的累积概率

正态分布 3.1 正态分布 对于连续型随机变量而言,正态分布(normal distribution)是最重要的一种概率分布。 经验表明:对于依赖于众多微小因素;且每一因素均产生微小的或正或负影响的连续型随机变量来说,正态分布是一个相当好的描述模型。 如人的体重,因为遗传、骨骼结构、饮食、锻炼、等都对人的体重有影响,但又没有一种因素起到压到一切的主导作用。与此相类似,人的身高、考试分数等都近似地服从正态分布。 通常用: X~N(u, 2δ) (3 - 1) δ称为正态分布的总表示随机变量X服从正态分布。N表示正态分布,括号的参数u, 2 体均值(或期望)和方差。 3.1.1 正态分布的性质 (1) 正态分布曲线以均值u为中心,对称分布。 (2) 正态分布的概率密度函数呈中间高、两边低,在均值u处达到最高,向两边逐渐降低,即随机变量在远离均值处取值的概率逐渐变小。

(3) 正态曲线下的面积约有68%位于u ± δ两值之间;约有95%的面积位于u±22δ之间;而约有99.7%的面积位于u±3δ之间。 ★ (4) 两个(或多个)正态分布随机变量的线性组合仍服从正态分布。 令X 和Y 相互独立: X ~N(u X ,2x δ) Y ~N(u Y ,2y δ) 现在考虑两个变量的线性组合:W =a X+b Y 则 W ~N(u W , 2w δ) ( 3 - 2 ) 其中, u W =(au X +bu Y ) ( 3 - 3 ) 2w δ = (22x a δ+22y b δ) (3 - 4) 例3.1 令X 表示在下沙高教区一花店每日出售玫瑰花数量, Y 表示在下沙镇一花店每日出售玫瑰花的数量,假定X 和Y 服从正态分布,且相互独立,并有: X ~N( 100,64 ),Y ~N( 150,81 ) 求两天两花商出售玫瑰花数量的期望及方差? W =2X +2Y 根据式( 3 - 3 ) E(w)=E( 2X+ 2Y) = 5 0 0, Var (w) = 4var(X) + 4var(Y) = 5 8 0 因此,W 服从均值为5 0 0,方差为5 8 0的正态分布,即W ~N( 5 0 0,5 8 0 )。 ★★3.1.2 标准正态分布 两个正态分布可能因为期望或方差的不同,或是期望和方差均不同而相区别。如何比较各种不同的正态分布呢?

解读正态概率图-正态概率图纸的秘密

解读正态概率图-正态概率图纸的秘密 本文是对解读Minitab的正态概率图一文中注解3-正态概率图图纸的说明 1上图的H0假设 1)上图单组数据为34,35,36,37,38,39,40,40,41,42,43,44,45,46共N=14个 2)计算得平均值为Xbar=40,标准差为s=3.741657 (图示为3.742) 3)上图的H0假设数据源自正态分布,相对H1就是非正态分布 4)基于正态分布的假设,所以根据样本数可以估计此正态分布的2个参数,平均值μ为40, 标准差σ为3.741657 2正态分布的特性x、z与累积分配函数 1)正态分布z值有人称z score,是正态分布的变量x,转换为标准正态分布时对应值为z, 关系是为z=(x-μ)/σ 2)正态分布下变量x,经转换为标准正态分布对应值z,就可经由正态分布数值表或软件等求得 x的累积分配函数(cdf),cdf一般统计符号写成F(x)= P(X≦x),P就是X≦x累积机率,正态概率图 的纵坐标Percent就是F(x) 3)鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表

4)Percent与x数值表说明 黄底的Percent与x数值表,Percent就是F(x),F(x)是指定的解于0与1之间,表上所示数值系为%,透过标准正态分布,就可求F(x)的反函数z,然后以公式x=zσ+μ得到x值 3正态性检定使用的正态概率图图纸 1)下表为手工计算,结果与minitab的Percent与x数值表相符的 作成蓝色参考值线的数据x、z、F(x)关系表如下表,表中系先指定F(x),就是表中Percent栏, 然后基于正态分布求x=F-1(x),再使用正态分布标准化公式计算z=(x-Xbar)/s

正态分布概率表

正态分布概率表 1 —f? 0( u )= t P⑴t F(t)t F(0t卩⑴0.00 0.000 00.230. 181 9 0.46 0.354 5W9 0. 50 9 8 0.010.008 0(J. 24o. m70.47 0.361 60.70 0,516 1 0+02 0.016 00. 250,197 4 0,48 0.368 80+71 0.522 3 0.03 0.023 9(1. 26 0.205 1 0.49 0.375 9 0.72 0. 52 8 5 044 0.031 9(1.270,212 8 0.5fl O.3R2 90.73"4 6 0+05 0039 90,280. 220 5 0,510.389 9 0.74 0.540 7 0.06 0 047 80.290. 228 20.52036 9 0.75 0*546 7 0+07 0 €55 S0,30 0,235 80,530.403 9 0+76 0.552 7 0+08 0.063 8O 310.243 4 0-540.410 80+77 0.558 7 0+09 (1.(171 7(J. 320.251 00.550.417 70.78 0.564 6 0. 10 0.0797 fl. 33 0.258 6 0.56 0,424 50.79 0.570 5 0.110,087 60.340.266 1 0.57 0.431 30.B0 0.576 3 0.12 0.09$ 50. 350.273 7 0.5S0.43S 10.S1 O.5S2 1 0+13 OJ03 4(J. 360.281 20.59 0.444 80+S2 0.5S7 8 0+14 (1.111 30.37 0.288 6 0.60 0.451 50+83 0.593 5 0.15 0J19 20. 380.296 1 0.61 0.458 10.840.599 1 0+16 0.127 10.39 0. 303 50.62 0.464 70.85 0.604 7 0.17 0.135 00400.330 8 0.63 0.471 30.S6 0.610 2 0+18 0.142 S0.410.318 20,640.477 80.87 0.6157 0+19 0.150 70 420, 325 50.650.484 30.88 0.621 1 0,20 0J58 5(J. 430. 332 80.660.490 10.890.626 5 0,210J66 3(J.440,340 1 0.67 0.497 10.90 0.631 9 0 + 22 0.174 10.450347 3 0,68 0.503 50.91 0.637 2

Minitab统计分析(上)

Minitab统计分析(上) Minitab介绍 1.Minitab是众多统计软件当中比较简单易懂的软件之一; 2.相对来讲,Minitab在质量管理方面的应用是比较适合的; 3.Minitab的功能齐全,一般的数据分析和图形处理都可以应付自如。Minitab与6 Sigma的关系1.在上个世纪80年代Motolora开始在公司内推行6 Sigma,并开始借助Minitab 使6 Sigma得以最大限度的发挥;2.6 Sigma的MAIC阶段中,很多分析和计算都可以都通过Minitab简单的完成;3.即使是对统计的知识不怎么熟悉,也同样可以运用Minitab 很好的完成各项分析。Minitab的功能 1.计算功能(1)计算器功能(2)生成数据功能(3) 概率分布功能(4)矩阵运算2.数据分析功能 (1)基本统计(2)回归分析(3)方差分析(4)实验设计分析(5)控制图(6)质量工 具(7)多变量分析时间序列;列联表,非参数估计,EDA,概率与样本容量。3.图形分析(1)直方图 (2)散布图(3)时间序列图(4)条形图(5)箱图(6)矩阵图(7)轮廓图三维图,点图,饼图,边际图,概率图,茎叶图,特征图。课程内容安排1.由于时间有限,很多内容只是做简单的介绍;2.在两天的时间里,主要的课程内容安

排如下:Minitab界面和基本操作介绍 数据的生成(Make Random Data)数据的生成结果生成有规律的数据 Select:计算>产生模板化数据>简单数集结果输出数据类型的转换(Change Data Type)Select: 数据> 更改数据类型> 数字到文本数据类型的转换结果数据的堆栈(Stack&Unstack)Select: 数据> 堆叠> 列数据的堆栈结果数据块的堆栈(Stack Blocks)Select: 数据> 堆叠> 列的区组数据块的堆栈结果转置栏(Transpose Columns)Select: 数据> 转置列转置结果连接(Concatenate)Select: 数据> 合并连接结果编码(Code) Select: 数据> 编码>数字到文本编码结果Minitab 之常用图形QC手法常用的图形如下:(1)特性要因图(2)控制图(参见SPC部分)(3)柏拉图(4)散布图(5)直方图(6)时间序列图特性要因图练习输入表中Select: 统计> 质量工具> 因果填好各项需要的参数柏拉图练习输入数据Select: 统计> 质量工具> Pareto 图结果输出练习下表为STS冷轧工厂ZRM不良现状,试做分析散布图练习输入数据 Select: 图形> 散点图输入参数输出图形直方图练习输入数据

相关文档