文档库 最新最全的文档下载
当前位置:文档库 › 假设检验

假设检验

假设检验
假设检验

假设检验

假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。

中文名假设检验外文名 hypothesis test

提出者 K.Pearson 提出时间 20世纪初

1、简介

假设检验又称统计假设检验(注:显著性检验只是假设检

验中最常用的一种方法),是一种基本的统计推断形式,也是数

理统计学的一个重要的分支,用来判断样本与样本,样本与总

体的差异是由抽样误差引起还是本质差别造成的统计推断方

法。

其基本原理是先对总体的特征作出某种假设,然后通过抽

样研究的统计推理,对此假设应该被拒绝还是接受作出推断。

[1]

2、基本思想

假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。设A是关于总体分布的一项命题,所有使命题A成立的总体分布构

成一个集合h0,称为原假设(常简称假设)。使命题A不成立的所有

总体分布构成另一个集合h1,称为备择假设。如果h0可以通过有

限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参

数统计)。如果h0(或h1)只包含一个分布,则称原假设(或备择假设)

为简单假设,否则为复合假设。对一个假设h0进行检验,就是要制

定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承

认命题A正确),还是拒绝它(否认命题A正确)。这样,所有可能

的样本所组成的空间(称样本空间)被划分为两部分HA和HR(HA

的补集),当样本x∈HA时,接受假设h0;当x∈HR时,拒绝h0。

集合HR常称为检验的拒绝域,HA称为接受域。因此选定一个检验

法,也就是选定一个拒绝域,故常把检验法本身与拒绝域HR等同起

来。[3]

3、基本方法

显著性检验有时,根据一定的理论或经验,认为某一假设h0成立,例如,通常有理由认为特定的一群人的身高服从正态分布。当收集了一定数据后,可以评价实际数据与理论假设h0之间的偏离,如果偏离达到了“显著”的程度就拒绝h0,这样的检验方法称为显著性检验。偏离达到显著的程度通常是指定一个很小的正数α(如0.05,0.01),使当h0正确时,它被拒绝的概率不超过α,称α为显著性水平。这种假设检验问题的特点是不考虑备择假设,考虑实验数据与理论之间拟合的程度如何,故此时又称为拟合优度检验。拟合优度检验是一类重要的显著性检验。

K.皮尔森在1900年提出的Ⅹ检验是一个重要的

拟合优度检验。设原假设h0是:“总体分布等于某个

已知的分布函数F(x)”。把(-∞,∞)分为若干个两

两无公共点的区间I1,I2,…,Ik,对任一个区间,

以vj记大小为n的样本X1,X2,…,Xn中落在Ij内

的个数,称为区间Ij的观测频数,另外,求出Ij的

理论频数(对j=1,2,…,k都这样做),再算出由下

式定义的Ⅹ统计量,皮尔森证明了:若对j=1,2,…,k,则当n→∞时,Ⅹ的极限分布是自由度为k-1的Ⅹ分布。于是在样本大小n相当大时,从Ⅹ分布表可查得Ⅹ分布的上α分位数(见概率分布)Ⅹ(k-1)。由此即得检验水平为α的拒绝域:{Ⅹ≥Ⅹα(k-1)}。如果原假设h 0为:总体服从分布族{Fθ,θ∈嘷},式中θ为未知参数,嘷为θ的所有可能取值的集合(称参数空间),也可得到类似的拒绝域,只要在计算理论频数vj时,将所包含的未知参数θ用适当的点估计代替,即可计算Ⅹ统计量。但此时极限分布的自由度为 k-Л-1,式中Л为θ中的独立参数的个数。柯尔莫哥洛夫检验(见非参数统计)也是一个重要的拟合优度检验方法。

奈曼-皮尔森理论J.奈曼与 E.S.皮尔森合作,从1928年开始,对假设检验提出了一项系统的理论。他们认为,在检验一个假设h0时可能犯两类错误:

第一类错误是真实情况为h0成立(即θ∈嘷0),但

判断h0不成立,犯了“以真为假”的错误。第二类错误

是h0实际不成立(即θ∈嘷1),但判断它成立,犯了“以

假为真”的错误(见表)。这里嘷0,嘷1分别是使假设

h0成立或不成立的θ的集合,显然嘷=嘷0+嘷1。当θ∈

嘷0,样本X(即X1,X2,…,Xn组成的向量)∈HR,其概

率Pθ(X∈HR)就是犯第一类错误的概率α;当θ∈嘷1,

样本X∈HA,其概率就是犯第二类错误的概率β。通常人

们不希望轻易拒绝h0,例如工厂的产品一般是合格的,出

厂进行抽样检查时不希望轻易地被认为不合格,于是在限

定犯第一类错误的概率不超过某个指定值α(称为检验水

平)的条件下,寻求犯第二类错误的概率尽可能小的检验

方法。为了描述检验的好坏,称θ的函数Pθ(X∈HR)为检

验的功效函数。例如上述产品检验的例子中,所采用的检验可以是:

当样品中的废品个数超过一定限度时,认为该批产品不合格,否则就

认为合格。这个检验的功效函数有图示的形状,图中的 p0、p1、α、β根据需要选定。这种图形清楚地描述了犯两类错误的概率。

优良性准则基于奈曼-皮尔森理论及统计决策理论,可以提出一些准则,来比较为检验同一假设而提出的各种检验。较重要的准则有:

一致最大功效(UMP)准则欲检验h0:θ∈嘷0,h1:θ∈嘷1;

当给定检验水平α后,在所有满足的可供选择的检验HR中,是否

有一个最好的,亦即:是否存在拒绝域H,使得对于所有θ∈嘷1

及一切检验水平为α的H皆有。若这样的检验存在,则称HR为检

验水平α的一致最大功效检验,简称UMP检验。奈曼与皮尔森在1933年提出了著名的奈

曼-皮尔森引理。这是对简单假设寻求UMP检验的一个构造性的结果,即此时似然比检验

就是UMP检验。对某些复合假设也找到了 UMP检验,但并不是所有情况都存在 UMP检验。

因此有必要在对检验作某些限制下寻找最大功效检验或建立另外一些优良性准则。

无偏性准则要求检验在备择假设h1成立时作出正确判断的概率不小于检验水平α,这就是说在h0不成立时拒绝h0的概率要不小于在h0成立时拒绝h0的概率,这种性质称为无偏性,具有这种性质的检

验称为无偏检验。显然,如果在无偏检验中存在一致最大功效检验就称为一致最大功效无偏检验(简称UMPU 检验)。UMP检验不存在时,仍可能有UMPU检验存在。例如正态总体中方差未知时,为检验均值μ=μ0的t检验就是UMPU检验,但不是UMP检验。

因为假设检验在统计决策理论中是一种特殊的统计决策问题,两类错误影响可用特

殊损失来表示。例如选取特殊的损失函数,使正确判断时损失为零,错判时损失为1。

它就可归结为犯第一类错误的概率α和犯第二类错误的概率β。这同用功效函数Pθ(X

∈HR)来叙述是一致的。因此把统计决策理论中容许性、同变性、贝叶斯决策、最小化最大等概念引进来,而得到容许检验、同变检验、贝叶斯检验和最小化最大检验。在同变检验限制下,又可以建立一致最大功效同变检验的概念。这些准则又可作为假设检验的优良性准则,从而扩大了假设检验的内容。

寻求在一定准则下的最优检验是很困难的,何况这种最优检验有时并不存在。于是提出了若干依据直观的推理法,其中最重要的是似然比法。

似然比检验运用与最大似然估计(见点估计)类似的原理,可得到似然比检验法。设样本X的分布密度即似然函数为l(尣,θ),θ∈嘷,欲检验的假设为h0:θ∈嘷0,称为似然比。显然0≤(尣)≤1,当(尣)太小时就拒绝h0,否则接受h0,其临界值λ0由检验水平α和(尣)在h0成立时的分布确定,即。然而,在一般情况下,寻求(尣的精确分布并不容易。1938年S.S.威尔克斯证明了:在相当广泛的条件下,-2ln(尣)是渐近Ⅹ分布的,这就为大样本的似然比检验提供了实行的可能。

用似然比法导出的重要检验有:

U检验若总体遵从正态分布N(μ,σ),其中σ已知,X=(X1,X2,…,Xn)是从总体中抽取的简单随机样本,记,则遵从标准正态分布N(0,1),于是可考虑对μ的以下几种假设的检验,其中μ0是给定的常数,α为检验的水平,uα为标准正态分布的上α分位数。上述检验称为U 检验。

t检验若总体服从正态分布N(μ,σ),但σ未知,记,,则t=遵从自由度为n-1的t分布,可对μ有以下的水平为α的检验,其中tα为自由度为n-1的t分布的上α分位数。这些检验称为t检验。

F检验若X=(X1,X2,…,)及Y=(Y1,Y2,…,)分别为来自正态总体N(μ1,σ娝)及N(μ2,σ娤)的简单随机样本,记,,,,则遵从自由度为n1-1,n2-1的F分布,对比较σ娝与σ娤的假设有以下的水平为α的检验,其中Fα为自由度为(n1-1,n2-1)的F分布的上α分位数。这些检验称为F检验,在方差分析中有广泛的应用。[3]

参考书目 E.L.Lehmann,Testing Statistical Hypothesis,John Wiley & Sons, New

1、提出检验假设又称无效假设,符号是H0;备择假设的符号是H1。

H0:样本与总体或样本与样本间的差异是由抽样误差引起的;

H1:样本与总体或样本与样本间存在本质差异;

预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。

2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。

3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。[1-2] 教学中的做法:

1.根据实际情况提出原假设和备择假设;

2.根据假设的特征,选择合适的检验统计量;

3.根据样本观察值,计算检验统计量的观察值(obs);

4.选择许容显著性水平,并根据相应的统计量的统计分布表查出相应的临界值(ctrit);

5.根据检验统计量观察值的位置决定原假设取舍。[4]

5、意义

假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。

用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。从这个意义上,假设检验又称为显著性检验。

进行假设检验,先要对假设进行陈述。通过下例加以说明。

例如,设某工厂制造某种产品的某种精度服从平均数为方差的正态分布,据过去的数据,已知平均数为75,方差为100。若经过技术革新,改进了制造方法,出现了平均数大于75,方差没有变更,但仍存在平均数不超过75的可能性。试陈述为统计假设。

根据上述情况,可有两种假设,(1) 平均数不超过75,(2)平均数大于75,即如果我们把(1)作为原假设,即被检验的假设,称作零假设,记作H0,如果其他假设相对于零假设来说,是约定的、补充的假设,则就是备择的,故称为备择假设或对立假设,记作H1。

还须指出,哪个是零假设,哪个是备择假设,是无关紧要的。我们关心的问题,是要探索哪一个假设被接受的问题。被接受的假设是要作为推理的基础。在实际问题中,一般要考虑事情发生的逻辑顺序和关心的事件,来设立零假设和备择假设。

在作出了统计假设之后,就要采用适当的方法来决定是否应该接受零假设。由于运用统计方法所遇到的问题不同,因而解决问题的方法也不尽相同。但其解决方法的基本思想却是一致的,即都是“概率反证法”思想,即:

(1)为了检验一个零假设(即虚拟假设)是否成立,先假定它是成立的,然后看接受这个假设之后,是否会导致不合理结果。如果结果是合理的,就接受它;如不合理,则否定原假设。

(2)所谓导致不合理结果,就是看是否在一次观察中,出现小概率事件。通常把出现小概率事件的概率记为0,即显著性水平。它在次数函数图形中是曲线两端或一端的面积。因此,从统计检验来说,就涉及到双侧检验和单侧检验问题。在实践中采用何类检验是由实际问题的性质来决定的。一般可以这样考虑:

①双侧检验。如果检验的目的是检验抽样的样本统计量与假设参数的差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧。比如显著性水平为0.05,即概率曲线左右两侧各占,即0.025。

②单侧检验。这种检验只注意估计值是否偏高或偏低。如只注意偏低,则临界值在左侧,称左侧检验;如只注意偏高,则临界值在右侧,称右侧检验。

对总体的参数的检量,是通过由样本计算的统计量来实现的。所以检验统计量起着决策者的作用。

参数估计与假设检验

统计推断是由样本的信息来推测母体性能的一种方法,它又可以分为两类问题,即参数估计和假设检验。实际生产和科学实验中,大量的问题是在获得一批数据后,要对母体的某一参数进行估计和检验。

例如,我们对45钢的断裂韧性作了测定,取得了一批数据,然后要求45钢断裂韧性的平均值,或要求45钢断裂韧性的单侧下限值,或要求45钢断裂韧性的分散度(即离散系数),这就是参数估计的问题。

又如,经过长期的积累,知道了某材料的断裂韧性的平均值和标准差,经改进热处理后,又测得一批数据,试问新工艺与老工艺相比是否有显著差异,这就是假设检验的问题。

这样可以看出,参数估计是假设检验的第一步,没有参数估计,也就无法完成假设检验。

6、注意的问题

1、做假设检验之前,应注意资料本身是否有可比性。

2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。

3、根据资料类型和特点选用正确的假设检验方法。

4、根据专业及经验确定是选用单侧检验还是双侧检验。

5、当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。

6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。

7、报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。

假设检验案例集

案例一:假设检验设备判断中的应用[1] 例如:某公司想从国外引进一种自动加工装置。这种装置的工作温度X服从正态分布(μ,52),厂方说它的平均工作温度是80度。从该装置试运转中随机测试16次,得到的平均工作温度是83度。该公司考虑,样本结果与厂方所说的是否有显著差异?厂方的说法是否可以接受? 类似这种根据样本观测值来判断一个有关总体的假设是否成立的问题,就是假设检验的问题。我们把任一关于单体分布的假设,统称为统计假设,简称假设。上例中,可以提出两个假设:一个称为原假设或零假设,记为H0:μ=80(度);另一个称为备择假设或对立假设,记为H1 :μ≠80(度)这样,上述假设检验问题可以表示为: H0:μ=80 H1:μ≠80 原假设与备择假设相互对立,两者有且只有一个正确,备择假设的含义是,一旦否定原假设H0,备择假设H1备你选择。所谓假设检验问题就是要判断原假设H0是否正确,决定接受还是拒绝原假设,若拒绝原假设,就接受备择假设。 应该如何作出判断呢?如果样本测定的结果是100度甚至更高(或很低),我们从直观上能感到原假设可疑而否定它,因为原假设是真实时,在一次试验中出现了与80度相距甚远的小概率事件几乎是不可能的,而现在竟然出现了,当然要拒绝原假设H0。现在的问题是样本平均工作温度为83度,结果虽然与厂方说的80度有差异,但样本具有随机性,80度与83度之间的差异很可能是样本的随机性造成的。在这种情况下,要对原假设作出接受还是拒绝的抉择,就必须根据研究的问题和决策条件,对样本值与原假设的差异进行分析。若有充分理由认为这种差异并非是由偶然的随机因素造成的,也即认为差异是显著的,才能拒绝原假设,否则就不能拒绝原假设。假设检验实质上是对原假设是否正确进行检验,因此,检验过程中要使原假设得到维护,使之不轻易被否定,否定原假设必须有充分的理由;同时,当原假设被接受时,也只能认为否定它的根据不充分,而不是认为它绝对正确。 [编辑] 案例二:假设检验在卷烟质量判断中的应用[2] 在卷烟生产企业经常会遇到如下的问题:卷烟检验标准中要求烟支的某项缺陷的不合格品率P不能超过3%,现从一批产品中随机抽取50支卷烟进行检验,发现有2支不合格品,问此批产品能否放行?按照一般的习惯性思维:50支中有2支不合格品,不合格品率就是4%,超过了原来设置的3%的不合格品率,因此不能放行。但如果根据假设检验的理论,在α=0.05的显著性水平下,该批产品应该可以放行。这是为什么呢?

SAS区间估计与假设检验实验报告

2014——2015学年第 1 学期 合肥学院数理系 实验报告 课程名称:统计软件选讲 实验项目:区间估计与假设检验 实验类别:综合性□设计性□验证性□√ 专业班级: 12级信息与计算科学 姓名:马坤鹏学号: 1207011017 实验地点:数理系数学模型实验室 实验时间: 2014.9.24 指导教师:段宝彬成绩:

一、实验目的 掌握使用SAS对总体参数进行区间估计与假设检验方法。 二、实验内容 1、用INSIGHT对总体参数进行区间估计与假设检验 2、用“分析家”对总体参数进行区间估计与假设检验 3、编程对总体参数进行区间估计与假设检验 三、实验步骤或源程序 1、生成来自标准正态总体的10000个随机数: (1) 求总体的平均值和方差的置信水平为90%的置信区间; (2) 改变随机数的个数,观察并总结样本均值、样本方差的变化以及总体均值和方差的置信区间的变化规律。 2、从某大学总数为500名学生的“数学”课程的考试成绩中,随机地抽取60名学生的考试成绩如表5-6(lx5-2.xls)所示: 表5-6 学生成绩 (1) 分别求500名学生平均成绩的置信水平为98%、90%和85%的置信区间,并观察置信水平与置信区间的关系。 (2) 分别求500名学生成绩的标准差的置信水平为98%和85%的置信区间。 3、装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录下各自的装配时间如表5-7(lx5-3.xls)所示: 表5-7 装配时间(单位:分钟) 设两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同(α = 0.05)?data my.five1; input m n$@@; cards; 31 m 34 m 29 m 32 m 35 m 38 m 34 m 30 m 29 m 32 m 31 m 26 m 26 n 24 n 28 n 29 n 30 n 29 n 32 n 26 n 31 n 29 n 32 n 28 n ; proc ttest h0 = 0alpha = 0.05data= my.five1; var m; class n; run;

方差分析与假设检验实验报告

云南大学滇池学院 方差分析与假设检验实验报告二 学生姓名:方炜学号:20092123080 专业:软件工程 一、实验目的和要求: 1、初步了解SPSS的基本命令; 2、掌握方差分析和假设检验。 二、实验内容: 1、为比较5中品牌的合成木板的耐久性,对每个品牌取4个样本作摩擦试验测量磨损量,得以下数据: (1)它们的耐久性有无明显差异? (2)有选择的作两品牌的比较,能得出什么结果?

2、将土质基本相同的一块耕地分成5块,每块又分成均等的4小块。在每块地内把4个品 种的小麦分钟在4小块内,每小块的播种量相同,测得收获量如下: 考察地块和品种对小麦的收获量有无显著影响?并在必要时作进一步比较。 3、为了研究合成纤维收缩率和拉伸倍数对纤维弹性的影响进行了一些试验。收缩率取0,4, 8,12四个水平;拉伸倍数取460,520,580,640四个水平,对二者的每个组合重复作两次试验,所得数据如下:

(1)收缩率,拉伸倍数及其交互作用对弹性有无显著影响? (2)使弹性达到最大的生产条件是什么? 三、实验结果与分析: 1、运行结果截图: 1、结果分析: (1)、Sig<0.05,耐久性有明显差异 (2)、由样本分析,品牌3分为一类;品牌1,2,5分为一类;品牌4分为一类。而品牌3和品牌4差距最大,品牌3的耐久性最差,品牌4的耐久性最好。 2、运行结果截图:

2、结果分析: (1)、地块(A组)Sig>0.05对小麦的收获量无显著影响,品种(B组)Sig<0.05对小麦的收获量有显著影响。 (2)、由图得,地块4最适合种小麦,地块1最不适合种小麦;而品种2的小麦收获量最大,品种4的小麦收获量最小。 3、运行结果截图:

假设检验实验报告

实验报告 假设检验 学院: 参赛队员: 参赛队员: 参赛队员: 指导老师:

一、实验目的 1.了解假设检验的基本内容; 2.了解单样本t检验; 3.了解独立样本t检验;、 4.了解配对样本t检验; 5.学会运用spss软件求解问题; 6.加深理论与实践相结合的能力。 二、实验环境 Spss、office 三、实验方法 1.单样本t检验; 2.独立样本t检验; 3.配对样本t检验。 四、实验过程 实验过程 依题意,设H0:μ= 82,H1:μ>82 (1)定义变量为成绩,将数据输入SPSS;

(2)选择:分析比较均值单样本T检验; (3)将变量成绩放置Test栏中,并在Test框中输入数据82; (4)观察结果 实验结果

结果分析 该题是右尾检验,所以右尾P=2=因为P值明显小于, 表明在水平上变量与检验值有显著性差异,故接受原假设,所以该县的英语教学改革成功。 问题二: 实验过程 依题意,设H0:μ= 500,H1:μ≠500 (1)定义变量为成绩,将数据输入SPSS; 某工艺研究所研究出一种自动装罐机,它可以用来自动装罐头食品,并且可以达到每罐的标准重量为500克。现在需要检验它的性能。假定装罐重量服从正态分布。现随机抽取10罐来检查机器工作情况,这10罐的重量如下:

(2)选择:分析比较均值单样本T检验; (3) 将变量成绩放置Test栏中,并在Test框中输入数据500; 实验结果 结果分析 该题是双检验,所以双尾P=因为P值明显大于, 表明在水平上变量与检验值无显著性差异,故不能拒绝原假设 ,接受备择假设,所以自动装罐机性能良好 问题三: 某对外汉语中心进行了一项汉字教学实验,同一年级的两个平行班参与了该实验。一个班采用集中识字的方式,然后学习课文;另一班采用分散识字的方式,边学习课文边学习生字。为了考察两种教学方式对生字读音的记忆效果是否有影响,教学效果是否有差异,分别从一班和二班随机抽取20人,进行汉字注音考试,请计算二个班的平均成绩、标准差分别是多少两种教学方式对汉字读音的记忆效果是否有差异哪一种教学方式更有效

假设检验-例题讲解

假设检验 一、单样本总体均值的假设检验 .................................................... 1 二、独立样本两总体均值差的检验 ................................................ 2 三、两匹配样本均值差的检验 ........................................................ 4 四、单一总体比率的检验 ................................................................ 5 五、两总体比率差的假设检验 .. (7) 一、单样本总体均值的假设检验 例题: 某公司生产化妆品,需要严格控制装瓶重量。标准规格为每瓶250 克,标准差为1 克,企业的质检部门每日对此进行抽样检验。某日从生产线上随机抽取16 瓶测重,以95%的保证程度进行总体均值的假设检验。 x t μ-= data6_01 样本化妆品重量 SPSS 操作: (1)打开数据文件,依次选择Analyze (分析)→Compare Means (比较均值)→One Sample T Test (单样本t 检验),将要检验的变量置入Test Variable(s)(检验变量); (2)在Test Value (检验值)框中输入250;点击Options (选项)按钮,在

Confidence Interval(置信区间百分比)后面的框中,输入置信度(系统默认为95%,对应的显著性水平设定为5%,即0.05,若需要改变显著性水平如改为0.01,则在框中输入99 即可); (3)点击Continue(继续)→OK(确定),即可得到如图所示的输出结果。 图中的第2~5 列分别为:计算的检验统计量t 、自由度、双尾检验p-值和样本均值与待检验总体均值的差值。使用SPSS 软件做假设检验的判断规则是:p-值小于设定的显著性水平?时,要拒绝原假设(与教材不同,教材的判断标准是p

[汇总]统计学假设检验练习题

[汇总]统计学假设检验练习题 例3.7.9 从一大批相同型号的金属线中,随机选取10根,测得它的直径(单位:mm)为: 1.23 1.24 1.26 1.29 1.20 1.32 1.23 1.23 1.29 1.28 2(1)如果金属线直径X,N(μ,0.04),试求平均直径μ的置信度为95%的置信区间. 22(2)如果金属线直径X,N(μ, σ),σ未知,试求平均直径μ的置信度为95%的置信区间. 例3.7.10 随机取某牌香烟8支,其尼古丁平均含量为3.6mg,标准差为 0.9mg(试求此牌香烟尼古丁平均含量μ的95,的置信区间((假设尼古丁含量服从正态分布)( 4.某种袋装食品的重量服从正态分布.某一天随机地抽取9袋检验,重量(单位:g)为 510 485 505 505 490 495 520 515 490 22(1) 若已知总体方差σ=8.6,求μ的置信度为90%的置信区间; (2) 若已知总体方差未知,求μ的置信度为95%的置信区间. 5.为了估计在报纸上做一次广告的平均费用,抽出了20家报社作随机样本,样本的均值和标准差分别为575(元)和120(元),假定广告费用近似服从正态分布,求总体均值的95%的置信区间. 6.从某一班中随机抽取了16名女生进行调查.她们平均每个星期花费13元吃零食,样本标准差为3元,求此班所有女生每个星期平均花费在吃零食上的钱数的95%的置信区间.(假设总体服从正态分布)

7.一家轮胎工厂在检验轮胎质量时抽取了400条轮胎作试验,其检查结果这些轮胎的平均行驶里程是20000km,样本标准差为6000km.试求这家工厂的轮胎的平均行驶里程的置信区间,可靠度为95%. 8.为了检验一种杂交作物的两种新处理方案,在同一地区随机地选择8块地段.在各试验地段,按两种方案处理作物,这8块地段的单位面积产量是(单位:kg) 一号方案产量: 86 87 56 93 84 93 75 79 二号方案产量: 80 79 58 91 77 82 74 66 222假设两种产量都服从正态分布,分别为N(μ, σ) ,N(μ, σ), σ未知,求μ-μ的置信度1212为95%的置信区间. 9.为了比较两种型号步枪的枪口速度,随机地取甲型子弹10发,算得枪口子弹的平均值 =500(m/s), 标准差s=1.10(m/s); 随机地取乙型子弹20发,得枪口速度平均值=496(m/s),标1 准差s=1.20(m/s). 设两总体近似地服从正态分布,并且方差相等,求两总体均值之差的置信水2 平为95%的置信区间. 10.为了估计参加业务训练的效果.某公司抽了50名参加过训练的职工进行水平测验,结果是平均得分为4.5,样本方差为1.8;抽了60名未参加训练的职工进行水平测验,其平均得分为3.75,样本方差为2.1. 试求两个总体均值之差的95%的置信区间.(设两个总体均服从正态分布). 11、风驰汽车制造厂的装配车间安装车门仍需人工操作,不同工人的装配时间不同,同一工人的装配时间也有差异,为测定安装车门所需时间,每隔一定时间抽选一个样本,共抽取了10个样本,其数据如下(单位:秒):

假设检验例题讲解(20210110065140)

假设检验 一、............................... 单样本总体均值得假设检验 1 二、............................. 独立样本两总体均值差得检验 2 三、................................. 两匹配样本均值差得检验 3 四、..................................... 单一总体比率得检验 5 五、................................. 两总体比率差得假设检验 6 、单样本总体均值得假设检验 例题: 某公司生产化妆品,需要严格控制装瓶重量。标准规格为每瓶250 克,标准差为1克,企业得质检部门每日对此进行抽样检验。某日从生产线上随机抽取16瓶测重,以95%得保证程度进行总体均值得假设检验。 SPSS操作: (1)打开数据文件,依次选择Analyze(分析)f pare Means(比较均值)f One Sample T Test单样本t检验),将要检验得变量置入Test Variable(s)检验变量); ⑵在Test Value脸验值)框中输入250;点击Options(选项)按钮,在

Confidenee Interval(置信区间百分比)后面得框中,输入置信度(系统默认为95%,对应得显著性水平设定为5%,即0、05,若需要改变显著性水平如改为0、01则在框中输入99即可); (3)点击Continue(继续)f OK(确定),即可得到如图所示得输出结果。 单样本检验 检验值=250

图中得第2~5列分别为:计算得检验统计量t、自由度、双尾检验p-值与样本均值与待检验总体均值得差值。使用SPSS软件做假设检验得判断规则就是:p- 值小于设定得显著性水平?时,要拒绝原假设(与教材不同,教材得判断标准就是pv?/2)。从图中可以瞧到,p-值为0、01,小于0、05,故检验结论就是拒绝原假设、接受备择假设,认为当天生产得全部产品平均装瓶重量与250克有显著差异(拒 绝原假设),不符合规定得标准。 图中表格得最后两列,就是样本均值与待检验总体均值差值(xi-250)1-?置信区间得下限与上限,待检验得总体均值Test Value加上这两个值,就构成了总体均值得1-?置信区间。通过这个置信区间也可以做假设检验:若这个区间不包含待 检验得总体均值,就要在?水平上拒绝原假设。本例中样本均值与待检验总体均值差值95%置信区间得下限与上限均为负值,因此所构造得总体均值得95%置信区间不可能包含待检验得总体均值250,因此要在0、05得水平上拒绝原假设、 接受备择假设,与依据p-值得出得检验结论一致。 注意:除非给出明确结果,SPSS没有单侧检验,SPSS^得p值均为双侧检验得概率p 值,如果要进行要单侧检验,将软件给出得p值与2倍得显著性水平进行比较即可,如要求?=0、05,单侧比较时,p值与2? =0、1进行比较、 二、独立样本两总体均值差得检验 例题: 某品牌时装公司在城市中心商业街得专卖店中只销售新款产品且价格不打折,打折得旧款产品则统一在城郊购物中心得折扣店销售。公司销售部门为制订更合理得销售价格及折扣方法,对购买该品牌时装得顾客做了抽样调查。分别从光顾城中心专卖店得顾客中随机抽取了36人,从光顾折扣店得顾客中随机抽取 了25人。调查发现,光顾专卖店得顾客样本平均月收入水平为1、35万元,而光 顾折扣店得顾客样本平均月收入水平为1、24万元。现在需要判断:光顾这两种 店得顾客得总体收入水平就是否也存在明显得差异?

关于假设检验中检验统计量的选择及拒绝域的确定问题

关于假设检验中检验统计量的选择及拒绝域的确定问题 假设检验是根据样本所提供的信息检验假设是否成立的一种统计推断方法。在检验之前总体参数未知,先对总体参数提出一个假设的值,然后根据样本所提供的信息检验假设是否成立。 在假设检验中,如何根据已知条件选择检验统计量,并确定拒绝域和临界值,是非常重要的两个环节。学员在理解时容易出现混淆。 一、 根据已知条件选择检验统计量 这里要注意,样本均值x 的分布与根据样本均值及总体方差(或样本方差)构造的检验统计量的分布是两个不同的概念。根据抽样分布的理论,只要总体服从正态分布,那么,无论是大样本,还是小样本,其样本均值的分布均服从正态分布;如果总体的分布是非正态分布,在大样本情况下,其样本均值的分布仍服从正态分布,小样本的样本均值的分布则服从非正态分布。 但是,检验统计量的分布则不然。 (一) 对于小样本量 分两种情况: 1、在总体是正态分布的情况下,如果总体方差未知、小样本(n<30),检验统计量n s x /0 μ-的分布服从t 分布; 2、在总体服从非正态分布、小样本的情况下,检验统计量的分布也服从t 分布。 由于一般情况下总体方差未知,需要用样本方差来代替,所以,一般准则是:小样本量时用t 检验。 (二) 对于大样本量 在大样本量( 30≥n )的情况下,检验统计量的分布与样本均值的分布相同,服从正态分布,这一点比较容易理解。所以,概括来说,大样本量时用Z 检验。 选择用t 检验还是Z 检验,直接关系到选择t 临界值还是Z 临界值。 二、 拒绝域和临界值的确定 应结合分布的图形来理解接受域、拒绝域以及临界值。 (一)对于双侧检验 一般在双侧检验时,使用正态分布对总体均值进行检验,拒绝域为:2αZ Z >或 2αZ Z -<(或2αZ Z >) ;使用t 分布进行检验,拒绝域为:2αt t >或2αt t -<,(或2αt t >) ;使用2χ分布进行检验时(对总体方差的检验),若检验的统计量222αχ>χ或2122αχχ-<时,拒绝原假设。注意,这里使用的是 2α,因为双侧检验中有两个拒绝域,各占2 α。只要满足其中一个拒绝域,即可拒绝原假设。

第5章 统计假设检验练习题及答案

实验报告——第5章统计假设检验 姓名杨秀娟班级人力10001学号 【实验1】 某外企对员工英语水平进行调查,开发部门总结该部门员工英语水平很高,如果按照英语六级考试标准考核,一般平均分为75分。现从开发部门雇员中随机选出11人参加考试,得分如下:80,81,72,60,78,65,56,79,77,87,76 ^ 请问该开发部门的英语水平是否真的很高(即高于75分,且差异显著) 【解】 (1)数据和变量说明 本题所用数据是:外企英语六级考试成绩样本 该文件为11个样本,1个变量,如变量视图 (2)操作方法 (3)结果报告

, 上图为单样本t检验表,第一行注明了用于比较的已知的总体均数为75,下面从左到右依次为t值(t)、自由度(df)、P值(Sig)、两均数的差值、差值的95%可信区间。 由上表可知,t= , P=, P>,接受Ho,与平均成绩75相等,无显著差异,因此,该开发部门的英语水平不是真的很高。 【实验2】 以下是对某产品促销团队进行培训前后的销售业绩数据,试分析该培训是否产生了显著效果。 表5-20 培训前后销售业绩数据 56789 序号123' 4 7488827185 培训前677074~ 97 7687867895 培训后786778{ 98 【解】 (1)数据和变量说明 本文件有2个变量,9个数据 (2)操作方法 *

(3)结果报告 由上表可知,P=, P<,不接受无效假设,有显著差异,所以该培训产生了显著效果。 【实验3】 饲养队制定了两种喂养方案喂猪,希望通过试验了解一下不同喂养方案的喂养效果。

方案一:用一只猪喂不同的饲料所测得的体内钙留存量数据如下: 表 5-21 方案一喂养数据 序号! 1 23456789 饲料1" 饲料2/ 方案二:甲队有11只猪喂饲料1,乙队有9只猪喂饲料2,所得的钙留存量数据如下: ; 表5-22方案二喂养数据 序号12345678· 9 1011甲队饲料1; 乙队饲料2\ 请选用恰当方法对上述两种方案所获得的数据进行分析,研究不同饲料是否使小猪体内钙留存量有显著不同。 【解】 方案一 (1)《 (2)数据和变量说明 答:9个数据,2个变量 (3)操作方法

假设检验的基本步骤

假设检验的基本步骤 (三)假设检验的基本步骤 统计推断 1.建立假设检验,确定检验水准 H0和H1假设都是对总体特征的检验假设,相互联系且对立。 H0总是假设样本差别来自抽样误差,无效/零假设 H1是来自非抽样误差,有单双侧之分,备择假设。 检验水准,a=0.05 检验水准的含义 2.选定检验方法,计算检验统计量 选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题, 一般计量资料用t检验和u检验; 计数资料用χ2检验和u检验。 3.确定P值,作出统计推理 P≤a ,拒绝H0,接受H1 P> a,按a=0.05水准,不拒绝H0,无统计学意义或显著性差异 假设检验结论有概率性,无论使拒绝或不拒绝H0,都有可能发生错误 (四)两均数的假设检验(各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论) u检验适用条件 t检验适用条件 t检验和u检验 1.样本均数与总体均数比较 2.配对资料的比较/成组设计的两样本均数的比较 配对设计的情况:3点 3. 两个样本均数的比较 (1)两个大样本均数比较的u检验 (2)两个小样本均数比较的t检验 (五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误) 1.两类错误 拒绝正确的H0称Ⅰ型错误-弃真,用检验水准α表示,α=0.05,犯I型错误概率为0.05,理论上平均每100次抽样有5次发生此类错误; 接受错误的H0称Ⅱ型错误-存伪。用β表示,(1-β)为检验效能或把握度,意义为两总体有差异,按α水准检出差别的能力,1-β=0.9,若两总体确有差别,理论上平均每100次抽样有90次得出有差别的结论。 两者的关系:α愈大β愈小;反之α愈小β愈大。 2.假设检验中的注意事项 (1)随机化:代表性和均衡可比性 (2)选用适当的检验方法 (3)正确理解统计学意义 (4)结论不绝对 (5)单侧与双侧检验的选择 四.分类变量资料的统计描述

管理统计学-假设检验的SPSS实现-实验报告

假设检验的SPSS实现 、实验目的与要求 1. 掌握单样本 t检验的基本原理和 spss实现方法。 2. 掌握两样本 t检验的基本原理和 spss实现方法。 3. 熟悉配对样本 t检验的基本原理和 spss实现方法。 二、实验内容提要 1. 从一批木头里抽取 5根,测得直径如下(单位: cm),是否能认为这批木头的平均直径是1 2.3cm 12.3 12.8 12.4 12.1 12.7 2. 比较两批电子器材的电阻,随机抽取的样本测量电阻如题表2所示,试比较两批电子器 材的电阻是否相同(需考虑方差齐性的问题) 3. 配对 t检验的实质就是对差值进行单样本t检验,要求按此思路对例课本 13.4进行重新分析,比较其结果和配对 t检验的结果有什么异同。 4.一家汽车厂设计出 3种型号的手刹,现欲比较它们与传统手刹的寿命。分别在传统手刹,型号I、II、和型号 III中随机选取了 5只样品,在相同的试验条件下,测量其使用寿命(单位:月),结果如下: 传统手刹:21.213.417.015.212.0 型号 I :21.412.015.018.924.5 型号 II :15.219.114.216.524.5 型号 III :38.735.839.332.229.6 ( 1)各种型号间寿命有无差别 ? (2)厂家的研究人员在研究设计阶段,便关心型号III 与传统手刹寿命的比较结果。此时应 当考虑什么样的分析方法?如何使用 SPSS实现? 三、实验步骤 为完成实验提要 1. 可进行如下步骤 1. 在变量视图中新建一个数据,在数据视图中录入数据,在分析中选择比较均值,单样本t 检验,将直径添加到检验变量,点击确定。

假设检验

75 假设检验 Ⅰ.学习目的 假设检验包括参数检验与非参数检验,是一种最能体现统计推断思想和特点的方法。通过本章学习,要求:1.掌握统计检验的基本原理,理解该检验的规则及犯两类错误的性质;2.熟练掌握总体均值、总体成数及总体方差指标的各种检验方法,包括:z 检验、t 检验和p 值检验;3.掌握2 检验、符号检验、秩和检验及游程检验四种基本的非参数检验方法。 Ⅱ.课程内容要点 第一节 假设检验的基本原理 一、假设检验的基本原理 “小概率原理”:小概率事件在一次试验中几乎是不会发生的。 事先所做的假设,是假设检验中关键的一项工作。它包括原假设和备选假设两部分。原假设是建立在假定原来总体参数没有发生变化的基础之上的。备选假设是原假设的对立,是在否认原假设之后所要接受的,通常这是我们真正感兴趣的一个判断。 二、假设检验的规则与两类错误 1、假设检验的规则 假设检验的步骤: (1)首先根据实际应用问题确定合适的原假设0H 和备选假设1H ; (2)确定检验统计量,通过数理统计分析确定该统计量的抽样分布;

(3)给定检验的显著性水平α。在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值; (4)从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。 从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域正是统计量取值的小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端,可以将检验分为单侧检验或双侧检验。双侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。对于这些双侧、左、右单侧检验,我们要结合备选假设来考虑。 在检验规则中,我们经常碰到两种重要的检验方法:z检验与t检验。 p值检验的原理:给出原假设后,在假定原假设正确的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算的检验统计量的数值的概率,这便是p值;而后将此概率值跟事先给出的显著性水平值α进行比较。如果该值小于α,否定原假设,取对应的备选假设。如果该值大于α,我们不就能否定原假设。 2、两类错误 H实际为真,但我们却依据样本信息,做出拒绝的错误结论当原假设 时,称为“弃真”错误;当原假设实际为假,而我们却错误接受时,称为“纳伪”错误。通常记显著性水平α为犯“弃真”错误的可能性大小,β为犯“纳伪”错误的可能性大小。由于两类错误是一对矛盾,在其他条件不变得情况下,减少犯“弃真”错误的可能性大小(α),势必增大犯“纳伪”错误的可能性大小(β),也就是说,β的大小和显著性水平α的大小成相反方向变化。 三、检验功效 -可以用来表明所做假设检验工作好坏的一个指标,我们称之为检1β 76

实验3 参数假设检验

实验编号:1四川师大SPSS实验报告2017 年3月27日 计算机科学学院2015级5班实验名称:参数假设检验 姓名:唐雪梅学号:2015110538 指导老师:__朱桂琼___ 实验成绩:___ 实验三参数假设检验 一.实验目的及要求 1.了解SPSS 特点结构操作 2.利用SPSS进行简单数据统计 二.实验内容 1.对12名来自城市的学生与14名来自农村的学生进行心理素质测验,他们的分数如下: 城市学生得分:4.75 6.40 2.62 3.44 6.50 5.30 5.60 3.80 4.30 5.78 3.76 4.15 农村学生得分:2.38 2.60 2.10 1.80 1.90 3.65 2.30 3.80 4.60 4.85 5.80 4.25 4.22 3.84 试分析农村学生与城市学生心理素质有无显著差别。 2、一汽车厂商声称其发动机排放标准的一个指标平均低于20个单位。在抽查了10台发动机之后,得到下面的排放数据:17.0、21.7、17.9、22.9、20.7、22.4、17. 3、21.8、24.2、25.4。目的是检验该申明是否正确 3. 用SPSS Samples数据文件“Employee data.sav”资料, 问:清洁工(jobcat=1)的受教育年数(Educational Level)与保管员(jobcat=2)和经理(jobcat=3)的受教育年数是否有显著差异?其中,显著性水平ɑ=0.05. ? 4. 用SPSS Samples数据文件“Employee data.sav”资料, 分析:美国企业现在工资(Current Salary)与过去工资(beginning Salary)是否有显著差异? 三、实验主要流程、基本操作或核心代码、算法片段(该部分如不够填写,请另加附页) 1.数据录入

第7章思考与练习-假设检验

第七章 假设检验 【思考与练习】 一、思考题 1.解释零假设与备择假设的含义。 2.简述假设检验的基本步骤。 3.比较单侧检验与双侧检验的区别。 4.解释I 型错误、II 型错误和检验效能,并说明它们之间的关系。 5.简述假设检验与置信区间估计的联系。 二、案例辨析题 为了比较非洛地平与常规药物治疗高血压的疗效差异,现已知常规药能使高血压患者的血压平均下降20 mmHg ,某医生随机抽取100名原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其21.5X =mmHg , 8.0S =mmHg 。该医生进行了t 检验,零假设是μμ0=,备择假设是μμ0≠,检验 水准0.05α=。计算得 1.875t =,按100ν=查t 界值表,得0.10P 0.05<<,故接受0H ,认为非洛地平与常规药物治疗高血压的疗效无差别。你认为该结论正确吗?请说明理由。 三、最佳选择题 1.比较两药疗效时,下列哪种情况可作单侧检验 A .已知A 药与B 药均有效 B .已知A 药与B 药均无效 C .已知A 药不会优于B 药 D .已知A 药与B 药差不多好 E .不知A 药好还是B 药好 2.假设检验的步骤是 A .计算检验统计量、确定P 值、作出推断结论 B .建立无效假设、建立备择假设、确定检验水准 C .建立无效假设、计算检验统计量、确定P 值

D.确定单侧检验或双侧检验、选择t检验或Z检验、估计I型错误概率和II型错误概率 E.建立检验假设和确定检验水准、计算检验统计量、确定P值并作出统计推断3.假设检验时,下列关于检验结果的说法正确的是 A.若P值小于0.05,则不拒绝 H,此时可能犯II型错误 B.若P值小于0.05,则拒绝 H,此时可能犯II型错误 C.若P值小于0.05,则不拒绝 H,此时可能犯I型错误 D.若P值大于0.05,则拒绝 H,此时可能犯I型错误 E.若P值大于0.05,则不拒绝 H,此时可能犯II型错误 4.假设检验时,取以下何种检验水准时可能犯II型错误的概率最小 A.0.025 α= B.0.01 α= C.0.05 α= D.0.10 α= E.0.20 α= 5.下列有关检验统计量t的说法中正确的是 A.t越大,说明总体参数差别越大 B.t越大,说明总体参数差别越小 C.t越大,说明样本统计量差别越大 D.t越大,说明样本统计量差别越小 E.t越大,越有理由认为两总体参数不等 6.在样本均数与已知总体均数比较的t检验中,结果 3.24 t=, 0.05/2,2.086 t ν =, 0.01/2,2.845 t ν=,按检验水准0.05 α=,正确的结论是 A.可认为此样本均数与该已知总体均数不同 B.可认为此样本均数与该已知总体均数差异很大 C.可认为此样本均数所对应的总体均数与已知总体均数差异很大D.可认为此样本均数所对应的总体均数与已知总体均数相同E.可认为此样本均数所对应的总体均数与已知总体均数不同7.下列关于单侧检验和双侧检验的说法正确的是

实验五假设检验

实验五 假设检验 一、实验目的与实验要求 掌握平均数的比较与检验,包括单样本、独立样本、配对样本 二、实验内容详细介绍 t 检验是用小样本检验总体参数,特点是在均方差不知道的情况下,可以检验样本平均 数的显著性。 1.单样本的均值检验 1)基本数学原理 对单个正态总体并且方差未知的情况,用下面的统计量来检验其平均数的显著性(假设样本均值与总体均值相等,即0μμ=) x T = 当原假设成立时,上面的统计量应该服从自由度为1n -的t 分布。 简单的说,单样本均值检验是检验单个样本的均值是否与给定的常数之间存在差异。这个给定的常数就是总体均值。 单一样本的T 检验: 零假设H 0:样本平均数Mean=常数(检验值) 2)SPSS 实现 方法:“Analyze ”|“Compare Means ”|“One-Sample T Test ”

图1 (1 )Test列表框:将其中对应变量名对应的变量数据进行均值检验 (2)Test Value文本框:在该文本框中输入总体均值。默认值为0。 (3)Options按钮:利用单击该按钮打开的对话框,设置检验时采用的置信度和缺失值的处理。打开的对话框如图3所示 图3 该样本的均值与总体均值之间没有显著差别。(设α=0.05) 要求: 1.输入数据到SPSS中,并保存为Bend.sav文件;(提示:只需要建一个变量) 2.对上述数据进行均值检验,给出输出结果并对输出结果进行分析 提示:(结果中比较有用的值:样本平均数Mean和Sig显著性概率值) 输出结果中各变量中文解释如下: N:数据个数 对其中变量名对应的变量数 据进行均值检验 输入总体 均值

假设检验——简单假设 复合假设

第七章 假设检验 7.1 设总体2(,)N ξμσ~,其中参数μ,2σ为未知,试指出下面统计假设中哪些是简单假设,哪些是复合假设: (1)0:0,1H μσ==; (2)0:0,1H μσ=>; (3)0:3,1H μσ<=; (4)0:03H μ<<; (5)0:0H μ=. 解:(1)是简单假设,其余位复合假设 7.2 设1225,,,ξξξL 取自正态总体(,9)N μ,其中参数μ未知,x 是子样均值,如对检验问题0010:,:H H μμμμ=≠取检验的拒绝域:12250{(,,,):||}c x x x x c μ=-≥L ,试决定常数c ,使检验的显著性水平为0.05 解:因为(,9)N ξμ~,故9 (,)25 N ξμ~ 在0H 成立的条件下, 000 53(||)(||)53 521()0.05 3c P c P c ξμξμ-≥=-≥? ?=-Φ=???? 55( )0.975,1.9633 c c Φ==,所以c =1.176。 7.3 设子样1225,,,ξξξL 取自正态总体2 (,)N μσ,20σ已知,对假设检验0010:,:H H μμμμ=>,取临界域12n 0{(,,,):|}c x x x c ξ=>L , (1)求此检验犯第一类错误概率为α时,犯第二类错误的概率β,并讨论它们之间的关系; (2)设0μ=0.05,20σ=0.004[下载自.管理资源吧],α=0.05,n=9,求μ=0.65时不犯第二类错误的概率。

解:(1)在0H 成立的条件下,2 00(, )n N σξμ~,此时 00000()P c P ξαξ=≥=≥ 10 αμ-= ,由此式解出010c αμ-= + 在1H 成立的条件下,2 0(, )n N σξμ~,此时 1010 10 ()(P c P αξβξμ-=<=< =Φ=Φ=Φ 由此可知,当α增加时,1αμ-减小,从而β减小;反之当α减少时,则β增加。 (2)不犯第二类错误的概率为 10 0.9511(0.650.51(3) 0.2 1(0.605)(0.605)0.7274αβμμ--=-Φ- -=-Φ- =-Φ-=Φ= 7.4 设一个单一观测的ξ子样取自分布密度函数为()f x 的母体,对()f x 考虑统计假设: 0011101 201 :():()00x x x H f x H f x ≤≤≤≤??==? ??? 其他其他 试求一个检验函数使犯第一,二类错误的概率满足2min αβ+=,并求其最小值。 解 设检验函数为 1()0x c x φ∈?=?? 其他(c 为检验的拒绝域)

假设检验例题.

假设检验 总体均值的检验(σ2 已知 (例题分析 【例】一种罐装饮料采用自动生产线生产,每罐的容量是 255ml ,标准差为 5ml 。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了 40罐进行检验,测得每罐平均容量为 255.8ml 。取显著性水平α=0.05 , 检验该天生产的饮料容量是否符合标准要求? H 0:μ = 255 H 1:μ≠ 255 α = 0.05 n = 40 检验统计量 : 决策 : 不拒绝 H 0 结论 : 样本提供的证据表明:该天生产的饮料符合标准要求 总体均值的检验(σ2 未知 (例题分析 【例】一种机床加工的零件尺寸绝对平均误差允许值为 1.35mm 。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取 50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (

=0.01 总体均值的检验(σ2 未知 (例题分析 【例】某一小麦品种的平均产量为 5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了 36个地块进行试种, 得到的样本平均产量为 5275kg/hm2,标准差为 120/hm2 。试检验改良后的新品种产量是否有显著提高? (α=0.05 H 0 :μ≤ 5200 H 1 :μ > 5200 α = 0.05 n = 36 临界值 (c : 检验统计量 : 决策 : 拒绝H 0 (P = 0.000088 < α = 0.05 结论 : 改良后的新品种产量有显著提高

假设检验

实验报告 课程名称:数理统计实践 项目名称:参数假设检验 姓名:龚成 班级:科121 学号:121617 指导教师:徐红敏 数理系信息与计算科学专业

北京石油化工学院数理系 参数假设检验-实验报告 假设检验 1、 实验目的与要求 1.1实验目的 (1)掌握Matlab 中有关假设检验的操作命令; (2)掌握利用Matlab 软件对单个正态总体均值,方差置信区间的假设检验 (3)掌握利用Matlab 软件对两个正态总体均值差,方差比置信区间的假设检验 1.2实验要求 通过实验加深对假设检验的基本概念的和基本思想的理解,提升对matlab 软件的熟练度和对常用程序的使用。 2、 相关背景知识介绍 假设检验指的是在用数理统计方法检验产品的时候,先作出假设,在根据抽样的结果在一定可靠程度对原假设做出判断的一种方法。在总体的分布函数未知或者只知形式不知参数的情况下,为了推出总体的的未知特征,提出的关于总体的假设,而对于这个假设的结果我们是否接受的决断过程,就叫做假设检验。 一般地,我们会给出2个相互对立的假设01H H ,,然后通过具体的问题获取的信息选择一个合适的检测量,在按照假设决定该检测量的拒绝区域,如果该检测量落在拒绝区域里面,则选择拒绝0H 选择1H ,如果该检测量落在拒绝区域外面,则选择0H 拒绝1H 。然而由于作出决策的样本不能完全代表总体,如果小概率事件发生或者样本混入了错误值或者由于其他原因导致样本失真,当实际上0H 为真时仍然有可能作出拒绝0H 的决策或实际上0H 为假时仍然有可能作出接受0H 的决策(除非样本就等于总体,否则无法消除这个可能),犯这种错误的概率记为00000H 0P H H P H P H μμ∈(当为真,拒绝)或(拒绝)或(拒绝)。在大多数情况下,我们无法排除这类错误(P 0P 1≈ ,0),但是可以通过增加样本容量使之接近总体让错误被“稀释”。一般地我们为了减少0H 为真时作出拒绝0H 的决策的概率,我们因此我们给出一个较小的数

假设检验的基本步骤

假设检验的基本步骤

————————————————————————————————作者:————————————————————————————————日期:

假设检验的基本步骤 (三)假设检验的基本步骤 统计推断 1.建立假设检验,确定检验水准 H0和H1假设都是对总体特征的检验假设,相互联系且对立。 H0总是假设样本差别来自抽样误差,无效/零假设 H1是来自非抽样误差,有单双侧之分,备择假设。 检验水准,a=0.05 检验水准的含义 2.选定检验方法,计算检验统计量 选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题, 一般计量资料用t检验和u检验; 计数资料用χ2检验和u检验。 3.确定P值,作出统计推理 P≤a,拒绝H0,接受H1 P>a,按a=0.05水准,不拒绝H0,无统计学意义或显著性差异 假设检验结论有概率性,无论使拒绝或不拒绝H0,都有可能发生错误 (四)两均数的假设检验(各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论) u检验适用条件 t检验适用条件 t检验和u检验 1.样本均数与总体均数比较 2.配对资料的比较/成组设计的两样本均数的比较 配对设计的情况:3点 3. 两个样本均数的比较 (1)两个大样本均数比较的u检验 (2)两个小样本均数比较的t检验 (五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误) 1.两类错误 拒绝正确的H0称Ⅰ型错误-弃真,用检验水准α表示,α=0.05,犯I型错误概率为0.05,理论上平均每100次抽样有5次发生此类错误; 接受错误的H0称Ⅱ型错误-存伪。用β表示,(1-β)为检验效能或把握度,意义为两总体有差异,按α水准检出差别的能力,1-β=0.9,若两总体确有差别,理论上平均每100次抽样有90次得出有差别的结论。 两者的关系:α愈大β愈小;反之α愈小β愈大。 2.假设检验中的注意事项 (1)随机化:代表性和均衡可比性 (2)选用适当的检验方法 (3)正确理解统计学意义 (4)结论不绝对 (5)单侧与双侧检验的选择 四.分类变量资料的统计描述

相关文档