文档库 最新最全的文档下载
当前位置:文档库 › 4.统计学-三举例抽样与检验

4.统计学-三举例抽样与检验

4.统计学-三举例抽样与检验
4.统计学-三举例抽样与检验

抽样分布

例:甲、乙、丙三位学生统计学补考成绩分别为50、60、70分。从中随机抽取2位学生。在重置抽样、考虑顺序情况下:

总体容量N=3; 样本容量n=2 一、做均值(平均成绩)估计

1.总体分布:

总体均值∑===60)()E x xP x (μ;总体方差3

200

)()()(22=

-==∑x P x x D μσ x ~),(2σμN 即:x ~)3

200

60,(N

2.样本空间:甲甲、甲乙、甲丙、乙甲、乙乙、乙丙、丙甲、丙乙、丙丙 对应的样本均值为:50、55、60、55、60、65、60、65、70

3.样本分布:如抽取到一个样本:甲乙,成绩分别为50、60。

样本均值55==∑n

x

x ;样本方差501

)2

2

=--=∑n x x s

4.抽样分布:

样本均值的均值μ===∑60)()(x P x x E

样本均值的方差3

10023200

3100)()]([)(22

2=

====-=∑n P E D x σσ x ~),(2n N σ

μ即:x ~)2

3200

,60(N

上述样本均值的方差开平方根就叫抽样平均误差,即:n

x σ

σ=

二、做比率(及格率)估计

1.总体分布:

总体及格率∏=2/3;及格率总体方差9

2

-12=∏∏=)(

σ 2.样本空间:甲甲、甲乙、甲丙、乙甲、乙乙、乙丙、丙甲、丙乙、丙丙 对应的样本及格率为:0、1/2、1/2、1/2、1、1、1/2、1、1 3.样本分布:如抽取到一个样本:甲乙,成绩分别为50、60。 样本及格率

1=

p ;及格率样本方差41)1(2=-=p p s

4.抽样分布:

样本及格率的均值∏===

=∑3

2

96)()(p P p p E 样本及格率的方差9123132)1(91)()]([)(2

2=?

=∏-∏===-=∑n p P p E p p D p σ

上述样本及格率的方差开平方根就叫抽样平均误差,即:n

p )

1(∏-∏=

σ

(三)参数估计举例

例8.某工业企业报告期生产某种橡胶轮胎10000个,从中随机抽取0.5%进行耐磨性能检验,抽样结果如表5-7所示。据有关质量标准规定,在规定时

间内的磨损量低于6000毫克(不含6000毫克)为正品。试以95%的概率估计全部产品的平均磨损量和正品率。 表5-7

解:已知样本容量n =50>30为大样本,总体方差σ2未知,在大样本(n≥30)情况下,尽管总体方差未知,仍然可以采用2

αZ 代替)

1,2(-n t α

来近似建立总体均值

的估计区间。

已知1-α=95%,查正态分布概率表知2

05.0Z =1.96

根据表5-7资料计算有:

样本平均磨损量x =

f

xf

∑∑=50288750=5775(毫克)

平均磨损量的样本修正方差S 2

=1

502500000

1)(2-=

-∑-∑f f x x =51020.41 样本正品率p =

%9250

46

50281251==+++=n n i 正品率的样本方差S 2=p(1-p)=92%×(1-92%)=0.0736

1.总体均值估计 (由于σ2未知,用S 2代替)。 (1)在重复抽样的条件下:

平均磨损量的抽样平均误差x σ=

n

2

σ≈n s 2

=5041.51020=31.94(毫克)

抽样极限误差x ?=x Z σα2

=1.96×31.94=62.61(毫克)

总体平均磨损量μ=x ±x ?=5775±62.61=[5712.39,5837.61](毫克)

即:可以95%的概率推断该批轮胎的平均磨损量在5712.39毫克至5837.61毫克之间。

(2).在不重复抽样的条件下:

平均磨损量的抽样平均误差x σ=

)1

(2--N n

N n σ

)1(2--N n N n s =)1

100005010000(5041.51020--=31.87(毫克) 抽样极限误差x ?=x Z σα2

=1.96×31.87=62.46(毫克)

总体平均磨损量μ=x ±x ?=5775±62.46=[5712.54,5837.46](毫克) 即:可以95%的概率推断该批轮胎的平均磨损量在5712.54毫克至5837.46毫克之间。

2.总体比率估计 (由于P(1-P)未知,用p(1-p)代替)。 (1).在重复抽样条件下: 正品率的抽样平均误差p σ=

n

P)

-P(1≈n p p )1(-=50

0736

.0=3.84% 抽样极限误差p ?=p Z σα2

=1.96×3.84=7.53%

总体正品率P =p ±p ?=92%±7.53%=[84.47%,99.53%] 即:可以95%的概率推断该批轮胎的正品率在84.47%至99.53%之间。 (2).在不重复抽样条件下: 正品率的抽样平均误差p σ=

)1(n P)-P(1--N n N ≈)1

(n p)-p(1--N n

N =

%83.31

1000050

10000500736.0=--? 抽样极限误差p ?=p Z σα2

p ?=1.96×3.83%=7.51%

总体正品率P =p ±p ?=92%±7.51%=[84.49%,99.51%] 即:可以95%的概率推断该批轮胎的正品率在84.49%至99.51%之间。 例9.某灯泡厂为提高产品竞争能力,对某灯泡生产线进行了技术革新。现从技术革新后生产的一批灯泡中随机抽样取20只,测得样本平均照明时间为4200小时,样本修正标准差为150小时,试以95%的概率推断该批灯泡的平均照明时间。

解:样本容量n=20<30为小样本,且总体方差2

σ未知。

已知S =150,x =4200,由1-α=95%,自由度V=n-1=20-1=19,查t分布表,有)19,2

05

.0(t

=2.093。

平均照明时间的抽样平均误差x σ=

n S =20

150=33.54(小时) 抽样极限误差x ?=)

1,2

(-n t α

n

s

=2.093×33.54=70.20(小时) 总体平均照明时间μ=x ±x ?=4200±70.20(小时)=[4129.8,4270.2] 即:估计该批产品的平均照明时间在4129.8小时至4270.2小时之间,其概率保证程度为95%。

例22.某企业从报告期生产的甲产品中随机抽取20件,测得其使用寿命的方差s 2为310,该产品使用寿命服从正态分布,试以90%的概率估计产品使用寿命的总体方差。

解:已知1-α=90%,由1-2α=0.95,2

α

=0.05,自由度v=n-1=20-1=19,查2χ分布表可得两个临界值2)1(,2

1--n a

χ=2)19(,95.0χ=10.117和2)

1(,2-n a χ=2

)19(,05.0χ=

30.144,所以有总体方差σ2在90%置信概率下的置信区间为:

()()2

)

1(,212

22)

1(,2211----≤≤-n n S n S n ααχσχ,即:

144.30310)120(?-≤σ2≤117

.10310

)120(?-。

205.7≤σ2≤612.8

故以90%的概率估计产品使用寿命的总体方差在205.7至612.8之间;估计产品使用寿命的总体标准差在14.34小时至24.75小时之间。 提问:

在简单随机重复抽样方式下,若允许误差扩大一倍,则抽样单位数( ) A.只需原来的四分之一 B.增加3倍 C.只需原来的二分之一 D.增加4倍 正确答案:A

提问:

某企业在对产品质量正式开展抽样调查之前,做了三次小型试验抽样,得知三次的产品合格率分别为93%、95%、96%,则本次抽样调查确定抽样单位数

计算比率方差时,应选择的合格率是( )

A.93%

B.95%

C.96%

D.94.67% 正确答案:A

例24.某厂对生产的某牌号灯泡进行质量检验,根据过去各期抽样调查资料知道,一般来讲,灯泡平均照明时间的标准差为350小时,灯泡照明时间达到4800小时以上的灯泡所占比例为85%。现要求在保证概率达到95%的条件下,平均照明时间的极限误差不超过30小时,照明时间达到4800小时以上的灯泡所占比例的极限误差不超过3%。问报告期采用简单随机重复抽样方法,应抽多少只灯泡调查?

解:已知σ=350,P =85%,x ?=30,p ?=3%, 由1-α=95%,知2

αZ =1.96,

则:估计平均数的抽样单位数n 1=22

2

2

x

Z ?σα=2

2

23035096.1?=522.88(只),

即:n 1=523(只)。

估计成数的抽样单位数n 2=

222

)

1(p

p p Z ?-α

=22%)3(%)

851(%8596.1-??=544.23(只)。 只入不舍n 2=545只。

答:为满足平均数和成数估计研究的需要,应抽取545只灯泡。

2.检验规则

对假设检验问题做出判断依据的主要规则有两种:一是临界值规则;二是P-值规则。

(1)临界值规则

在没有计算机的情况下,做假设检验,一般会选择临界值规则。

临界值规则是指先确定出检验统计量(如Z 或t )落入拒绝域所需的临界值[如:αZ (或2

αZ )或者v t ,α(或v

t ,2α)],再使用该值来检验假设的规则。根据所

提出的显著性水平α标准(它是概率密度曲线的尾部面积)查表得到相应的检验统计量的数值,称作临界值,直接用检验统计量的观测值与临界值作比较,观测值落在临界值所划定的尾部(称之为拒绝域)内,便拒绝原假设;观测值落在临界值所划定的尾部之外(称之为不能拒绝域)的范围内,则认为拒绝原假设的证据不足。这种做出检验结论的方法,我们称之为临界值规则。

如:在做均值或比率检验时,有如下临界值规则: 对于双侧检验,

若Z <2

αZ ,或t <v

t ,2

α

,则接受原假设H 0,拒绝备择假设H 1;

若Z ≥2

αZ ,或t ≥v

t ,2

α

,则拒绝原假设H 0,接受备择假设H 1。

对于左单测检验,

若Z >-αZ ,或t >-v t ,α,则接受原假设H 0,拒绝备择假设H 1; 若Z ≤-αZ ,或t ≤-v t ,α,则拒绝原假设H 0,接受备择假设H 1。 对于右单测检验,

若Z <αZ ,或t <v t ,α,则接受原假设H 0,拒绝备择假设H 1; 若Z ≥αZ ,或t ≥v t ,α,则拒绝原假设H 0,接受备择假设H 1。 (2)P-值规则

用计算机进行假设检验,若使用统计软件,一定会见到P-值。在一个假设检验问题中,通过检验统计量计算的拒绝原假设H 0的最小显著性水平称为P-值。它是进行检验决策的另一个依据。P-值显示了检验统计量的值在一定范围内出现的概率,P-值也被称为实测显著性水平。

P-值是一个概率值,通过计算检验量得到,测量样本对原假设的支持(缺乏支持)的程度。如:对于双侧检验,检验统计量位于正态分布曲线两边尾部,说明对原假设缺乏支持。

对于双侧检验,P-值是检验统计量的绝对值大于或等于样本所给出的检验统计量的绝对值的概率;

对于左单侧检验,P-值是检验统计量小于或等于样本所给出的检验统计量的

值(即具体样本观测值)的概率;

对于右单侧检验,P-值是检验统计量大于或等于样本所给出的检验统计量的值(即具体样本观测值)的概率。

显著性水平α值在P-值规则中被视为一个临界的概率值。P-值定义了可以拒绝原假设的最小α值。通常,小的P-值说明对原假设的支持的程度也较小。P-值小,表明通常根据样本结果不能得出原假设H 0为真的结论。

如果P-值小于所给定的显著性水平α,则认为原假设不太可能成立;如果P-值大于所给定的显著性水平α标准,则认为没有充分的证据否定原假设。因此,有如下P-值规则:

对于单侧检验,若P-值>α,则接受原假设H 0,拒绝备择假设H 1;

若P-值≤α,则拒绝原假设H 0,接受备择假设H 1。

对于双测检验,若P-值>

,则接受原假设H 0,拒绝备择假设H 1; 若P-值≤2

α

,则拒绝原假设H 0,接受备择假设H 1。

必须注意:在双侧检验时,一些统计软件包会将观测概率乘以2,再将该值作为P-值给出,此时就不需再将α除以2。因此,在采用P-值规则做假设检验时,一定要弄清楚计算机软件包是如何得到双测检验的P-值的。

显然,P-值规则和临界值规则是等价的。在做检验时,只用其中一个规则即可。P-值规则较之临界值规则具有更明显的优点。这主要是:第一,它更加简捷;第二,在P-值规则的检验结论中,对于犯第一类错误的概率的表述更加精确。

(一)总体方差已知,且为大样本时的一个正态总体均值检验

例10:已知某化工厂的甲化学制品日产量x ~N(880,212),现随机抽取了49天的日产量,测得平均日产量为871吨。如果估计方差没有变化,试问在显著性水平为5%下:

1.可否认为现在的平均日产量仍与以往一样?

2.如果生产设备未更新,可否认为现在的平均日产量将低于以往水平? 3.如果生产设备已更新,可否认为现在的平均日产量将高于以往水平? 解:已知日产量服从正态分布,总体方差2σ=212,以往水平μ=880,n=49大样本,x =871,α=0.05;

1.关心平均日产量和以往880吨是否一样,故有双测:

0H :μ=880,1H :μ≠880 ;

n

x Z 2

σμ-=

49

880

871-=-3,由α=0.05,查正态分布表知2

05.0Z =1.96, 因为Z =3>1.96,所以拒绝0H ,接受1H ,认为现在全部产品的平均日产量有95%的可能不为以往的880吨。

2.由于设备未更新,关心平均日产量是否低于以往的880吨,故有左单侧:

0H :μ≥880,1H :μ<880 ;

n

x Z 2

σμ-=

49

21880

871-=-3,由α=0.05,查正态分布表知-05.0Z =-1.64, 因为Z =-3<-1.64,所以拒绝0H ,接受1H ,认为现在全部产品的平均日产量有95%的可能低于以往的880吨。

3.由于设备已更新,关心平均日产量是否高于以往的880吨,故有右单侧:

0H :μ≤880,1H :μ>880 ;

n

x Z 2

σμ-=

49

21880

871-=-3,由α=0.05,查正态分布表知05.0Z =1.64, 因为Z =-3<1.64,所以接受0H ,拒绝1H ,认为现在全部产品的平均日产量有95%的可能不高于(即低于)以往的880吨。

(一)总体为正态分布,总体方差未知时的一个正态总体均值检验

来自总体的样本为),,,(21n x x x 。对于原假设0H :μ=0μ,在0H 成立的前提下,有检验统计量

)

1(~2

--=

n t n

s

x t μ

若自由度(n ―1)≥30,该t 统计量近似服从标准正态分布。

例12:某厂家生产的汽车轮胎寿命服从正态分布,该厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下的平均寿命为25000公里,现对一个由16个轮胎组成的随机样本做了试验,得到平均寿命为27000公里,标准差为5000公里。试以5%的显著性水平检验:

1.该厂广告是否真实。

2.若厂家广告声称“轮胎平均寿命高于25000公里”,该厂广告是否真实。 3.若有一些人说“该厂轮胎平均寿命低于25000公里”,这些人说法是否可信。

解:已知轮胎寿命x ~N(μ,2σ),总体方差2σ未知,μ=25000,n =16,小样本,x =27000,s =5000,α=0.05;

1.关心轮胎平均寿命是否为25000公里,故有双测:

0H :μ=25000,1H :μ≠25000 ;

t =

n

s

x 2

μ-=

16

500025000

27000-=1.6,

由α=0.05,查t 分布表知)

116,2

05

.0(

-t =2.13,

因为t =1.6<2.13,所以,接受原假设0H ,可以认为该厂家广告“该厂生产的汽车轮胎在正常行驶条件下的平均寿命为25000公里”是真实的,该厂轮胎平均寿命与25000公里无显著差异。

2.关心轮胎平均寿命是否低于25000公里(前提条件是认为该厂产品质量可靠,过去该厂轮胎平均寿命高于25000公里,是大概率事件,现在想搜集证据证明小概率事件“轮胎平均寿命低于25000公里”是否会在一次试验中发生),故有左单测:

0H :μ≥25000,1H :μ<25000 ;

t =

n

s

x 2

μ-=

16

25000

27000-=1.6,

由α=0.05,查t 分布表知-)116,05.0(-t =-1.753

因为t =1.6>-1.753,所以,接受原假设0H ,可以认为该厂家广告“轮胎平均寿命高于25000公里”是可信的。

3.关心轮胎平均寿命是否高于25000公里(前提条件是认为该厂产品质量不可靠,过去该厂轮胎平均寿命低于25000公里,是大概率事件,现在想搜集证据证明小概率事件“轮胎平均寿命高于25000公里”是否会在一次试验中发生),故有右单测:

0H :μ≤25000,1H :μ>25000 ;

t =

n

s

x 2

μ-=

16

500025000

27000-=1.6,

由α=0.05,查t 分布表知)116,05.0(-t =1.753

因为t =1.6<1.753,所以,接受原假设0H ,可以认为这些人说法“该厂轮胎平均寿命低于25000公里”是可信的。

(注意:2和3检验结论矛盾,是因为前提条件不一样,将在第四节中作进一步说明。)

三.一个正态总体比率的假设检验

来自总体的样本为),,,(21n x x x 。其中,各个i x (i=1,2,…,n )只取1(“成功”)和0(“失败”)两个值。样本中“成功”的次数为n 1。样本比率p=

n

n 1

。在“抽样与参数估计”一章中,已经知道样本比率p 的期望值等于总体比率π(或P ),样本比率p 的方差是

n

)

1(ππ-;根据中心极限定理知,当n 充分大时,样本

比率p 近似服从正态分布??? ??-n N )1(,πππ。这里的大样本条件是:n π和n (1

-π)都要大于等于5。实际工作中,当9.01.0≤≤π,n 符合表6-2要求的大小时,就可以认为样本比率p 近似服从正态分布。由于中体比率通常并不知道,所以实际总体是否符合表6-2中所列情况,可以用样本比率来近似代替。

因此,对于假设:0H π=0π,在0H 成立的前提下,当n 达到要求时,有:

()1,0~)

1(000

N n

p z πππ--=

表6-2 用正态分布来近似时对样本量的要求

例13:某家电厂家声称其产品在甲市的市场占有率为30%,为了检验这个结论是否可靠,某调查公司从甲市随机抽取10000户居民家庭,发现有2500户购买有该厂生产的家电产品,试问在α=0.05条件下:

1.该厂声称是否正确。

2.若该厂声称其产品市场占有率高于30%,该厂声称是否可信。 3.若有一些人说该厂产品市场占有率低于30%,这些人说法是否可信。 解:已知n =10000,大样本,样本市场占有率近似服从正态分布, 样本市场占有率p =10000

2500

=25%,α=0.05; 1.

关心该厂产品市场占有率是否为30%,故有双测:

0H :π=30%,1H :π≠30% ;

n

p z )

1(000

πππ--=

10000

%)

30%100%(30%

30%25--=-10.91,

由α=0.05,查正态分布表,有2

05.0Z =1.96,

因为Z =10.91>1.96,所以拒绝原假设0H ,接受备择假设1H ,可以认为该厂产品市场占有率不是30%,该厂声称“其产品在甲市的市场占有率为30%”不可信。

2.关心该厂产品市场占有率是否低于30%(前提条件是认为该厂产品市场占有率高于30%,是大概率事件,现在想要搜集证据证明小概率事件“该厂产品市场占有率低于30%”是否会在一次试验中发生),故有左单侧:

0H :π≥30%,1H :π<30% ;

n

p z )

1(000

πππ--=

10000

%)

30%100%(30%

30%25--=-10.91,

由α=0.05,查正态分布表,有-05.0Z =-1.64,

因为Z =-10.91<-1.64,所以拒绝0H ,接受1H ,可以认为该厂产品市场占有率低于30%,该厂声称“其产品在甲市的市场占有率高于30%”不可信。

3.关心该厂产品市场占有率是否高于30%(前提条件是认为该厂产品市场占有率低于30%,是大概率事件,现在想要搜集证据证明小概率事件“该厂产品市场占有率高于30%”是否会在一次试验中发生),故有右单侧:

0H :π≤30%,1H :π>30% ;

n

p z )

1(000

πππ--=

10000

%)

30%100%(30%

30%25--=-10.91,

由α=0.05,查正态分布表,有05.0Z =1.64,

因为Z =-10.91<1.64,所以接受0H ,可以认为该厂产品市场占有率低于30%,这些人说法可信。

(二)一个正态总体方差的假设检验举例

例14:某企业生产某零件,在正常情况下,其零件直径(公分)服从正态分布N(μ,0.042).现从某天生产的零件中随机抽取11件,测得其平均直径为12.02公分,标准差为0.05公分。试问在5%的显著性水平下,这一天生产的零件的总体方差是否正常。

解:仅关心总体方差是否正常(即是否为0.042),故有双测: 原假设0H :2σ=0.042

,备择假设1H :2σ≠0.042

χ2

2

02

)1(σs n -=2

2

04.005.0)111(-=15.625

由α=0.05,1-n =11-1=10,查χ2分布表(见中国人民大学贾俊平等编《统计学》第370页),有2)

111(,205

.01--

χ=3.247,2

)

111(,205

.0-χ=20.483

因为3.247<15.625<20.483,所以接受原假设0H ,在α=0.05下,可以认

为这一天零件的方差等于正常条件下的总体方差。

例15:某汽车制造厂从本月技术革新后生产的汽车中随机抽取了45辆检测每百公里油耗,得知平均每百公里油耗为8.1498公升,方差为0.0232。目前国内同类车型汽车每百公里油耗的标准差都在0.20升以上,试问在α=0.05情况下,可否认为技术革新后生产的汽车每百公里油耗的标准差达到了低于0.20升?

解:一般而言,汽车每百公里油耗服从正态分布,已知n =45,大样本,x =8.1498,2s =0.0232,α=0.05,大概率事件是国内同类车型汽车每百公里油耗的标准差都在0.20升以上,关心技术革新后生产的汽车每百公里油耗的标准差是否低于0.20升,故有左单侧假设检验:

原假设0H :2σ≥0.202,备择假设1H :2σ<0.202;

χ2

2

02

)1(σs n -=

2

20.00232

.0)145(-=25.52

由α=0.05,1-n =45-1=44,查χ2分布表(见中国人民大学贾俊平等编《统计学》第370页),有2)145(,05.01--χ=29.787

因为χ2=25.52<29.787,所以拒绝原假设0H ,以95%的概率可以认为该汽车技术革新后的每百公里油耗的标准差低于0.20升(即方差小于0.04)。

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

统计学假设检验习题答案

1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。667.116/60800820=-= t 。因为t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,

统计学抽样与抽样分布练习题

第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2 s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样本。

(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 假设一个总体共有8个数值:54,55,59,63,64,68,69,70。从该总体中按重复 抽样方式抽取2=n 的随机样本。 (1) 计算出总体的均值和标准差。 (2) 一共有多少个可能的样本? (3) 抽出所有可能的样本,并计算出每个样本的均值。 (4) 画出样本均值的抽样分布的直方图,说明样本均值分布的特征。 (5) 计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得 到的结论是什么? 6.11 从均值为5.4=μ,方差为25.82=σ的总体中,抽取50个由5=n 个观测值组成的 随机样本,结果见Book6.11。 (1) 计算每一个样本的均值。 (2) 构造50个样本均值的相对频数分布,以此代表样本均值x 的抽样分布。 (3) 计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。 (1) 用组距为10构建频数分布表,并画出直方图。 (2) 这组数据大概是什么分布?

统计学第九章抽样与抽样估计

第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。

A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差相 比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。

统计学 第五章 抽样推断课后答案

第五章 抽样推断 一、单项选择题 1 2 3 4 5 6 7 8 9 10 C B A D B D C B A C 11 12 13 14 15 16 17 18 19 20 A D C A D C A C B D 二、多项选择题 1 2 3 4 5 ABCE ABDE BCE ABCE ABDE 6 7 8 9 10 ACE ADE ACD ABE CDE 11 12 13 14 15 BDE CD BC ABCD ABCDE 16 17 18 19 20 AD AC BCE ABDE ACE 三、判断题 1 2 3 4 5 6 7 8 9 10 × × × √ √ × √ √ × × 四、填空题 1、变量 属性 2、正 反 3、重复抽样 不重复抽样 4、抽样总体 样本 5、大于 N n - 1 N n 6、标准差 7、样本 总体 抽样平均误差 抽样平均误差 △x = Z x σ 8、合适的样本估计量 一定的概率保证程度 允许的极限误差范围 9、随机抽样 统计分组 10、增大 增大 降低 11、大数定律 中心极限定理 12、样本容量不小(不小于30个单位) 13、大 0.5

14、缩小 3 3 (即0.5774) 扩大 1.1180 15、估计量(或统计量) 参数 五、简答题(略) 六、计算题 1、已知条件:P = 0.5 ,n = 100 且重复抽样 求:p ≤0.45的概率 解: Z = 1100 ) 5.01(5.05.045.0)1(=-?-= --n P P P p 则F (Z = 1) = 0.6827 所以p ≤0.45的概率为: 2 6827 .01-= 0.15865 2、解 E (x 1) = E (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.5 E (X ) + 0.3 E (X ) + 0.2E (X ) = E (X ) = X E (x 2) = E (0.5X 1 + 0.25X 2 + 0.25X 3) = 0.5 E (X ) + 0.25 E (X ) + 0.25E (X ) = E (X ) = X E (x 3) = E (0.4X 1 + 0.3X 2 + 0.3X 3) = 0.4 E (X ) + 0.3 E (X ) + 0.3E (X ) = E (X ) = X 所以x 1、x 2、x 3都是X 的无偏估计量。 D (x 1) = D (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.25 D (X ) + 0.09 D (X ) + 0.04D (X ) = 0.38 D (x 2) = D (0.5X 1 + 0.25X 2 + 0.25X 3)

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

《统计学》抽样调查习题和答案

六.计算题部分 1、对一批成品按重复抽样方法抽选100件,其中废品4件,当概率为95.45%(t=2)时,可否认为这批产品的废品率不超过6%? 答案:解:2%,4100 4,100====t p n 0196 .0100 ) 04.01(04.0) 1(=-= -= n p p p μ 039.00196.02=?==? p p t μ p p p P p ?+≤≤? - 039.004.0039.004.0+≤≤-P 0.1%------7.9% ∴废品率不超过6% 2、某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元。 要求:(1)以95%的概率(t=1.96)估计全乡平均每户年纯收入的区间。(2)以同样概率估计全乡农户年纯收入总额的区间范围。 答案: 解: 200100 2000===n x σμ 39220096.1=?==?x x t μ x x x X x ?+≤≤?- 3921200039212000+≤≤-X 11608-----12392(元) 5000×11608------5000×12392(元) 3、某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%(t=2)概率保证下,估计这种新电子元件平均寿命区间。 答案: 解:2,300,6000,100====t x n σ (小时)30100 300===n x σμ (小时)60302=?==?x x t μ x x x X x ?+≤≤?- 606000606000+≤≤-X 5940-----6060(小时) 4、 从某年级学生中按简单随机抽样方式抽取50名学生,对邓小平理论课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%(99.73%t=3、68.27%t=1)的概率保证程度推断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生? 答案:解:2,10,6.75,50====t x n σ 4142 .150 10== = n x σ μ 8284 .24142.12=?==?x x t μ 2426 .44142.13=?==?x x t μ x x x X x ?+≤≤?- 8284 .26.758284 .26.75+≤≤-X 2426.46.752426.46.75+≤≤-X 72.77----78.43 71.3574---79.8426

统计学各章练习——抽样推断

第九章抽样推断 一、名词 1、抽样推断:即由样本指标来推断总体指标的统计方法。 2、抽样误差:是指抽样指标和全及指标之间的绝对离差。 3、抽样极限误差:是指样本指标与全及指标之间产生的抽样误差被允许的最大可能范围,也叫允许误差。 4、点估计:就是直接用样本指标代表总体指标的估计方法。 5、区间估计:就是把抽样指标与抽样平均误差结合起来,来推断总体指标所在的可能范围的方法。 6、假设检验:就是先对研究总体的参数做出某种假设,然后抽取样本,构造适当的统计量,利用样本提供的信息对假设的正确性进行判断的过程。 二、填空题 1.抽样推断是由(样本指标)来推断(相应的全及指标)的统计方法。 2.影响抽样误差大小的因素主要有:总体各单位标志值的差异程度、(样本的单位数目)、(抽样的具体方法)和抽样调查的组织形式。 3.抽样误差是由于抽样的(随机性)而产生的误差,这种误差不可避免,但可以控制在(所允许的范围)之内。 4.抽样平均误差是样本平均数的(标准差),是所有可能样本指标与总体指标之离差的(平均数)。 5.抽样极限误差,是指样本指标与全及指标之间产生的(抽样误差)被允许的(最大可能范围)。 6.用样本指标估计总体指标,要做到三个要求,即:(无偏性)、(一致性)、(有效性)。 7.抽样估计的方法有(点估计)和(区间估计)两种。 8.总体参数的区间估计必须同时具备(估计值)、(抽样误差范围)和(概率保证程度)三个要素。 9.总体中各单位标志值之间的变异程度越大,要求的样本单位数就(越多),即样本容量就(越大),总体各单位标志值变异程度与样本容量之间成(正比)。 10.允许误差越大,需要的样本单位数目就(越少);允许误差越小,需要的样本单位数目就(越多)。 11.对推断结果要求的可靠程度越高,必要样本单位数目就(越多);反之,可靠程度越低,必要样本单位数目就(越少)。 12.参数估计是用样本统计量估计(总体参数),而假设检验则是先对总体参数(提出假设),然后,运用样本资料验证假设(是否成立)。 三、判断 1.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定、唯一的。(×) 2.样本容量指从一个总体中可能抽取的样本个数。(×) 3.抽样极限误差总是大于抽样平均误差。(×) 4.重复抽样误差大于不重复抽样误差。(√) 5.抽样准确度要求高,则可靠性低。(√) 6.抽样平均数的标准差或抽样成数的标准差是衡量抽样误差一般水平的尺度。(√) 7.点估计就是以样本的实际值直接作为相应总体参数的估计值。(√) 8.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 四、选择 (一)单项选择 1.抽样调查所遵循的基本原则是(B)。

统计学 第六章 抽样与参数估计

《统计学》 第六章 抽样与参数估计 1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。 解: 已知n=300,概率保证程度95.45%,Z 0.0455/2 =2 P=300195=65% 区间范围P n )1(2 p p -Z ±α=0.65300 ) 65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间 2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示: 耐用时间(小时) 灯管数(只) 800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计 100 根据上述资料: (1)试计算抽样总体灯管的平均耐用时间 (2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。 (3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。 (4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验? 解: 耐用时间(小时) 灯管数(只)f 组中值x xf f x x 2)(- 800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上 15 1150 17250 486000

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

统计学习题第五章_抽样与抽样估计答案

一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2)) (1)(2)(3)(4)

6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4)) (1)是所有可能的样本指标与总体指标之间的误差范围 (2)也叫允许误差(3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5)) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小 5、不重复抽样的抽样平均误差((2)(4)) (1)总是大于重复抽样的抽样平均误差

统计学(五):几种常见的假设检验

定义 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。 假设的形式 H0——原假设,H1——备择假设 双侧检验:H0:μ = μ0, 单侧检验:,H1:μ < μ0 或,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 假设检验的种类 下面介绍几种常见的假设检验 1.T检验 亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 目的:比较样本均数所代表的未知总体均数μ和已知总体均数μ0。 计算公式:统计量: 自由度:v=n - 1 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2,即先假定两个总体平均数之间没有显著差异; 2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法;

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查B.了解样本的基本情况 C.了解总体的基本情况D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数B.总体方差 C.抽样比例D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大B.二年级较大 C.误差相同D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差B.低估误差 C.恰好相等D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2 ,则样本容量() A.扩大到原来的2倍B.扩大到原来的4倍 C.缩小到原来的1/4D .缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样B.纯随机抽样 C.分层抽样D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差B.层内方差 C.总方差D.允许误差二、多项选择题 1.抽样推断的特点有() A .建立在随机抽样原则基础 上 B.深入研究复杂的专门问 题 C .用样本指标来推断总体指 标 D.抽样误差可以事先计算 E .抽样误差可以事先控制 2.影响抽样误差的因素有() A .样本容量的大小B.是有限总体还是无限总 体 C .总体单位的标志变动度D.抽样方法 E .抽样组织方式 3.抽样方法根据取样的方式不同分为() A .重复抽样 B .等距抽样 C .整群抽样 D .分层抽样 E .不重复抽样 4.抽样推断的优良标准是() A .无偏性 B .同质性 C .一致性 D .随机性 E .有效性 5.影响必要样本容量的主要因素有() A . 总体方差的大小B.抽样方法

统计学答案 第八章 抽样与抽样分布

第八章抽样与抽样分布 一、名词解释 1、统计抽样:按照随机原则从被研究现象的总体中,抽取一部分单位进行观察,然后根据 观察的结果运用数理统计的原理,来估计总体综合指标或者对总体综合指标的某种假设进行 检验。 2、重复抽样:是从总体中每抽出一个样本单位后,把结果记录下来,随即将该单位放回到 总体中去,使它和其余的单位在下一次抽选中具有同等被抽中的机会,再抽取第二个单位,直至抽取n个单位为止。 3、不重复抽样:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止,这样的抽样方法不可能使一个总体单位被重复抽中,所以称为 不重复抽样。 4、简单随机抽样:在从总体中随机抽取n个单位作为样本时,要使得每一个总体的单位都 有相同的机会(概率)被抽中。 5、分层抽样:在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数 量的单位组成一个样本,这样的抽样方式称为分层抽样,也称为分类抽样。 6、系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点, 然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。这样的抽样方式称 为系统抽样,也称等距抽样或机械抽样。 7、整群抽样:调查时,先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群, 进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。 8、总体分布:总体是我们关心的若干个元素的集合,总体中每个元素的取值是不同的,这些 观察值所形成的相对频数分布就是总体分布。 9、样本分布:是指一个样本中各观察值所形成的相对频数分布。 10.抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时, 由该统计量的所有可能取值形成的相对频数分布。 11、比率:是指总体(或样本)中具有某种属性的单位与全部单位总数之比。 12、样本比率的抽样分布:在重复选取容量为n的样本时,由样本比率的所有可能取值形成 的相对频数分布称为样本比率的抽样分布。 二、判断题 1、× 2、√ 3、× 4、× 5、√ 6、× 7、√ 8、√ 9、× 10、√ 三、选择题 1、A 2、A 3、B 4、B 5、C 6、D 7、D 8、D 9、C 10、D 11、C 12、B 13、C 14、C 15、A 16、D 17、A 18、B 19、C 20、B 21、B 22、B 23、B 24、A 25、A 四、简答题 1、简述统计抽样的基本特点。

贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】

第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。

3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,

统计学 第五章习题

第五章思考与练习 1. 要求: (1)计算样本平均数和样本标准差,并推算抽样平均误差; (2)以95.45%的概率保证,估计该厂工人的月平均工资和工资总额的区间。 2.从某餐厅连续三个星期抽查49名顾客,调查顾客的平均消费额,得样本平均消费额为 25.5元。要求: (1)假设总体标准差为10.5元,求抽样平均误差。 (2)以95%的概率保证,抽样极限误差是多少? (3)估计总体消费额的置信区间。 3.某加油站想了解司机在该加油站加油的习惯,一周内随机抽取了100名司机,得出如下 结果:平均加油量等于13.5升,样本标准差为3.2升,有19人购买无铅汽油,试问:(1)以0.05的显著性水平,是否有证据说明平均加油量为12升。 (2)以0.05的显著性水平,是否有证据说明购买无铅汽油的司机少于20。 4 设干燥时间总体服从正态分布,现在要求置信度为95%时估计这种漆的平均干燥时间。 (1)根据经验知总体标准差为0.6小时: (2)总体标准差未知。 5.采用简单随机重置抽样从2000件产品中抽查200件产品,其中合格产品190件,要求: (1)计算该产品的合格率及其抽样平均误差; (2)以95.45%的概率,对产品合格率和产品合格数量进行区间估计; (3)如果合格品率的极限误差为2.31%,其概率保证程度是多少?

6.某电子产品的使用寿命在3000小时以下为次品,现在从5000件产品中抽取100件测得 要求: (1)分别按重置抽样和不重置抽样计算该产品平均寿命的抽样平均误差; (2)分别按重置抽样和不重置抽样计算该产品次品率的抽样平均误差; (3)以90%的概率保证,对该产品的平均使用寿命进行区间估计; (4)以90%的概率保证,对该产品的次品率进行区间估计。 7.某医院欲估计一名医生花在每个病人身上的平均时间,根据以往经验看病时间的标准差 为6分钟。若要求置信度为95%,允许误差范围为2分钟。试问随机抽样中需要多大的样本? 8.某公司新推出一种营养型豆奶,为了解该豆奶的受欢迎程度,并使置信度为95%,估计 误差不超过5%,下列情况下,你建议样本容量为多少? (1)初步估计60%的顾客喜欢此豆奶 (2)没有任何顾客资料 9.为调查某地区人口综合素质,在该地区150 000户家庭中以不重置抽样方式随机抽取30 要求: (1)试以95.45%的概率保证程度,推断该地区的人口总数 (2)若要求人口总数的极限误差不超过3300人,应至少抽取多少户作为样本? 10.某电视台为了了解某电视节目的收视率,随机抽取500户居民作为样本。从调查结果来 看,有160户收看该节目。以95%的概率保证推断: (1)该电视节目的收视率 (2)如果收视率的极限误差缩小为原来的1/2,则样本容量应为原来的多少户? 11.从某县的100个村中,抽取10个村进行各村的全面调查,算得每户平均饲养家畜35头, 各村平均的方差为16,要求: (1)以90%的概率估计全县平均每户饲养家畜的头数 (2)若极限误差为2412头,则计算其概率保证程度。

统计学作业(抽样推断)

第六章抽样推断 一、单项选择题 1. 抽样调查的主要目的在于( A. 计算和控制误差 B. . 用样本来推断总体 D. 对调查单位作深入的研究 2. 抽样调查所必须遵循的基本原则是( A. 随意原则 B. 可比性原则. 准确性原则 D. 3. 下列属于抽样调查的事项有( A. B. 为了解某大学生食堂卫生状况,对该校的一个食堂进行了调查 C. 对某城市居民1% D. 4. 无偏性是指( A. 抽样指标等于总体指标 B. C. 样本平均数等于总体平均数 D. 5. 一致性是指当样本的单位数充分大时,抽样指标( A. 小于总体指标 B. 等于总体指标. 大于总体指标 D. 充分靠近总体指标 6. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有()。 A. 前者小于后者 B. 前者大于后者C. 两者相等 D. 7. 能够事先加以计算和控制的误差是( A. 抽样误差 B. 登记误差. 代表性误差 D. 8.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。抽样平均误差( A. 第一工厂大 B. 第二个工厂大. 两工厂一样大 D. 9. 抽样平均误差是指抽样平均数(或抽样成数)的( A. 平均数 B. 平均差C. 标准差 D. 10.在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( A. 两者相等 B. 两者不等. 前者小于后者 D. 11. 反映抽样指标与总体指标之间抽样的可能范围的指标是(

A. 抽样平均误差 B. . 概率度 D. 12.在下列情况下,计算不重复抽样的抽样平均误差可以采用重复抽样公式()。 A. 总体单位数很多 B. C. 抽样单位数对总体单位数的比重很小D. 抽样单位数对总体单位数的比重较大 13.在进行纯随机重复抽样时,为使抽样平均误差减少25%,则抽样单位数应()。 A. 增加25% B. 增加78%C. 增加1.78% D. 减少25% 14.在其它同等的条件下,若抽选5%的样本,则重复抽样的平均误差为不重复抽样平均误差的( A. 1.03倍 B. 1.05倍C. 0.97倍 D. 95% 15. 在总体方差一定的情况下,下列条件中抽样平均误差最小的是( A. 抽样单位数为20 B. 抽样单位数为40C. 抽样单位数为90 D. 抽样单位数为100 16. 通常所说的大样本是指样本容量( A. 小于10 B. 不大于10 C. 小于30 D. 不小于30 17. 抽样成数指标P值越接近1,则抽样成数平均误差值()。 A.越大 B.越小 C.越接近0.5 D.越接近1 18.当总体单位数很大时,若抽样比例为51%,则对于简单随机抽样,不重复抽样的抽样平均误差约为重复抽样的( A. 51% B. 49% C. 70% D. 30% 19.将总体单位按一事实上标志排队,并按固定距离抽选样本点的方法是( A. 类型抽样 B. 等距抽样C. 整群抽样 D. 20. 在进行抽样估计时,常用的概率度t的取值( A. t<1 B. 1≤t≤3 C. t=2 D. t>3 21. 抽样调查中( A. 既有登记性误差,也有代表性误差 B. 只有登记性误差,没有代表性误差 C. 没有登记性误差,只有代表性误差 D. 上述两种误差都没有 22. 等距抽样的误差与简单随机抽样相比较( A. 前者小 B. 前者大C. 两者相等 D. 23.某地订奶居民户均牛奶消费量为120公斤,抽样平均误差为2公斤。据此可算得户均牛奶消费量在114-126公斤之间的概率为(

统计学第5-6章 正态分布、 统计量及其抽样分布

第5-6章 统计量及其抽样分布 正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的 标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥,即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时,

2 2 1 () 2x f x e π- = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ ,则 (0,1) X Z N μ σ - = 变量 2 11 (,) X Nμσ与变量2 22 (,) Y Nμσ相互独立,则有 22 1212 +(+,+) X Y Nμμσσ 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N,求以下概率

相关文档
相关文档 最新文档