文档库 最新最全的文档下载
当前位置:文档库 › 第四章 抽样估计[1]

第四章 抽样估计[1]

“科学法则并不是由权威的原理所引导的,也不是由信仰或中世纪哲学来辩明的;统计
学是诉诸新知识的惟一法庭。”
“抽样样本比判断样本更好。”
——P.C.马哈拉诺比斯

第四章 抽样估计


本章介绍抽样估计的基本理论和方法,具体要求:①理解抽样分布的含义及
总体分布、样本分布和抽样分布三者的关系,掌握常用的抽样分布定理;②通过
对抽样中误差构成的了解,正确理解抽样误差的含义及三种表现形式之间的关
系,深刻领会抽样极限误差、抽样概率度与抽样标准误三者之间的关系;③了解
优良估计量的评价标准,熟练掌握区间估计的基本原理;④掌握各种抽样组织形
式下总体均值、总体成数的区间估计,尤其是掌握各自不同的抽样标准误公式及
相应的估计方法;⑤掌握确定样本容量的一般方法。

第一节 抽样分布

一、抽样分布的基本问题

抽样估计是以样本观测结果去估计未知的总体数量特征。关于总体、样本的
概念及其相互关系已在第一章中介绍,关于抽样的概念、种类、特点和常用的组
织形式则已在第二章介绍。本章要介绍的是如何根据概率抽样的样本去估计总体
的理论与方法,因此首先要明确总体分布、样本分布与抽样分布三者的关系。

(一)总体分布及其特征

总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。
假设 X为总体随机变量,那么总体分布就是指 X的分布。很显然,同一变量不
同的总体或同一总体不同的变量,其分布是不同的。前面一章已经谈到,变量分
布的形态很多,例如 J型分布、U型分布和钟型分布等,不同的分布会有不同的
特征,认识总体分布特征是统计研究的任务之一。

反映总体分布特征的指标叫总体参数,一般用 θ来表示。在抽样实践中,常
用的总体参数有两个:一是总体均值(包括是非变量的均值);二是总体方差或
标准差(包括是非变量的方差或标准差)。

假设有限总体的容量为N,第i个个体的变量值为Xi
(i
=1, 2,3, …N),均

值为 X,方差为S2,那么就有:

N


ΣXi


X
=
i=1
N
(4-1)


Σ(N) (Xi.X)2
S2 =i=1
N.1
(4-2)

特殊地对于是非变量,如果两类变量值个数分别为 N和N(NN
N=,

101 +0)

N1个变量值为1, N0 个变量值为0,并且令 P=N1,Q=N0 ,那么如果以 XP表

NN
示总体均值,以SP
2 表示总体方差,就有:

XP
=P
(4-3)

SP
2 =
NN
.1
PQ
(4-4)

显然,PQ1。这时, P

+=X也称为总体比例或总体成数。

从理论上看,总体参数 θ的值是惟一确定的,是根据总体中所有个体的

变量
值计算而得的。然而,我们不可能经常对总体进行全面观测调查以获取所有个体
的变量值数据,所以总体参数 θ的值通常都是未知的,正因为如此才需要通过样
本观测结果来加以估计。

(二)样本分布及其特征

样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。
假设x为总体随机变量 X在样本中的体现,那么样本分布就是指 x的分布,或者
说是关于n个观测值的分布。同样,同一变量不同的样本或同一样本不同的变量,
其分布是不同的。由于样本来自于总体,包含了一部分关于总体的信息,所以样
本分布是一种经验分布。当样本容量 n很大,或者是当 n逐渐增大时,样本分布
会接近总体分布。如果样本容量很小,那么样本分布就有可能与总体分布相差很
大,抽样估计的结果就会很差。所以,如何抽样、应该有多大的样本容量才能使
样本分布充分接近总体分布,是抽样中很重要的问题。

反映样本分特征的指标叫样本统计量,通常用Τ来表示。与总体参数相对应,
常见的样本统计量也有两个:样本均值和样本方差,即:

Σ(n) x
x=i=
n
1 (4-5)

2 i=1

s=Σ(n) (
nxi
.
.
1
x)2
(4-6)

同样对于是非变量,如果两类变量值个数分别为 n和n(nn
n=,n个

101 +0)1

变量值为1, n个变量值为0,并且令 p=n1,q=n0,那么如果以x表示样本

0p

nn


均值,以s2
p表示样本方差,就有:


xp
=p
(4-3)

n


s2
p
=
n.1
pq
(4-4)

同样, pq1 xp也可称为样本比例或样本成数。

+=,

样本分布是可以通过n个观测值来描述的,例如形成分布数列、绘制分布图
和计算均值与方差等,因此反映样本分布特征的样本统计量 Τ的值(即样本统计
值)是可知的。但要注意的是,由于抽样的随机性,样本统计值不是惟一确定的。
对于任何一次抽样,所抽取的样本都只是所有可能的样本中的一个而已,而哪一
个样本被抽中事先是未知的、完全随机的,因此样本统计量 Τ是随机变量,其值
随样本不同而不同。正因为如此,以 Τ或以Τ为依据构造的其他量来反映θ只是
一种估计,会存在误差。抽样估计,就是要以可知但非惟一的样本统计值去估计
惟一却未知的总体参数的值。

(三)抽样分布及其特征

1.抽样分布的概念及影响因素
我们知道,不同样本给出的估计值是不同的,每一次抽样都是从所有可能的
样本中获取一个估计值。那么不同估计值之间的差异有多大?不同估计值出现的
概率有多大?这就要通过抽样分布来说明。

一般意义上说,抽样分布就是样本统计量的概率分

布,它由样本统计量的所
有可能取值和与之对应的概率所组成。如果说样本分布是关于样本观测值的分
布,那么抽样分布则是关于样本统计值的分布,而样本统计值是由样本观测值计
算而来的。具体地说,抽样分布就是从容量为N的总体中抽取容量为n的样本时,
所有可能的样本统计值所形成的分布。假设从容量为N的有限总体中最多可以
抽取m个容量为n的不同样本,那么把所有 m个样本统计值形成频率分布,就是
抽样分布。可以说,抽样分布是研究样本分布与总体分布之间关系的桥梁。

那么,实际的抽样分布是如何形成的呢?它取决于以下五个因素:

一是总体分布。在其他因素不变时,总体分布不同则抽样分布也不一样,一
般地总体分布越集中则抽样分布也越集中,总体分布越分散则抽样分布也越分
散。

二是样本容量。样本容量是决定抽样分布最有效、最关键的因素。在其他因
素不变时,样本容量越大则抽样分布越集中,样本容量越小则抽样分布越分散。
关于这一点,本章后面有关内容还会从其他角度加以说明。

三是抽样方法。以简单随机抽样为例,重复抽样与不重复抽样的抽样分布不
同,考虑样本单位抽取顺序与不考虑样本单位抽取顺序的抽样分布有别。关于重
复抽样不不重复抽样的区别已在第二章第一节中介绍,而考虑样本单位抽取顺序
与不考虑样本单位抽取顺序的区别则在于是否认为构成单位(即元素)相同但抽
取顺序不同的样本为同一个样本,例如对于样本ABC、ACB、BAC、BCA、CAB、CBA,
在考虑顺序时被认为是 6个不同的样本,在不考虑顺序时被认为是同一个样本。
这样,在简单随机抽样下,从总体 N个个体中抽取容量为n的样本,其样本个数

m有以下四种情况:mNn;(2)不考虑顺序的重

(1)考虑顺序的重复抽样, =
复抽样,mC=n
+.1 (3)考虑顺序的不重复抽样,mPNn;

Nn
;=(4)不考虑顺序的


不重复抽样,mCNn
。样本个数不同,抽样分布也就自然有别。一般情况下,

=

抽样方法只指上述(1)和(4)这两种情况,抽样实践中(4)最为常用。

四是抽样组织形式。在第二章第一节曾介绍抽样组织形式有简单随机抽样,
分层抽样,等距抽样,整群抽样和多阶段抽样五种。对于同一总体、相同的样本
容量和抽样方法,不同的抽样组织形式就会有不同的样本结构和样本个数,因而
有不同的抽样分布。正因为如此,在抽样实践中如何选择最合适的抽样组织形式
是一个非常重要而又十分灵活的问题。

五是估计量构造。以样本估计总体必须借助一定的估计量,通常用θ.
表示



从估计量的构造是否利用调查变量本身以外的信息上看,估计量有直接估计量与
间接估计量之分。直接估计量仅利用样本提供的关于调查变量本身的信息,此时
估计量就是样本统计量Τ。而间接估计量除了利用样本提供的关于调查变量本身
的信息外,还利用与调查变量相关的辅助变量的信息(总体的和样本的),例如
比率估计量和回归估计量等,此时估计量就是样本统计量 Τ的改造形式,样本统
计量分布就变成了估计量分布。在其他因素不变时,估计量构造不同,估计值就
不一样,因而抽样分布也就不同。限于篇幅,本章只介绍直接估计量。

2.抽样分布形式
在抽样估计中,最基本的抽样分布是样本均值的抽样分布和样本成数的抽样
分布,我们以此来说明抽样分布的形式。假设m个样本统计值形成单项式数列(分
为k组),则样本均值和样本成数的抽样分布形式分别如表 4-1和表 4-2所示。

表 4-1 样本均值抽样分布形式

ix
1x
2x
3x … kx



表 4-2

3π …
样本成数抽样分布形式
kπip
1p
2p
3p … kp iπ 1π

3π … kπ

上述表中πi
为某一样本统计值出现的频率即概率,Σ(k) πi
=1,km。



i=1

【例4-1】设某总体由2、4、6、8、10五个数字组成,现要从总体中随机
抽取容量为 3的样本,那么在考虑样本单位抽取顺序时,重复抽样和不重复抽样
的样本均值的抽样分布如何?

容易计算,总体均值为 X=6 ,总体方差为S2 =8 。重复抽样的样本个数为

m=
53 =125 ,在不重复抽样下的样本个数为mP53 =60

=
。经过计算整理,他们
的样本均值的概率分布分别如表 4-3和表 4-4所示。


表 4-3 重复抽样的样本均值抽样分布

ix

ix

2 2.67 3.33 4 4.67 5.33 6 6.67 7.33 8 8.67 9.33
10
1
125
3
125
6
125
10
125
15
125
18
125
19
125
18
125
15
125
10
125
6
125
3
125
1
125
表 4-4 不重复抽样的样本均值抽样分布
2 2.67 3.33 4 4.67 5.33 6 6.67 7.33 8 8.67 9.33
10
0 0 0 6
60
6
60
12
60
12
60
12
60
6
60
6
60
0 0 0

如果不考虑样本单位抽取的顺序,那么重复抽样和不重复抽样下的样本个数

分别为mCn
+.1 =C73 =35 和 =
Nn=
3 =10 ,具体的样本均值分布也会简单一

=
Nn
mCC5

些,请读者自己给出。

由表 4-3和表 4-4可以看出,样本均值的分布是钟型对称的,尤其是表 4-3
的钟型特征更为明显。

【例4-2】设某总体由 10个球组成,其中红球 6个,现从总体中随机抽取 4
个球,那么在重复抽样和不重复抽样下红球比重(样本成数)的抽样分布分别如
何?

容易计算,总体成数为 P=0.6

,总体方差为
NN.1
PP
(1 .
) =0.2667 。在重复

抽样下,样本中红球的比重服从二项分布;在不重复抽样下,样本中红求的比重
服从超几何分布(关于这两种分布在稍后介绍)。经过计算整理,重复抽样和不
重复抽样下红球比重(样本成数)的抽样分布分别如表 4-5和表 4-6所示。

表 4-5 重复抽样下红球比重的抽样分布

p


0 0.25 0.5 0.75 1
i

0.0256 0.1536 0.3456 0.3456 0.1296

πi


表 4-6 不重复抽样下红球比重的抽样分布
ip
0 0.25 0.5 0.75 1

1
210
24
210
90
210
80
210
15
210

3.抽样分布特征
任一抽样分布都有自己的特征,这个特征就是样本统计量的数学期望和方
差。其中,样本统计量的数学期望就是所有样本统计值的平均数,样本统计量的
方差就是所有样本统计值关于数学期望的方差。当估计量就是样本统计量时,数



=Σ.
ii
() Σ..
.
i
θ.
2
πi
。学期望与方差分别表示为 (). θπ
和Vθ.
θ.E()..


在简单随机抽样下,样本均值的数学期望为总体均值即 ()=Σxii
=
X,

Ex
π


样本均值的方差为 ()=Σ(xi.X)2πi

Vx
。在例 4-1中,不论是重复抽样还是不重

复抽样,样本均值的均值都等于6,但重复抽样与不重复抽样的方差则有不同的

结果,重复抽样下的方差为 () 8,不重复抽样下的方差为Vx=4。同理,

Vx=()

33

在简单随机抽样下,样本成数的数学期望为总体成数即 E()p=Σii
=P


,样本

成数的方差为 () pP.
)2πi
。在例 4-2中,不论是重复抽样还是不重复抽

Vp=Σ(i


样,样本成数的均值都是0.6,但重复抽样与不重复抽样的方差也有不同的结果,

重复抽样下的方差为 () 0.06,不重复抽样下的方差为 () 0.04。

Vp=Vp=

根据第三章关于离散指标的含义可知,在均值相同的情况下,方差不同就代
表分布的离散程度不同,即方差越小(大)抽样分布的离散程度越弱(强)或抽
样分布的集中趋势越强(弱)。由于在各种抽样方法和抽样组织形式下,样本统
计量的数学期望等于总体参数(例如样本均值的数学期望等于总体均值、样本成
数的数学期望等于总体成数)这个性质基本都能得到满足(即稍后将介绍的无偏
性),因而抽样分布的特征主要是通过抽样分布的方差来体现的。很显然,由于
抽样估计是以所抽取样本所提供的特征(即样本统计值)为依据的,因而抽样分
布越集中、样本统计量分布的方差越小,则所抽取样本的统计值就越可能接近总
体参数,抽样估计的误差就越小,抽样估计的结果就越精确。因此,如何在遵循
随机原则和节省费用的前提下,设计出抽样分布方差

最小的抽样方案,始终是我
们追求的目标。当然,样本统计量无偏并不等于抽样分布无偏,抽样分布的偏差

性需要用偏度系数,例如样本均值分布的偏差要用 [x.
()3/.
Vx.
来反

Σ(m) i
Ex]()
3

.


.

i=1

映。

需要说明的是,我们每次抽样一般只能抽取一个样本,所得到的样本统计值
只是m个可能值中的一个,不可能按上述形式列出样本均值或样本成数的实际抽
样分布,因此也不可能按前述的公式来计算抽样分布的期望和方差。但是,我们
对样本统计量抽样分布的理解,能帮助我们掌握样本统计量分布的规律和样本统
计量与总体参数之间的内在联系,从而使我们由样本去估计总体有据可循。

二、常用的抽样分布定理

(一)样本均值的抽样分布定理

1.正态分布的再生定理
如果某样本的n个个体完全随机地来自数学期望为 X、方差为S2的正态总

体,则不论样本容量n多大,样本均值x服从数学期望为 X、方差为Vx=S2
(重

()

n



复抽样时)或 () =( .
)2

Vx
NnS
(有限总体且不重复抽样时)的正态分布。标准

Nn


x.
X

化统计量z=
()
则服从数学期望为0、方差为 1的标准正态分布。此即为正

Vx


态分布的再生定理。

2.中心极限定理
对于任一具有平均数 X和方差S2 的有限总体,当样本容量n足够大时(例
如n>30 或n>50 ),样本均值 x的分布也趋于服从正态分布,其数学期望和方差
与再生定理的相同。此即为中心极限定理。

3.t分布定理
当正态总体的方差未知且n较小,或任一方差为 S2 的总体但n较小,则样本

均值x的分布服从自由度为n.1的t分布。t分布曲线与正态分布相近,其中数学
期望相同。
(二)样本成数的抽样分布定理

1.二项分布定理
从一个数学期望为P、方差为 N
PQ的是非变量(0-1分布)总体中随机
N.1
重复地抽取容量为n的样本,那么样本中含有n1个某类变量值的概率为:

nn
.

11 1

π
()1=n
nn


n
CPQ
(4-5)

其中n1 =0,1, 2,3, …,n;Σπ
()n1=
1。

对于特定的n和P,可以求出n1 =0 至n1=
n的所有概率,也即可以求出 p=0

至 p=1的所有概率,从而形成一个分布,这个分布就是二项分布。当 P=0.5时,
二项分布是对称的;当P≠0.5时,二项分布是不对称的。

2.超几何分布定理
从一个数学期望为P、方差为 N
PQ的是非变量(0-1分布)总体中随机
N.1
不重复地抽取容量为n的样本,那么当 N1≥
n同时N0 ≥
n时,样本中含有 n1个某
类变量值的概率为:

nn

10

CC

π
(,

nn


1, 0) NC
1
Nn
N0 (4-6)

NN
=

10

其中n=0,1, 2,3, …,n;π(,

NN


,) =1。

nn

1 10

10

对于给定的n和P,可以求出n1 =0 至n1=
n的所有概率,也即可以求出 p=
0


至 p
=1的所有概率,从而形成一个分布,这个分布就是超几何分布。当 N无限

增大时,超几何分布趋向于二项分布。

3.中心极限定理
从任一数学期望为P、方差为 N
PQ
的是非变量(0-1分布)总体中随机

N
.1

抽取容量足够大的样本(一般要求同时nP
>5,nQ
>5),则样本成数 p的分布

NPQ

趋于服从数学期望为P、方差为 Vp()=
(N
.1)n
(重复抽样时)或数学期望为 P、

NnPQ
.

方差 ()=
(
(N
.
.1)
n
(不重复抽样时)的正态分布。标准统计量z
pVpP


Vp
=

) ()

服从数学期望为0、方差为 1的标准正态分布。也就是说,正态分布是二项分布
与超几何分布的极限形式。

正态分布是最重要、最常用的抽样分布。由于实践中的抽样一般都符合大样
本的要求,因此我们可以根据正态分布理论,在一定的概率保证下,以所抽样本
给出的估计值为依据对总体参数作出区间估计。

第二节 抽样误差

一、抽样中的误差构成

要讨论抽样误差问题,首先要弄清楚抽样中的误差构成情况。对于这个问题,
应该说目前国内外的有关文献尚没有一个统一的分类。一般地,抽样中的总误差
可以简单地分为两类(暂不考虑估计量偏差时),一类是抽样误差,一类非抽样
误差,它们之间的关系可以图 4-1所示。

总误差
非抽样误差



抽样误差

图 4-1 抽样中的误差构成

所谓抽样误差是由于抽样的非全面性和随机性所引起的偶然性误差,即因抽
样估计值随样本不同所造成的误差。我们本章的讨论就是以只存在抽样误差为前
提的。偶然性误差的特点是,它随着样本容量的增大而趋向于0,或者说各样本
统计值的平均数与总体参数值之差为0。

所谓非抽样误差是由随机抽样的偶然性因素以外的原因所引起的误差,是非
抽样调查所特有的。它主要是由于抽样框不够准确(与目标总体不一致)、有些
观测单位的数据无法取得、已取得的一些数据不真实等原因引起的样本观察数据
非同质、或残缺、或不真实而产生的误差,其中的一个重要部分就是所有统计调


查都可能产生的调查性误差。这种误差与抽样的随机性无关,往往具有系统偏向性。当非抽样误差超过一定程度时,抽样估计结果就会与实际情况严重不符,就会失去意义。因此,减少和控制非抽样误差具有很重要的意义。

综合上述分类,可以把抽样调查中的总误差表示为如下关系式:

(总误差)2(抽样误差=)+(2) (非抽样误差)2

二、抽

样误差的表现形式

抽样误差的表现形式一般有三种:抽样实际误差、抽样标准误和抽样极限误
差。

(一)抽样实际误差

抽样实际误差是指样本估计值与总体参数值之间的离差,表示为 θ.

。当

估计值比总体参数值大时,实际误差为正;当估计值比总体参数值小时,实际误
差为负。若估计量无偏,则所有可能的估计值的实际误差总和为0。当然,从估
计精度的角度来看,我们并不关心误差的正与负,而是关心误差绝对值的大小。
例4-1中,估计值4和8的实际误差是相同的,都是2。还需要说明的是,每一
次抽样的实际误差是不可知的,因为 θ是未知的,我们讨论它的目的是为了更好
理解衡量抽样误差大小的核心指标——抽样标准误。同时,抽样实际误差是随机
变量,因为依据不同样本得到的估计值与总体参数值之间的离差是不同的。

(二)抽样标准误

抽样标准误是衡量抽样误差大小的核心指标,是对总体参数做出区间估计的
一个重要因素,狭义上所指的抽样误差就是抽样标准误。那么什么是抽样标准误
呢?

抽样标准误就是抽样分布方差的平方根,即抽样分布的标准差或样本统计量

的标准差,表示为SE()θ.
= V
(θ.
)。抽样标准误与实际抽样误差的关系是:若各

个估计值的实际误差越大,则抽样标准误也越大,若各个估计值的实际误差越小,
则抽样标准误也越小。通过抽样标准误可以衡量抽样分布的离散程度,反映样本
统计量代表性的高低。抽样标准误越大(小),表明抽样分布越离散(集中),从
总体中抽取样本的代表性平均来讲就越差(好),抽取样本估计总体的误差平均

8

来讲就越大(小)。在例 4-1中,重复抽样下的抽样标准误为
3,不重复抽样

4

下的抽样标准误为
3,表明重复抽样的抽样分布比不重复抽样的分散。事实上,

在重复抽样下,所抽取样本的均值处于4~8之间的概率为84%,而在不重复抽
样下所抽取样本的均值处于4~8之间的概率为100%。因此,抽样标准误能衡
量抽样误差大小的一般水平。

从理论上看,对于确定的总体和样本容量,在相同的抽样方法和抽样组织形
式下,抽样标准误是个惟一确定的值,即不论抽到哪一个样本,不论各实际抽样
误差(即样本统计值与总体参数真值之差)多少,抽样标准误是相同的。所谓抽
样误差可以计算和加以控制,就是从这个意义上而言的。但实际上,由于不可能
知道所有的样本统计值,也未知总体参数本身的值,因而要按前述方法准确算出


抽样标准误是不可能的,通常只能根据其他途径由某一具体样本

的观测数据来加

以估计,表示为se()θ.
。由于不同样本所得的抽样标准误的估计值se()θ.
互不相同,

因而从这个意义上来说,抽样标准误又是随机变量。具体如何估计抽样标准误,
将在第三节结合各种抽样组织形式加以介绍。

影响抽样标准误的因素,就是影响抽样分布的因素,因此抽样分布与抽样标
准误这两个概念始终是联系在一起的。

(三)抽样极限误差

抽样极限误差是指以样本估计总体所允许的最大误差范围,也即在一次抽样
估计时,估计量所允许取的最高值或最低值与总体参数值之间的绝对离差,通常

用Δ来表示,即 θ.



≤Δ。Δ与θ之比被称为抽样估计相对允许误差,一般表示

为γ,1减去抽样估计相对误差被称为抽样估计精度。

抽样极限误差实际上就是对估计量可允许取的最高值或最低值进行了限制,
因为每一次抽样都有一定的精度要求。如果抽样极限误差过大,即所允许的估计
值过高或过低,那么抽样估计的结果就可能毫无意义。例如,某些社会经济指标
平均每年能递增5%就算不错了,如果抽样极限误差比5%都要大,则抽样估计的
价值就难以体现了。

那么抽样极限误差Δ该如何确定呢?它取决于两个因素:一是抽样标准误,
即抽样分布本身具有多大的标准差。如果说抽样标准误是一把衡量抽样误差大小
的尺子,那么抽样极限误差就是以该尺子来衡量的一个长度。在其它条件既定时,
抽样标准误越大(小),抽样极限误差也就越大(小)。二是抽样估计概率保证程
度,也称为置信水平,通常表示为1.α
,其中α就是显著性水平。以样本估计
总体,除了有精度要求外,还有可靠度要求,即以多大的概率来保证估计是准确
的。根据抽样分布曲线可知(参照图2-2),抽样分布曲线与估计量坐标轴之间
的极限面积为1,或者说抽样分布曲线涵盖所有可能估计值的概率为 100%。在
抽样分布标准差(即抽样标准误)既定时,所要求的概率保证程度越高(低),
被曲线覆盖的可能最高估计值或最低估计值就越远离抽样分布的中心位置(估计
量的期望值),抽样极限误差也就越大(小)。

为了把抽样极限误差、抽样标准误和抽样概率保证程度三者关系更清楚地表
达出来,我们把抽样极限误差与抽样标准误之比的系数称为抽样概率度。在正态
分布下,抽样概率度用zα来表示,即

2

Δ
=zα
SE()θ. (4-7)

2




2
=
SEΔ()θ. (4-8)
不难发现,Δ分别与zα、SE()θ.
成正比,而zα与SE()θ.
成反比。因此,在

22

一定的概率保证下,要想提高抽样估计精度,就必须

缩小抽样极限误差,就必须
通过抽样设计来降低抽样标准误。


zα正是当显著性水平为α时的标准正态分布的双侧临界值,概率保证程度

2

1.α的高低变化正好可以通过zα的大小变化来反映。例如当zα分别为1,1.64,

22

1.96,2,2.58和3时, 1.α分别为 68.27%,90%,95%,95.45%,99%和 99.73%,
如图 2-2所示。
-3 -2 -1 0 1 2 3

68.27%

95.45%

99.73%

图 2-2 标准正态分布临界值与置信水平

第三节 参数估计方法

一、估计量的评价标准

在估计总体参数时,一个很重要的问题是估计量的选择。所谓估计量,就是
用以估计总体参数的量,或者说是根据样本结果来估计总体参数的规则或形式。
如前所述,估计量一般情况下就是样本统计量。估计量的某一具体的值,就称为
估计值,它是以所抽样本的观测数据为依据而计算得到的。

在参数估计时,人们可以构造很多个估计量,但不是所有的估计量都一样优
良。例如,要估计总体平均数,估计量有算术平均数、中位数、众数等,到底用
哪一个估计量更合适,就需要有评价的标准。通常,评价估计量好坏的标准有四
个:无偏性、有效性、一致性和充分性。这是就抽样分布的性质而言的。

(一)无偏性

以样本估计总体,虽然某一估计值可能会存在正的或负的估计误差,但不应
该存在系统性偏差,即所有可能的估计值与总体参数值离差的均值应该为零。对

于总体参数θ,若其估计量θ.
的数学期望等于θ,即E()θ. =θ,或离差(θ.θ.
) 的

数学期望为0,即 E
θθ) =0 ,则称θ为总体参数θ

(. .
.的无偏估计量。否则,估计

量就是有偏的,即估计值平均来讲会偏高或偏低。容易证明,样本均值 x是总体

均值 X的无偏估计量,样本成数 p是总体成数P的无偏估计量,样本方差s2 是

总体方差S2的无偏估计量。

(二)一致性


以样本估计总体,虽然会存在估计误差,但是作为一个优良的估计量,其估
计误差会随着样本容量的增大而减小,也就是说,随着样本容量的增大,估计量
的值会越来越靠近总体参数的真值,或者说,随着样本容量的增大,估计量与总
体参数之差的绝对值小于任意小的正数的可能性越来越大甚至达到100%。符合
这一要求的估计量就叫做一致性估计量。同样可以证明,样本均值 x,样本成数

p和样本方差s2分别是总体均值 X、总体成数P和总体方差S2的一致性估计量。

(三)有效性

以样本估计总体,要求优良估计量的抽样分布方差(或标准差,即抽样标准
误)小于其他估计量的抽样分布方差(或标准差,即抽样标准误),即从平均的



角度来看,优良估计量的估计误差应小于其他估计量的估计误差。若以 θ.
0表示某

. ...

一无偏估计量,θ表示其他无偏估计量,则θ.
比θ有效的前提是Vθ
() θ

i
0 i
0 i


例如,对于正态分布总体来说,样本均值x和样本中位数me都是总体均值 X的

无偏估计量,但两者的方差不同,样本中位数的方差 ()

Vme是样本均值的方差

(),Vx的 1.57倍,因此,样本均值比样本中位数有效。容易证明,样本均值 x

样本成数 p和样本方差s2分别是总体均值 X、总体成数P和总体方差S2的有效

估计量。

(四)充分性

以样本估计总体,根据样本观测数据计算出估计值时往往要损失一些有用的
信息,因此,估计量的构造应尽量减少这种信息损失。从直观意义上看,若估计

量θ.
提取了样本中包含的有关总体参数θ的全部信息,则估计量θ.
就是充分估计

量。样本均值x,样本成数 p和样本方差s2分别是总体均值 X、总体成数P和

总体方差S2的充分估计量。

同时满足上述四个标准的估计量,就是优良的估计量。样本均值 x,样本成

数 p和样本方差s2都是优良估计量。当然,估计量的选择有时会在无偏性要求与

有效性要求之间产生矛盾,即某估计量无偏但方差较大,另一估计量有偏但方差
(均方误差)较小,这时的基本原则是如果有偏估计量的偏差不是很大(可以忽
略),应该优先选择有偏但更有效的估计量。

二、参数估计方法

参数估计的方法有两种:点估计与区间估计。

(一)点估计

所谓点估计也称定值估计,就是以样本观测数据为依据,对总体参数做出确
定值的估计,也即用一个样本的具体统计值去估计总体的未知参数。例如,以某

一样本的均值x去估计总体均值,即 X.
=
x;以某一样本的成数 p去估计总体成


数,即 Pp.=;以某一样本的方差 s2 去估计总体方差,即 .2 =2

Ss等,就是点估计

的一般形式。例如,根据样本观测数据,估计某市居民人均年收入 8000元,估
计某批产品合格率98%等,就属于点估计的具体形式。

确定一个好的点估计是很重要的。点估计的优点是能给出一个明确的值,缺
点是没有指出这种估计的允许波动范围和把握程度有多大。因此,在实际中,点
估计往往是与区间估计同时进行的。

(二)区间估计

所谓区间估计,就是指用一个具有一定可靠程度的区间范围来估计总体参

数,即对于未知的总体参数 θ,想办法找出两个数值 θ1
和θ2(θ1 <θ2 ),使θ处于

区间(θ1,θ2 )内的概率为1.α,即

π(1 <<2) =1.α

θ
θθ
(4-9)

区间( θ1,θ2 )

为总体参数的估计区间或置信区间, θ1
为估计下限或置信下

限,θ2 为估计上限或置信上限。

区间估计的特点是它不指出被估计参数的确定数值,而是在一定的概率保证
下指出被估计参数的可能范围。区间估计的两个基本要求(也即评价标准)是置

信度和精确度。一方面,我们希望估计区间( θ1,θ2 )包含 θ的概率1.α越大越

好;另一方面,我们希望估计区间( θ1,θ2 )的长度越短越好。因为,概率 1.α


越大,表示参数估计的可靠性越好,而估计区间越短,则表示参数估计的精度越
高。然而在样本容量 n一定的条件下,这两个基本要求往往是相互矛盾的。即若
概率1.α增大,则估计区间也会拉长,估计精度下降;相反,若是提高估计精
度,则概率1.α必然会下降。因此,我们一般在给定的概率保证下,尽可能提
高估计的精度。

估计区间有一个频率解释,即 θ1
和θ2 都是不依赖于未知参数的随机变量,其

具体数值要依被抽取样本的观测结果而定。因此,每一个可能的样本都可以有一
个估计区间,这个估计区间可能包含 θ在内,也可能不包含 θ在内。但对于所有
可能的样本而言,会有 100( 1.α)%的估计区间包含 θ在内。因此,概率 1.α就
是所有可能样本所给出的估计区间中包含总体参数θ在内的估计区间出现的频
率。

有些实际问题,人们关心的只是总体参数在一定概率保证下的下限或上限。

例如,产品的平均使用寿命越长越好,人们关心的只是估计的下限,即(,;

θ1∞)

产品的不合格率越低越好,人们关心的只是估计的上限,即 (0, θ2) 。这种只给出

下限θ1
或上限θ2 的区间估计称为单侧区间估计。由于双侧区间估计用的较多,因


此本书只讨论双侧区间估计。
对于双侧区间估计,在正态分布情况下,样本统计量关于总体参数对称分布。

因此我们要求θ1
与θ的距离等同于θ2与θ的距离,即θ1.θ


。这一距离


θ


2.

规定了所允许的最高估计值或最低估计值与总体参数真值离差的大小,即上述的
抽样极限误差Δ,因此 Δ=
.=.。由于 θ未知,要以估计量 θ.
来估计,因

θ2 θθθ
1

此就有θθ.
Δ,θθ.
Δ,这样,我们就有:

1=.2=+

(θ.
.Δθθ
. Δ)1 (4-10)

π<<+=.α


即总体参数θ被(θ.

+,θ. Δ)所包含的概率为1.α。

这样,只要我们根据样本观测数据计算出估计值 θ.
,根据相应公式估计出抽

样标准误se()θ.
,根据给定的概率1.α查出临界值zα,就可以计算出抽样极限

2
误差Δ,从而给出总体参数θ的估计区间。

具体到总体均值和总体成数的区

间估计,当样本容量充分大时,在1.α的
概率保证下,我们可得到总体均值的估计区间为(x
.zsex
,x
+z

()
ααse
x()),总

22

体成数的估计区间为(p
.zsep
α
(),p
+zαse
p
())。

22

第四节 各种抽样组织形式的参数估计

不同的抽样组织形式,估计量的具体形式和抽样标准误的计算方法都是有所
差别的,因此,在相同的样本容量 n和相同的概率保证1.α下,不同抽样组织形
式的估计结果也是不同的。当然,区间估计的原理是一样的。本节将分别介绍各

种抽样组织形式下的总体均值 X和总体成数P的估计量及抽样标准误。

一、简单随机抽样

(一)总体均值 X的估计

设xi为样本中第i个个体的变量值,则当样本容量为n时,总体均值 X的估
计量为:

.

Xx

==


n
(4-11)

Σnix

i=1

与该估计量相对应的抽样标准误为:

S2

()=

SE
x


n
(重复抽样时) (4-12)





SE
x
() =(1.
nf
)S2
(不重复抽样时) (4-13)

其中 f
=nN
,称为抽样比。

1.f
称为有限总体校正系数,当 f
<5% 时, 1.f
≈1,重复抽样与不重复

抽样的抽样标准误相差甚微,可以忽略有限总体校正系数。
一般情况下,总体方差S2是未知的,要以样本方差s2 来估计, ()就变

SE
x

成了 ()。

se
x

【例4-3】从某高校的 14500名学生中随机不重复抽取 100名学生进行月生
活费支出调查,经计算样本均值为x=546元,样本方差为 s2 =45568元,要求
以95%的概率保证估计该校全体学生的人均月生活费支出额。

由题意知,N=14500,n=100,f=0.69%<5%;由1.α=95%可知zα=

2

1.96。
根据公式(4-12)(因为 f<5%,可用重复抽样公式),并以s2 代替S2,可
估计抽样标准误为:

s2 45568

() =

se
x


n
100
=21.35元;


=


抽样极限误差为 =zsex
=1.96×21.35 =41.85Δα
() 元。

2

由此可得,全校学生人均月生活费支出额的点估计为 X. x546

==元,95%

概率保证的区间估计为(546-41.85,546+41.85)=(504.15,587.85)元。
(二)总体成数P的估计
根据前面关于总体成数与样本成数的定义,总体成数P的估计量为:

.1

Ppn
(4-14)

==

n


与该估计量相对应的抽样标准误为:

NPQ

() =

SE
p


(N
.1) n
(重复抽样时) (4-15)




(NnPQ
)1.fN

() =

SE
p


(N
.
.1) n
=
nN
.1
PQ
(不重复抽样时) (4-16)



当总体方差 NP(1.P) 未知时,要以样本方差 np(1.p) 来估计。

N.1 n.1

【例4-4】某批产品 5000件,从中随机不重复抽取 500件进行检查,发现
有 60件不合格,要求以90%的概率

保证估计该批产品的不合格率。
由题意知,N=5000,n=500, f=0.1,n1=60;由 1.α=90%可得zα


=1.64。

n1 60

容易计算得样本成数为: p==
=12% 。

n
500
根据公式(4-16)并以样本方差 np(1.p) 代替总体方差 NP(1.P) ,

n.1 N.1

可估计抽样标准误为:

1.fn
1.0.1 500

se() =
nn.1
pq=
500 500 .10.12×0.88 =1.38%;

p


抽样极限误差为 =zse() =1.64×1.38%

Δα
p
=2.26% 。

2

因此可得,该批产品不合格率的点估计为 .==

Pp12% ,90%概率保证的区

间估计为(12%-2.26%,12%+2.26%)=(9.74%,14.26%)。
(三)样本容量n的确定
在抽样调查之前必须先确定样本容量,这是抽样方案设计的重要内容。样本

容量的大小要受总体分布(内在差异程度)、对抽样精度和可靠程度的要求、抽样方法及调查经费等因素的影响,在不考虑调查经费时,简单随机抽样的样本容量可由以下公式确定:

22 2

ααPQ

zSNzn重=
Δ(2) 2 或n重=
(N.1)(2) Δ2 (4-17)

n不重=
n重
n重
(4-18)
1+

N


其中n重和n不重分别表示重复抽样和不重复抽样下所需的样本容量。显然,在抽

样要求相同情况下,n重﹥n不重。

由于总体方差S2 或 NPQ通常未知,因此要用近期的过去数据来代替或

N.1

由经验判断确定,也可由试抽样的样本方差来代替。

若某次抽样既要估计总体均值,又要估计总体成数,而他们所需的样本容量
不一样,那么在条件(如费用等)允许时应取最大者。否则可取最重要指标所需
的样本容量,或取所有所需样本容量的平均数,但这时必有部分指标的抽样估计
要求(精度或可靠程度)得不到满足。

【例4-5】某企业生产某种产品,优级的标准是耐用时间 5000小时以上。


现有该产品 10000件,拟进行一次抽样调查。根据历史数据知,这种产品耐用时
间的方差为 1562500小时,是否优级的方差为0.0736。若要求估计平均耐用时
间的抽样极限误差不超过 130小时,估计优级率的抽样极限误差不超过3.2%,
问在95%的概率保证下,应分别抽取多少件产品进行调查才满足要求?

由题意知,N=10 000, S2=1562500小时, N
PQ
=0.0736,Δx
=130

N
.1

小时,Δp =3.2%,zα=1.96。

2

估计总体平均耐用时间所需的样本容量为:

22

zS2

n重=
Δ(2) 2 1302

α=
1.96 ×1562500 =356 (件);

n重356

n
不重=
1+n重
=
1+356
=344 (件)。

N
10000

估计总体优级率所需的样本容量为:

Nz2 PQ 2 n重=
α
= 1.96 ×0.0736 =277(件);


(N
1)(2) 2 (2


3.2%)

n
=
n重=
277 =270 (件)。
不重
1+n重 1+277
N

10000


若要同时满足平均耐用时间和优级率抽样估计的需要,那么在重复抽样时应
抽 356件,在不重复抽样时应抽 344件。

按无关标志排序(随机排序)的等距抽样,可采用与简单随机抽样相同的抽
样标准误估计公式。按有关标志排序的等距抽样,抽样标准误的估计就比较复杂,
实践中需要采用一些变通的方法,读者可参阅抽样方面的专业书籍。

二、分层抽样

(一)总体均值 X的估计

设总体的N个个体分为H层,Ni
为第i层个体数,Wi
=Ni



N
为第i层的层

权,ni为第i层抽取的个体数,f
=nN
为第i层的抽样比,xij为第i层第 j个个

ii


i


体的变量值,那么第i层的层均值 Xi
的估计量为:

Σ(H) xij
X.
i
==
xi
i=1 (4-19)

n

i


总体均值 X的估计量为:


X. =
xHstiiWx=Σ (4-20)

i=1

这一估计量是无偏的,即 () =
WX
=
X


Exst Σ(H) i


i=1

与该估计量相对应的抽样标准误为:

H


SE
x
()st
=Σ(重复抽样时)(4-21)

i=
221iiWSn

i




H
1.
f

SE
x
()st
=Σ(不重复抽样时)(4-22)

i=
i
221iiiWSn

2Ni

Σ(xij
.
Xi)
其中Si
2 =
j=1
N
.1
为第i层的方差,未知时要用层内样本方差si2 来估计。

i


求出抽样标准误后,即可根据给定的概率保证程度对总体均值 X做出区间

估计。

【例4-6】某市有 250家百货商店,按以往销售额多少分为大、中、小三层,
从中按分层抽样方式不重复抽取 50家进行本季度销售额的调查。现将各层的层
权、各层抽取的商店数、各层样本均值和样本方差等数据列于表 4-7,要求以

95.45%的概率保证程度估计该市平均每家百货商店的季销售额。
表 4-7 该市百货商店分层情况及样本数据

商店分层
各层商店数
(家) iN
层权
iW
各层抽取数
(家)ni
各层销售额的样
本均值(万元) xi
各层销售额的样本
方差(万元) 2si
大型商店
中型商店
小型商店
25
75
150
0.1
0.3
0.6
5
15
30
1700
800
120
2800
6985
10850
合计 250 1.0 50

由题意知:N=250,H=3, f1 =
f2 =
f3 =0.2;由 1.α=95.45%可得 zα

2

=2。
根据表中数据容易计算,全市平均每家商店季销售额的点估计为:

X. =
x
=ΣWx
=0.1×1700+0.3×800+0.6×120=482(万元)。

st
ii


根据公式4-22,并以各层的样本方差代替层方差,可估计抽样标准误为:

1.
fi
22

() =
Ws


se
x

st

ii

n

i



222

=
0.8×(0.1 ×2800 +0.3 ×6985 +0.6 ×10850)

5 15 30

=11.92(万元);
抽样极限误差为: zse(xst) =2×11.92 =23.84

Δ=
α
(万元)。


2

由此可得,95.45%概率保证的全市平均每家百货商店季销售额的区间估计
为:(482-23.84,482+23.84)=(458.16,505.84)(万元)。
(二)总体成数P的估计

设Ni1为第i层的某类变量值的个数,ni1为第i层样本中某类变量值的个数,

那么第i层成数Pi
的估计量为:

. i1

Pp
=
=n
(4-23)

ii


n

i


总体成数P的估计量为:

.

Pp=
p
(4-24)

HstiiW=Σi=1


与该估计量相对应的抽样标准误为:

W
N
i

() =
nN
.1
P (重复抽样时)
(4-25)

SEp
Q

st Σ(H) ii
i=
i
21ii




() =
fW
NiP (不重复抽样时) (4-26)

SEp
Q

st Σ(H) ii


i=
211iin.()
N.1

ii


层方差 Ni
PQ未知时要以层内样本方差 ni
pq来估计。

ii
ii

Ni.1 ni.1
求出抽样标准误后,即可根据给定的概率保证程度对总体成数P做出区间估
计。
【例4-7】某总体的 1000个个体分为两层, N1=700,N2 =300;用不重复

抽样方法各层分别抽取容量为n1=85, n2=45的样本;各层样本中某类变量值

的个数分别为ni1=60,ni2 =18。要求以95%的概率保证程度对总体成数 P做出
估计。
由题意可知:W1=0.7,W2=0.3, f1=0.12, f2 =0.15; p1=70.59%,

p2=40%;由1.α=95%可得zα=1.96。

2


总体成数P的点估计为:
Pp
W=0.7×70.59%+0.3×40%=61.41%。


=
p

.
st
=∑
ii
根据公式 4-26并以各层样本方差
nin
.
i
1
pq代替各层方差
NNi.
i
1
PQ,可估计

ii
ii


抽样标准误为:

n


se() =
i
pq

pst
Σii


iH
=
211iifWn.()
n.1

ii


=
2 2(1 0.12) 0.7 85 (1 0.15) 0.3 45 0.7059 0.2941 0.4 0.6
85 85 1 45 45 1
.×.××××+×××..
=3.85%;
抽样极限误差为: zse( pst) =1.96×3.85% =7.55%

Δ=
α


2

由此可得,95%概率保证的总体成数的估计区间为:(61.41%-7.55%,

61.41%+7.55%)=(53.86%,68.96%)。
(三)各层样本容量ni的确定
当总的样本容量n确定时,各层样本容量ni的确定,通常有以下三种方法:

1.比例分配法
这是分层抽样最常用的分配法,即根据 nni=NNi的关系来确定ni,也即:
nW=n
(4-27)

ii

这时,分层抽样的抽样标准误公式可简化为(以总体均值估计为例):

1.f
2

SE()=ΣWS

x

st
ii


n


WS2 WS2

= ∑
nii.ΣNii
(4-28)

其中 fi
=
ni=
n
=f。

NN

i


2.最优分配法
最优分配法也叫Neyman分配法。该法除了考虑各层容量Ni大小这一因素外,
还考虑各层内在差异程度Si不同这一因素,即
NS


nn
Σiiii
(4-29)

=


i
NS



这时,分层抽样的抽样标准误公式可改为:

(ΣWS)2 ΣWS2


SE
x
niiiist=.
N
(4-30)

()

3.经济分配法
该法除了考虑Ni
和Si这两个因素外,还考虑各层个体调查费用Ci高低这一
因素,即

WS

ii


n
=
n


ΣCi
(4-31)

i
WS

ii


Ci


这时,分层抽样的抽样标准误公式可改为:

ii
WSC
2
C
WS


()

SE
x
st
=
ΣWSi

nii
i
.ΣNii
(4-32)

至于总样本容量n的确定,只要对抽样极限误差 Δ和概率保证程度1.α做出
要求,即可分别由上述三个抽样标准误公式推导出 n的计算公式。根据相应的 Wi

数据、Ci数据和Si的估计数据即可求出n。

三、整群抽样

这里仅讨论各群大小相等时的情况。

(一)总体均值 X的估计

设总体的N个个体形成R群,每群M个个体。从R群中随机抽取r群(一
般采用不重复抽样方法),共rM = n个个体构成样本。若以xij表示第i群第 j个

体的变量值,那么群均值 Xi为:

Σ(M) xij
Xi
=
j=1 (4-33)

M


总体均值 X的估计量为:

r


. ΣXi


X
=
xcs
=
i=1 (4-34)

r


与该估计量相对应的抽样标准误为:


()=1.fS2 (4-35)

SExcs
B

r


Σ(R)

其中 f
=r
为群抽样比,SB
=
221()iiXX=
.
为总体群间方差。S2B未知时要以

RB
.1

2 i=1

样本群间方差sb
=
Σ(r) (Xr
i
.
.
1
xcs
)2
来估计。

【例4-8】某总体有 5000个个体,形成 100个群,每群 50个个体。用不重
复抽样方法抽取 10个群进行调查,计算得各样本群的群均值如表 4-8所示。要
求以95%的概率保证估计总体均值。

表 4-8 各样本群的群均值

样本编号i
1 2 3 4 5 6 7 8 9 10
群均值 Xi
0.5 0.7 0.6 0.65 0.65 0.7 0.8 0.9 1.0 0.72

由题意知:R=100,r=10, f=0.1;由1.α=95%可得zα=1.96。

2

容易计算,总体均值的点估计为:

X

X. =xΣics==0.722 ;

r


样本群间方差为:

Σ(r)

0.1906

sb
=
r
.1
221()icsiXx=
.
=
9
=0.0212 。

根据公式 4-35并且以样本群间方差代替总体群间方差,可估计抽样标准误

为:

1.f
2 (1 .0.1) ×0.0212 =0.0437;se
x

() =
s
=
cs
rb
10


zsex
=0.0856

抽样极限误差为:Δ=
α
( cs) =1.96×0.0437 。

2

由此可得,95%概率保证的总体均值的估计区间为:(0.722-0.0856,

0.722+0.0856)=(0.6363,0.8077)。
(二)总体成数P的估计
设Mi1 为第i群某类变量值的个数,那么群成数Pi
为:


Pi
=MMi1 (4-36)
总体成数P的估计量为:

r


P


. i=1

Pp=
cs
=
Σi
(4-37)

r


与该估计量相对应的抽样标准误为:

SE
p
( cs
) =(1.f
)SP2
B
(4-38)

r


Σ(R)

其中 f
=r
为群抽样比,S
=
221()iiPP=

.
为总体群间方差。S未知时要以样本

PB
2PB

RB
.1

(Pp
)2

Σ(r) i
.
cs
群间方差s2
pb
=
i=1
r
.1
来估计。

【例4-9】某高校 4000名新生,形成 100个班级,每班 40名同学。用不重
复抽样方法抽取 6个班级进行眼睛视力调查,各样本班级视力不佳同学的比重分
别为 30%,30%,50%,56%,60%和 70%。要求以95%的概率保证估计全体新
生视力不佳同学的比重。

由题意知:R=100,r=6, f=0.06;由1.α=95%可得zα=1.96。

2

容易计算,全体新生视力不佳同学比重的点估计为:


r
Pi


. i=1

Pp=
cs
=
=49.33%;

r


样本群间方差为:

Σ(r)

spb
=
221()icsiPp=
.
= 0.1333 =2.67%。
r
.15


根据公式 4-38并以样本群间方差代替总体群间方差,可估计抽样标准误为:

cs
(1.
rf
)s2
pb
(1 .0.06)
6
×0.0267 =6.47%;

=

se
p
() =


抽样极限误差为: zsep
( cs) =1.96×

Δ=
α
0.0647 =12.68%

2

由此可得,95%概率保证的全体新生视力不佳同学比重的估计区间为:

(49.33%-12.68%,49.33%+12.68%)=(36.65%,62.01%)。
关于样本成数r的确定,只要把 r看成n,把R看成N,把SB
2 看成S2,那么

就完全等同于简单随机抽样的确定方法。
四、多阶段抽样
这里只讨论等群的两阶段抽样的情况。

(一)总体均值 X的估计
设总体的N个个体形成R个群,每群 M个个体。从 R群中随机不重复抽取r群,抽中的群再从 M个个体中随机不重复抽取m个个体。若以 xij表示第i群第 j

个个体的变量值,那么群均值 Xi
的估计量为:

Σ(m) xij
X. i = xi
=
j=1 (4-39)

m


总体均值 X的估计量为:

Σ(r) xi
X. =
xts
=
i=1 (4-40)

r


与该估计量相对应的抽样标准误为:

SE
x
() =
(1 .
f1)SB
2
+(1 .
f2)S22
(4-41)

ts


r
rm


2

其中 f1 =r
为第一阶段抽样比, f2 =m
为第二阶段抽样比;SB
的含义与整群抽

RM


M
2 i=1 j=1


样相同。S2 =ΣΣ((R) ( xij
.
.
1)
Xi
)2
为各群方差的平均数,未知时要以各样本群的样本

RM


m


2

ΣΣ(r) ( xij
.
xi
)
方差的平均数s22 =
i=1 j=1( .1)
来估计。

rm
考虑到无偏性,当以s22 估计S22 时,抽样标准误的估计公式变为:


fs

(1 .
)2 f
(1 .
fs)2

se
x
() =
1 b
+1 22 (4-42)

ts


r
rm


【例4-10】某高校有 25个新生班,每班 45人。现随机抽取 5个班,每班
随机抽取 9人进行英语高考成绩的调查,结果如表 4-9所示。要求以95%的概
率保证估计该校全体新生平均英语高考成绩。

表 4-9 45位同学的英语高考成绩


同学
班级
1 2 3 4 5 6 7 8 9

1 80 90 82 72 83 93 75 82 87
2 81 88 92 89 71 79 83 83 97
3 87 83 69 79 82 82 95 95 90
4 76 86 78 93 95 95 88 88 80
5 92 83 83 83 88 88 86 86 85

由题意知:R=25,r=5,M=45,m=9,f1=0.2,f2 =0.2,由 1.α=

95%可得zα=1.96。

2

由表中数据计算得:x1=82.67,x2=84.78,x3=83.78,x4=83.44,x5=
87,由此可得该校全体新生平均英语高考成绩的点估计为:

x

X. Σiits=x==84.33(分);

5

样本群间方差为:

(xx
)2
s2istb=Σ.
=
11.1815 =2.7954;

r.14

各样本群的样本方差的平均数为:

s2 =ΣΣ(xij.
xi)2
=
1915.28 =47.882。

2 rm( .1) 58

×

根据公式4-42,可估计抽样标准误为:

(1.
)2 f
)2

fs
(1.
fs

1 b
1 22

sex
() =+

ts


r
rm


(1 0.2) 2.7954 0.2 (1 0.2) 47.882
5 45
.××.×=+
=0.62(分);
抽样极限误差为:Δ=
zs()=1.96×0.62 =1.22

α
exts
(分)。

2

由此可得,95%概率保证的全校新生平均英语高考成绩的估计区间为:

(84.33-1.22,84.33+1.22)=(83.11,85.55)(分)。
(二)总体成数P的估计
设Mi1为第i群某类变量值的个数,mi1为第i群样本中某类变量值的个数,

那么群成数Pi
的估计量为:


. i1

Pp=
i
=m
(4-43)

r
总体成数P的估计量为:

. i=1

Pp=
ts
=Σ(r) pi
(4-44)

r


与该估计量相对应的抽样标准误为:

(1.
f
)S2 (1 .
f
)S2

SE
p
() =
1 PB
+2 P2 (4-45)

ts


r
rm


r


M
PQ

Σii


其中S2 =
i=1 为各群方差的平均数,未知时要以各样本群的样本方差的平p2 RM( .1)

m
pq


Σ(r) ii


均数s2
p2 = ((i) =1
1)
来估计。其他符号的含义与前面相同。

rm
.


同样,考虑到无偏性,当以s2
p2 估计SP22 时,抽样标准误的估计公式变为:

2
1(1 ) pbfsr.
+
() =

se
p
ts


f1(1 .
f2)s2
p2
rm


(4-46)

【例4-11】某总体 8000个个体分为 80群,每群 100个个体。现从中随机
抽取 8群,每群随机抽取 20个个体。经观测,各群样本中某类变量值的个数分
别为9,9,10,12,13,15,15和16,试以95%的概率保证估计总体成数。

由题意知:R=80,r=8,M=100,m=20,f1=0.1,f2 =0.2;由 1.α

=95%可得zα=1.96。

2

容易计算得:各样本群的样本成数 pi分别为0.45,0.45,0.5,0.6,0.65,

0.75,0.75和0.8,由此可得总体成数的点估计为:
Pp. =
Σpits==
0.61875 ;

8

样本群间方差为:

s2itsb=Σ( pr.
.
1
p)2
=
0.1937 7 =0.01996;
各样本群的样本方差的平均数为:


mΣ(r) pq


20

s212==
iip= (0.2475 2 0.25 +0.24 +0.2275 +0.1875×+
0.16)

×+
2

r((i) m
1) 819



=0.2299。

据公式4-46,可估计抽样标准误为:

(1.f1)s2
pb
f1(1 .f2)s2
p2se
p
() =+

ts


r
rm


= (1 0.1) 0.01996 0.1(1 0.2) 0.2299
8 152
.×.×+
=0.0486
抽样极限误差为: zse
p
ts) =1.96×0.0486

Δ=
α
( =0.0953

2

由此可得,95%概率保证的总体成数的估计区间为:(0.61875-0.0953,

0.61875+0.0953)=(0.5235,0.7141)。
五、简要总结
对于同一总体,当样本容量相同时,上述各种抽样组织形式的估计效果(抽
样标准误)是不一样的。一般地,分层抽样(只要分层标志选择得当并能合理分
层)的估计效果最好,其次为等距抽样(有关标志对称等距抽样又优于其他等距
抽样),接着是简单随机抽样,然后是多阶段取抽样,最后是整群抽样。当然,
这一顺序不是绝对的。在实践中,有时需要将几种抽样组织形式结合起来应用。

在对总体参数做出估计后,要进行准确性检查,即检查实际的抽样极限误差
是否小于事先所要求的估计精度。若实际的抽样极限误差低于事先规定的要求,
那么估计效果令人满意。否则,要修改抽样方案设计,如增大样本容量、改进抽
样组织方式等,以便降低抽样标准误。

本章小结

1.总体分布是指总体中所有个体关于某个变量(标志)的取值所形成的分布。
反映总体分布特征的指标称为总体参数,常用的有总体均值、总体成数和总体方
差;样本分布是指样本中所有个体关于某个变量(标志)的取值所形成的分布。
反映样本分布特征的指标称为样本统计量,常用的有样本均值、样本成数和样本
方差。抽样分布是指样本统计量的概率分布,它由样本统计量的所有可能取值和
与之对应的概率所组成。如果说样本分布是关于样本观测值的分布,那么抽样分
布则是关于样本统计值的分布,而样本统计值是由样本观测值计算而来的。反映
抽样分布特征的是样本统计量的数学期望与方差,具体特征取决于总体分布、样
本容量、抽样方法、抽样组织形式和估计量构造等因素。
2.在抽样中,总体参数的值是惟一但未知的,需要通过可知但非惟一的样本
统计值来估计。
3. 根据样本均值、样本成数抽样分布定理可知,正态分布是最常用、最重
要的抽样分布,是进行区间估计的重要依据。
4. 抽样中的误差可以分为随机性的抽样误差和随机性因素以外的非抽样误
差两种。由于抽样的非全面性和随机性所引起的偶然性的代表性误差,我们称之

为抽样误差。由于抽样框不够准确(与目标总体不一致)、有些观测单位的数据
无法取得、已取得的一些数据不真实等原因引起的样本观测数据非同质、或残缺、

相关文档