文档库 最新最全的文档下载
当前位置:文档库 › 抽样技术。

抽样技术。

抽样技术。
抽样技术。

抽样技术 6.28

一、名词解释

1.抽样调查技术:抽样调查技术是一门应用广泛的学科,它是以概率论和数理统计为基础,专门研究抽样理论、抽样方法及其应用的学科。

2.简单随机样本:从含有N个单元总体中,随机、独立的抽取n个单元组成样本,这种方法叫简单随机抽样。

3.等距抽样:从含有N个单元的总体中,随机地确定起点后,按照预先规定的间隔抽取n个单元组成样本,用以估计总体的方法称为等距抽样,亦称系统抽样。

4.分层随机抽样:按照总体各部分的特征,把总体划分成若干个层(或类型),然后在各层中进行简单随机抽样,借以估计总体的方法。

5.回归抽样估计:应用回归统计分析的原理进行抽样推断。

6.比估计:利用一个辅助变量对所调查的目的变量的特征值进行抽样估计的一种方法。

二、简答题

1、抽样调查方法的优点:

(1)费用较低

(2)速度快

(3)精度高,有概率保证

(4)抽样方法的灵活性

(5)应用范围广:①无限总体。②包括未来时间序列的总体。③破坏性的产品质量检验。

2、总体与样本

(1)总体

①总体:我们把调查对象的全体称为总体。

②总本单元:组成总体的每个基本单位。

③标志:为说明总体单元在某一方面的特征而采用的名称即为标志。

④每个总体单元在数量标志上所观察到的数值称为单元标志值。

⑤总体特征数:总体特征数是指描述总体所有单元在某标志上数量特征的数值。

(2)样本

①样本:从全部总体单元中,按照预先规定的方法抽取一部分单元,则被抽出的这部分单元之集合称为样本,又称子样。

②样本单元:样本单元是总体单元的一部分。

3、简答随机抽样样本大小的设计,主要从以下几个方面考虑:

(1)总体变异情况。一般的说,总体各单元标志值变动越大,即总体方差越大,则需样本单元数越多;反之则少些。总体方差S2与抽样及样本单元数n的大小无关,当n愈大,S2愈接近于σ2,故S2的大小是由σ2即总体变异的大小这一客观情况决定的。

(2)调查精度要求。允许误差范围,即误差限越小,抽样估计精度越高,则要求样本单元数越多,反之则少。因而样本单元数与允许误差限成反比关系。

(3)概率保证程度。即概率保证程度越大,可靠性指标t越大,则需要的样本单元数越多,反之则少。可见,样本n与所要求的可靠性成正比关系。

此外,还有抽样方法,重复抽样或不重复抽样对样本单元数的影响。

4、制定分层抽样方案的原则

(1)调查目的要求、详细程度。

(2)总体内各部分特征和差异情况。

(3)缩小层内方差,扩大层间方差。就是说分层后,层内单元标志值愈一致愈好,各层的平均数之间差别愈大愈好。

(4)所搜集到的资料和采用的图面资料及遥感相片比例尺大小。 5、等距抽样与简单随机抽样随机抽样的比较

()()[]

wsy

y

sy n n

y ρσσ1122

-+=

有上式得到以下结论:

(1)若系统样本内相关系数ρwsy =0,则有系统抽样方差与随机抽样方差相等,即

()n y y

sy 22σσ=

(2)如果ρwsy >0,系统抽样方差大于简单随机抽样,其抽样估计精度不如随机抽样高。

(3)当

1-n 1-way

=ρ时,系统抽样方差()02=sy y σ,抽样效率达到最高。即()()012

12

=-=∑=K i i sy Y y K y σ。

说明

()

2

k

1

i =-∑=Y y i

,必然是

Y y i =,即K 个可能样本的平均数都等于总体平均数。

总之,ρwsy 越接近于0,即等距样本内两两单元间的相关性越小,则抽样误差越小;反之,ρway 越接近于1,

则抽样误差越大。而ρwsy 较小则意味着样本内的方差大,这也是为什么采用两个方向或对称等距抽样的原因所在。 6、样本单元数设计 (1)比例分配法

①各层样本单元数:

h

h h N n =n =nw N ?(h=1,2,···,L )

②总体样本单元数:()

22h h

2

2h h t w n=

E w y σ∑∑

(2)最优分配法

①各层样本单元数:

h h h h

h h h

h h

N N n =

=n N N N nN σσσσ?∑∑

②总体样本单元数:

()()

22h h 2

2

h

h

t w n=

E

w y σ∑∑

7、分层抽样与简单随机抽样的比较

()

()

2

L

1

h h h st 2

2y

Y

Y w n 1y ∑=-+=σσ

对上式做如下分析:

(1)因为()

Y Y w 2

h L

1

h h ≥-∑=,则有

()st

22y y σσ≥。表明分层抽样效率优于简单随机抽样。当Y Y

h

=时,上述

层间方差项等于0,说明分层与随机抽样效果相同。

(2)只要各层h Y 不相等,分层就有利,且层间平均数差别越大越有利。因此,在设计抽样调查方案时,要尽量扩大层间差别,缩小层内差别,这一条是分层抽样最基本、最关键的条件。

(3)上式右端第二项是层(组)间方差,通俗的说,通过分层,使层内方差减小扩大层间方差,所以在同样的样本单元数情况下,能够提高总体的抽样精度。 8、应用回归抽样估计的条件

(1)自变量与因变量之间存在着直线相关关系。

(2)总体在自变量的各个给定数值上相对应的因变量y 的分布为正态分布. (3)这些正态分布的方差相等.

(4)当自变量x=x i 时(x 为非随机变量).与之相对应的因变量y i 之间是相互独立的. 以上四个条件简称为独立、线性、正态、等方差.

(5)辅助因子的总体平均数x 也必须为已知,否则,对主要因子的总体平均数无法估计。 9、回归估计效率分析

总体回归平均数的方差为:

()

()

2

2y

2

e r 21n

n

y ρσσσ-=

=

简单随机抽样的总体平均数估计值方差为:

n 2y

2y

σσ=

比较1与2两式,在重复抽样下,抽样比相同时,由于(1-ρ2

)≤1,所以

()

2

y

r 2y σσ≤,相关系数p 值愈大,

回归抽样精度愈高。只有当p=0时,回归抽样估计效率才与简单随机抽样相同。这是因为回归抽样估计有效地利用了辅助变量x 的信息,使抽样估计精度得到提高,并且所选择的x 因子与y 相关性愈紧密,回归抽样估计愈有效。

上述分析只考虑了抽样比相同的条件,而没有考虑到回归抽样还需取得每个样本单元的数值的费用,从经济角度看.抽样比相同,则回归抽样不如简单随机。所以,在设计回归抽样时,要同时兼顾提高估计精度和降低经济费用。在一般清况,只有当回归抽样的总费用低于简单随机抽样的费用,而又可以获得同样精度时,回归抽样估计方法才有被采用的价值。

10、比估计抽样与随机抽样的比较

平均数比估计的方差为:

()

()

ρy

x 2

x 22y R 2S S R ?2S R ?S n f 1y S -+-=

而简单随机抽样的方差为:

2

2

1y y S n f S -=

欲使比估计抽样有较高效率,必须有:()

R y S S 22

y >

即应有

y

x x y y S S R S R S S ρ?2?2222-+>

不等式移项得

22y x ?S S R ?2x

S R >ρ

所以:

x

x

y x y x C C

y S x S S S R 21/2/2?==>ρ

(1)若

y C C 2>

ρ,比估计误差才优于简单随机抽样。这时的判断准则是

21

>

ρ时。 (2)若

y C C 2=

ρ,则比估计误差等于简单随机抽样误差。其判断标准是

21

=

ρ时。 (3)若

y

x C C 2<

ρ,则比估计误差大于简单随机抽样误差,其判断标准是

21

<

ρ时。

上述结论启示我们,若要想提高比估计的抽样精度,在设计方案时,要尽量找到与目的因子有密切正相关关系的辅助因子,相关系数越大越好。另一方面要使C x <2C y ,才能达到降低误差提高估计效率的目的。

三、论述题

1、影响抽样误差的因素 (1)总体的方差或标准差

总体方差σ2或标准差描述了总体单元标志值的变动程度。如果总体变动小。那么,所抽取的样本统计量与总体参数之离差也会小,再求其平均位得到的抽样误差也相应小。因而.抽样误差大小取决于总体方差的大小。应注意,总体方差的大小与样本无关。 (2)样本单元数

如果样本单元数n 愈小,那么,它对总体的代表性就愈差.这意味着抽样误差愈大。n

x σ

σ=

式表明.抽

样误差与n 成反比,例如,当n=4时,σx =0.5σ,当n=l00时,σx =0.1σ,表明n 增加了24倍.抽样误差只减少了80%。这就提醒抽样设计者,在大样本情况下,哪怕是要想把精度提高百分之几.就有可能多付出几倍甚至几十倍的调查费用。 (3)抽样方法

在其他条件(如σ2,n)相同且为有限总体情况下,不重复抽样的抽样误差小于重复抽样的.因为不重复抽样中的有限总体改正值1/n 1<-N .故抽样误差会小些。

(4)样本的组织形式

在总体方差、样本单元敷相同时.不同的样本组织形式,有不同的抽样方法,其抽样误差也不同。例如,简单随机抽样与整群抽样.前者抽样误差一般小于后者。这是因为按不同组织形式所抽取的样本,对总体的代表性是不一样的,故它们的抽样误差也就不同。 2、简答随机抽样的工作步骤 (1)确定抽样调查总体。

抽样调查目的是用样本估计总体。在调查开始前应明确划定抽样总体范围界限。如以县或乡为总体进行社会经济调查,就应首先弄清县或乡的范围,他们所辖的乡或村数。又如,对林区森林资源进行抽样调查,可利用地 形图、航空相片、林相图、森林分布图等资料,对总体面积进行区划,求出面积。当总体内(林场)有大片的农田、水地、荒山分布在内时,可事先将这些无林的面积单独区划出来,不列为抽样总体,使目标总体(林场)和抽样 总体明确,这样既可缩小总体变动,减小样本容量又能提高估计效率。

从抽样理论看,总体大小与样本单元数无关,样本单元数的大小主要决定于总体的变异,即总体变动系数的大小和可靠性及精度要求。所以总体面积不宜太小,否则经济上又不划算。简单随机抽样较适合于总体单元标志值分布均匀的情况,如果总体不是这样则应考虑其他抽样方法,或者把总体划分成若干个小总体(副总体)实施随机抽样。

(2)确定样本单元的形状与大小。

样本来自总体,总体单元与样本单元是一致的。样本单元的大小直接影响到调查成本和估计精度,要于抽样调查之前认真分析研究。

总体单元可以是自然单位,如经济调查中可以用县、乡、村、户。通常社会经济调查中的总体单元容易划分,并且能够搜集到有关总体的辅助信息。相反,在林区、山区进行自然资源抽样调查中,常常是人为的把总体在图上划分成面积大小相等的单元。

①样地的形状。用面积做抽样单元时,单元的形状有正方形、矩形、圆形和带形等。带形也称样带,在调查中应用历史悠久,容易设置,穿越不同地段代表性强。但也有周边长,边界木多,容易产生取舍误差。方形、矩形样地容易测设,周界清晰。样圆具有周界最短,边界树误差少,只测半径,不用复杂仪器,面积没有闭合差,费用低,值得推广。样本单元还有样点(角规点、成数点),样线等形状。样线多用于调查线状分布的指标,如河旁林、路旁林及农田防护林。

②样地面积的大小。总体单元问变动与单元面积大小有密切关系,在既定的总体中,变动系数大小随样地面积增大而变小,当降低到某种程度变动系数趋于稳定。

据经验,幼龄林0.02—0.04hm2,中龄林0.04~0.06hm2,成过熟林地区0.08~0.10hm2,以上是我国林区森林资源清查中常用的样地面积。至于平原农区的林木资源调查,一般不宜采用面积单元抽样。这是因为平原农区森林资源多呈零星片状、带状、团状、线状分布,农林用地交错等特点的影响较大。

(3)样地单元数的确定。

不论以什么单位做总体单元,都可以用本章第三节所述方法计算样本单元数。

(4)样本抽取:

如果进行社会经济调查,有许多信息可以从有关政府管理部门获得,如以户为单位进行农民收入调查,即可把县、乡、村的户名列单进行随机抽样。通常把编制的总体名单称为抽样框。抽样框必须包括总体全部单元,无

一遗漏或重复。当进行农业产量和森林资源调查时,编制总体抽样框就不那么容易。下面介绍在森林资源调查中的一些基本方法。

①布点。就是把确定的样本,按随机原则:从总体中抽取出来,并落实到现地,一般是用平面图或地形图,用预先设计好的网点板或透明方格纸,每个网格所代表的面积应与所用图的比例尺一致,使网格的面积与单元面积相等。总体全部网格就是抽样框,然后由1至N逐个编号,将网点板(或透明方格纸)盖在图上,用随机抽样法,抽取n个单元,把抽中的单元用针刺在图纸上,这些刺点即为单元的位置。当用航空相片调查时,可把各样点点位转刺到相片上去。

②样地定位与调查。把图上的点位落实到地面叫定位。如果样点附近在图上和现地有明显地物(如山头、测量三角点)可识别,便可用图在野外直接确定样点位置,这种方法称目视定位。在地势平缓,森林密布的地区,则采用引点法,即用仪器测量定位.这种方法准确。

其做法是首先从图上找出附近显著的地物标志,由图上量取该目标至样点的方位角口B与距离,然后根据B 角与距离从目标至样点用罗盘仪等向样点方向测设。样地调查,以确定的样点为中心,在地面设置与单元面积相同的样地。测量面积一定要准确,如用闭合导线法,一般闭合差不应超过1/200。样地调查项目记录表格,各项测定精度都按事先要求统一记载。

(5)内业统计分析及调查文件编写

外业调查完成后,要进行数据的检验。待无误后,按调查任务书规定,进行各项指标的统计分析,7最后编写调查成果说明书,各项统计表,必要时附以图或照片等。

3、等距抽样的工作步骤

对于无关标志排列的随机总体抽样框,等距抽样的实施基本上同简单随机抽样的方法步骤。但对地域分布的总体与社会调查的等距抽样却有些不同,如对大面积农作物产量调查和森林资源调查,由于总体单元间有可能在地域上相邻,标志值之间会出现某种相关,导致等距抽样估计效果降低。

(1)样本单元数的确定。用简单随机抽样公式计算。

(2)计算样本单元间距离。①两个样地之间的实际距离L;②把实地L换算成所用地图上的点间距D。

(3)制作网点板或透明方格纸。按计算出的D 值制作抽样布点用的网点板(一般有备好的各种规格网点板可选用)。将网点板覆盖在图上,用针将网格交叉点刺于图纸上,即确定了各样本单元在图上的中心位置,至此布点完成。

(4)定位与调查。样点布在图上后,找出距地面显著地物标志最近的一个样点,从图上量测地物标志至该点的方位角口和距离,由地物标引点连测。当G 点定位后,则以G 点为起点,向两个垂直方向,依次量测L ,依此类推就可确定全部样点位置,由于网点板的随机性最终获得的n ,可能与预定的样本单元数略有出入。定位时,也可以采用GPS 定位,确定样点位置。其样点确定后,以规定的单元面积大小,设置样地。在样地上进行调查记载。当样地面积跨越总体边界外时,应按预先调查技术规定处理。 4、防止周期性变动影响的方法

(1)注意线性地物的走向,旋转布点用的网点膜片。利用地形图进行地理区域抽样,首先了解总体内山脉、河流、农田林网、道路等的走向,为避免样本分布与上述线性地物一致。当利用网点膜片在地形图上抽取样本时,发现样本分布有周期性后,这时可将布点用的网点膜片适当旋转一个角度,另行抽取样本。

(2)两个方向等距抽样。在地域上用一个方向等距抽样不利于防止周期性影响,应在两个垂直方向等距抽样,即是两个垂直方向的等距抽样。

(3)采用多个随机起点。将样本单元n 分成若干组,即n 1=n 2=···=n m =n/m ,m 为随机起点个数。用n m 作为单独的等距样本单元数,按

m

n A L /100 计算等点间距。从总体中随机抽取m 个起点,配置m 组等距样本。所

抽取的样本在总体中分布规律不明显,可以防止线性地物的影响。

(4)采用对称等距抽样方法。前面提到,随机起点确定等距样本具有良好的性质,它符合等概原则。但是,在总体单元标志值呈现线性变动趋势,尤其是总体抽样框按有关标志值排队的情况下,这种方法存在一个严重弊端。如前面举的例子,按粮食亩产量排队和按学生入学成绩排队,这里线性变动趋势就相当明显。在这种情况下,由随机起点抽取的样本,在估计总体特征数时,难免就会出现偏高或偏低的系统性偏差。

(5)采用等距抽样后分层估计方法。当等距样本抽取后,发现有某种周期性时,可按照样本单元值分层估计。分层估计各相同类型的样本平均数,就会有效地减少偏差。但是采用分层估计方法,必须确知该层的总单元数才行,若是地理区域的抽样,必须具备相应的图面资料和航空相片才能实施。

抽样技术课后习题参考答案金勇进

第二章习题 2.1判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少? 解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±1.96*41308.19] 即为(394035.95,555964.05) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1*96.1≤- 即n ≥862

欲使相对误差限不超过10%,则样本量至少应为862 2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2 ∧ ∧ ±P V Z P E α 代入数据计算得:该区间为[0.2843,0.4157] 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240 20 120 估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n 根据表中数据计算得:5.14420120 1 ==∑=i i y y ∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2 y V z α ±即是:[132.544 ,156.456] 故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。 2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到 y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的 置信区间。 解析:由题意知:y =1120 1429.0350 50 n === N f 225600S =?160=s

《抽样技术》第四版习题答案

第2章 2.1 解:()1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为1~64的这些单元中每一个单元被抽到的概率都是 1 100 。 ()2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2 100 ,而尚未被抽中的编号为36~63的每个单元的入样概率都是 1100 。 ()3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~ 21 000中的每个单元的入样概率都是 1 1000 ,所以这种抽样是等概率的。 2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 _ y E y y -= 近似服从标准正态分布, _ Y 的195%α-=的置信区 间为y z y z y y α α??-+=-+? ?。

而()2 1f V y S n -= 中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间 为,y y ?? -+??? ? 。 由题意知道,_ 2 9.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _ 21130050000 ()2060.6825300 f v y s n --= =?=。将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192????。 下一步计算样本量。绝对误差限d 和相对误差限r 的关系为_ d r Y =。 根据置信区间的求解方法可知 _ ___ 11P y Y r Y P αα? ???-≤≥-?≤≥-???? 根据正态分布的分位数可以知道 1P Z αα??? ≤≥-???? ,所以()2_2r Y V y z α?? ?= ??? 。也就是2 _2 _222 /221111 rY rY S n N z S n N z αα???????? ??? ?? ???-=?=+ ? ????? ?? ???? 。 把_ 2 9.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。所以样本量至少为862。 2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -= --, 在大样本的条件下近 似服从标准正态分布。在本题中,样本量足够大,从而可得P 的195%α-= 的置信区间为 p z p z αα?-+?。 而这里的() V p 是未知的,我们使用它的估计值

抽样技术简答题及答案

抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响 抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某 些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度 的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法, 如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误 差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以 控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果? 答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量 之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(2 22YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θθ )?(SE =? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(222YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

抽样技术 概念

目录第一章预备知识 第二章基本概念 第三章简单随机抽样 第四章分层随机抽样 第五章不等概率抽样 第六章多阶段抽样 第七章整群抽样 第八章系统抽样 第九章非概率抽样

第一章预备知识 作为抽样技术的基础知识或预备知识,本章简要地介绍调查原理、排列组合、概率统计等方面的有关知识。 一、调查概论 调查的重要性:有利于制定政策、投资决策、科学研究、机构管理以及司法实践等;与此同时,许多学科的进步和发展也同样离不开调查。 (一)(一)调查本质上是一种测量活动 测量活动具有6个要素:测量主体、测量客体、测量对象、测量法则、测量工具、测量结果(数字/符号)。 测量得到的数据大体分为三种类型:分类型数据、顺序型数据以及数值型数据。 测量的方法分为:直接测量和间接测量。 (二)(二)真值、测量值与误差 误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中 。根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。 误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中。 根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。 根据误差的性质分类:系统误差、随机误差和粗大误差。 根据误差的计量尺度分类:绝对误差和相对误差。 绝对误差δ、(调查)估计值x以及真实值μ之间的关系:δ=x-μ。 相对误差r、绝对误差δ以及真实值μ之间的关系:r=δ/μ。 实际常用的真值分类:理论真值、约定真值以及相对真值。 实际常用的测量值分类:单次测量值、算术平均值、加权平均值、中位数和众数。 (三)(三)信度、效度与精度 信度表示测量结果中的随机误差大小的程度。 信度的表示方法:测量值的方差(或标准差)或者样本平均数的方差(或标准差)。 衡量信度的三种方法:再测信度、复本信度和折半信度。 衡量信度的三种方法;再测信度、复本信度和折半信度。 效度表示测量结果中的系统误差大小的程度,是测量结果的“有效性” 的反映。 效度分类:内容效度、准则效度和结构效度。 效度含义:(1)测量的特征即为研究的目标特征;(2)该特征被准确地测量。 效度的表示方法:B(x)=|x-μ|或者B(E x)=|E x-μ|。 精度是信度与效度的综合,但它还与信度与效度之外的因素有关。 精度的表示方法:均方误差MSE(x)=V(x)+ () 2 B Ex u - 效度的表示方法: μ - =x x B) (或者μ - =x E x E B) (。 精度表示信度与效度的综合,但它还与信度与效度之外的因素有关。 精度的表示方法:均方误差 2 ()()() MSE x V x B Ex =+ 信度、效度与精度之间的关系:对于测量或调查来说,信度高的效度未必高,反过来效度高的信度未必高,但精度高的信度和效度肯定高。 二、排列组合 (一)(一)两条基本原理 加法原理和乘法原理。

抽样技术试题

第四章抽样技术概述 班级:姓名:成绩 一、填空题:(21分) 1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。 2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。 3、抽样调查是以()数据推断的()数据。 4、抽样调查产生的(),可以计算并控制, 5、从全及总体中抽取样本单位有()和()两种方法。 6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。 7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。 8、影响抽样误差的主要因素有()、()、()、()。 9、利用样本统计量估计总体参数,通常运用()和()两种方法。 10、点估计是直接用()估计总体参数的推断方法。点

估计不考虑()及()。 11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。 12、影响样本容量大小的因素主要有五种:()、()、()、()、()。 13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。我们称这一区间为()。 14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。若误差范围扩大一倍,则抽样单位数为原来的()。 二、单项选择题:(14分) 1、随机抽样的基本要求是严格遵守() A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。 2、抽样调查的主要目的是() A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。 3、在抽样调查中() A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、

什么是抽样抽样的基本术语及其含义是什么

24什么是抽样?抽样的基本术语及其含义是什么? 24(什么是抽样,抽样的基本术语及其含义是什么, 答:前一问见名词简释。抽样的常用基本术语有: 1(总体。它是构成事物的所有元素、也就是最基本单位的集合。 (样本。它是从总体中按照一定方式抽取出的一部分元素的集合。一个样本是总体的 2 一个子集,一个总体中可以抽取出若干个不同的样本。 3(抽样元素。它指的是构成总体的每一个最基本单位,也称“抽样分子”或“个体”。社会调查研究中最常用的抽样元素是单个的人,但也可以是家庭、学校、企业、商店等。 4(抽样单位。它是一次直接的抽样所使用的基本单位。抽样单位与抽样元素有时是同一的,有时又是不同的。 5(抽样框。它又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。 6(参数值。它也称为总体值,是关于总体中某一变量的综合描述,或者总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是某一变量的平均值。 7(统计值。它也称为样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。 8(抽样误差。它是用样本统计值去估计总体参数值时所出现的误差。这种误差是因为抽样本身的特点而引起的。由于无论采取什么样的抽样方式,所抽取的样本

有多大,都无法涵盖总体,所以抽样误差是不可避免的。但是,抽样误差的大小是可以在样本设计中事先进行控制的。 25(在社会调查中,如何确定样本规模, 答:具体每一个社会调查研究究竟应当选择多大规模的样本,主要取决于以下几点: (1)总体规模:根据抽样原理,样本规模与总体规模越接近,样本值与总体值就越一致,抽样误差就越小,样本的代表性也越强。但是当总体规模大到一定程度以后,样本规模的加大就不是那么必要了。因此,对于10 000个单位以下的总体来说,样本规模应尽可能大;而对于那些超大型的总体,则可以按照一两万个单位的总体规模来确定样本规模,以避免不必要的浪费。 (2)抽样的精确性:从理论上说,样本的精确度越高越好,但相应的样本规模也要越来越大,这就意味着调查者的时间和人财物力的消耗也要增加好几倍。而对于大多数社会调查研究来说,实际上并不要求太高的精确度。因此,调查者应当根据必要性和可能性,适当地确定样本精确度,决不能因一味追求精确度的提高而拼命扩大样本规模,否则将导致巨大的浪费。 (3)总体的异质性程度:要达到同样的精确度,在同质性较高的总体中抽样时,样本规模可以小一些;在异质性较高的总体中,样本规模则应该大一些。为了提高了样本反映总体的精确度,人们通常用分类抽样的方法将总体划分为不同的类别或层次,让这些不同类别或层次在样本中都有代表,并使得抽样误差中基本不存在类与类之间的误差成分,而只存在类内各单位之间的误差成分,其效果相当于缩小了总体的异质性程度和单位分布的不均匀状态。 (4)调查者所拥有的经费、人力、物力和时间:尽管从样本的代表性、抽样的精确性考虑,样本规模应尽可能大,但一般调查的经费、人力、物力和时间总是有限

抽样技术重点复习概念

调查:通过使用明确的概念、方法和程序,依据专门设计的调查方案知道的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。 抽样调查:是调查应用最常见的模式,是一种非全面的调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。这是广义的抽样调查的概念 抽样调查步骤:调查目标确定、抽样框选择、抽样方案设计、问卷设计、数据收集、数据编码和录入、审核与插补、参数估计、数据分析和调查结果的表述、数据分布、撰写调查报告 简单随机抽样:也称纯随机抽样,是从抽样框内的N个抽样单元中随机的、一个一个的抽取n个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率都想等,这n个被抽中的单元就构成了简单随机样本。简单随机样本也可以一次从总体(抽样框)中同时抽出,这时全部可能样本中的每一个样本被抽中的概率也需要相等。 分层抽样:是将抽样单元按某种特征或某种规划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。 分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随即抽样,所得的样本称为分层随即样本。 整群抽样:将总体中的若干个基本单元合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有基本单元全部实施调查,这样的抽样方法称为整群抽样。 多阶段抽样:采用类似整群抽样的方法,首先抽取群,但不是调查群内的所有基本单元,而是再进一步抽样,从选中的群中抽取出若干个基本单元进行调查,因为取得这些接受调查的基本单元需要两个步骤,所以将这种抽样方式成为两阶段抽样。这里,群是初级抽样单元,第二阶段抽取的是基本抽样单元。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。 系统抽样:将总体中的所有单元(抽样单元)按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按事先规定好的规则确定其他样本单元,这种抽样方法称为系统抽样。 简单估计:在没有总体其他相关辅助变量信息可以利用的情况下,用样本特征直接估计总体特征,且样本特征与预估的总体特征除了写法之分外,完全同形同构,简单易记,因此有简单线性估计的名称,简称为简单估计。 比率估计:设对有两个调查变量Y 和X 的总体进行简单随机抽样,分别以y,x表示样本总值,以y,x表示样本均值,以μ// R y x y x ==为样本比率,用 μR作为总体比率R的估计称为的比率估计 回归估计:在简单随机抽样下,总体均值和总体总值Y的回归估计量定义为: ()() tr y y X x y x X ββ =+-=-- μ lr lr Y N y =其中Y,X分别为调查变量、辅助变量的样本均值,X是辅助变量的总体均值,β称为回归系数。 不等概抽样:如果总体中每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称为不等概率随机抽样,简称不等概率抽样。 非抽样误差:除抽样误差以外的,由于各种原因引起的误差。 非抽样误差的分类:抽样框误差(由不完善的抽样框引起的误差);无回答误差(由于种种原因没有从被调查单元获得调查结果,造成调查数据的缺失);计量误差(所获得的调查数据与其真值之间不一致造成的误差)

抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( )关系

本章提出了抽样的基本概念和基本术语.doc

第四章抽样讲课稿 本章提出了抽样的基本概念和基本术语,阐释了抽样在社会调查研究中的作用,介绍了不同种类的抽样方法,特别说明了每一种方法的适用范围和操作程序,并对它们做了简要评价。同时,为了更好地应用抽样方法,还简要介绍了样本规模和抽样误差问题。其中最重要的就是要联系实际认识和掌握各种抽样方法。 一、抽样的概念和基本术语 当今社会最主要和最常用的调查类型是抽样调查,它的前提条件就是抽样。因此,抽样是在许多社会调查研究的准备阶段必须完成的一项重要工作。 (一)抽样的概念 抽样指的是从组成某个总体的所有元素、也就是所有最基本单位中,按照一定的方式选择或抽取一部分元素的过程和方法,或者说是从总体中按照一定方式选择或抽取样本的过程和方法。 抽样存在的必要性缘于总体本身所具有的异质性。如果某个总体中的每一个成员在所有方面都相同,即具有百分之百的同质性,那么抽样也就没有必要了。 抽样存在的合理性是由辩证唯物主义个别与一般的理论和建立在概率论基础上的大数定律和中心极限定律决定的。这些理论与定律证明,尽管总体所包含的每一个个体都不能完全地反映总体的性质和特征,却都具有不同程度的总体的性质和特征的因素,所以一定数量个体的因素的集合,就可以等同或接近总体的性质和特征。 在社会调查研究中,抽样主要解决的是调查对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。关于抽样的作用,有两个相关的问题需要特别明确:第一,抽样和抽样调查不能混为一谈。抽样只是抽样调查的前提和一部分,只解决抽样调查过程中的选取调查对象这一个问题,抽样调查的其它所有问题都是靠另外的方法来解决的。 第二,抽样只是抽取样本的方法,而不是调查方法或者说资料收集方法。 (二)抽样的基本术语和抽样的基本程序 1.基本术语 在抽样中,有一些常用的基本术语: (1)总体。它是构成事物的所有元素、也就是最基本单位的集合。 (2)样本。它是从总体中按照一定方式抽取出的一部分元素的集合。 (3)抽样元素。它指的是构成总体的每一个最基本单位,也称“抽样分子”或“个体”。 (4)抽样单位。它是一次直接的抽样所使用的基本单位。抽样单位与抽样元素有时是同一的,有时又是不同的。 (5)抽样框。它又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。 (6)参数值。它也称为总体值,是关于总体中某一变量的综合描述,或者总体中所有元素的某种特征的综合数量表现。在统计中最常见的参数值是某一变量的平均值。 (7)统计值。它也称为样本值,是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。 (8)抽样误差。它是用样本统计值去估计总体参数值时所出现的误差 2.基本程序 虽然不同的抽样方法具有不同的操作要求,但它们通常都要经历这样几个步骤:1.界定总体

《抽样技术》第四版习题答案

第2章 解:这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。 这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。 解: 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大样本的条件下,近似服从标准正态分布,的的置信区间为。 而中总体的方差是未知的,用样本方差来代替,置信区间为。 由题意知道,,而且样本量为,代入可以求得 。将它们代入上面的式子可得该市居民日用电量的95%置信区间为。 下一步计算样本量。绝对误差限和相对误差限的关系为。 根据置信区间的求解方法可知 根据正态分布的分位数可以知道,所以。也就是。 把代入上式可得,。所以样本量至少为862。 解:总体中参加培训班的比例为,那么这次简单随机抽样得到的的估计值的方差,利用中心极限定理可得在大样本的条件下近似服从标准正态分布。在本题中,样本量足够大,从而可得的的置信区间为。

而这里的是未知的,我们使用它的估计值。所以总体比例的的置信区间可以写为,将代入可得置信区间为。 解:利用得到的样本,计算得到样本均值为,从而估计小区的平均文化支出为144.5元。总体均值的的置信区间为,用来估计样本均值的方差。 计算得到,则,,代入数值后计算可得总体均值的95%的置信区间为。 解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量的估计值为(吨)。 总体总值估计值的方差为,总体总值的的置信区间为,把 代入,可得粮食总产量的的置信区间为。 解:首先计算简单随机抽样条件下所需要的样本量,把带入公式,最后可得。 如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为。 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为。利用去年的化肥总产量,今年的化肥总产量的估计值为吨。 解:本题中,简单估计量的方差的估计值为=37.17。 利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。 文化支出的比率估计量为,通过计算得到,而,则,文化支出的比率估计量的值为(元)。 现在考虑比率估计量的方差,在样本量较大的条件下,,通过计算可以得到两个变量的样本方差为,之间的相关系数的估计值为,代入上面的公式,可以得到比率估计量的方差的估计值为。这个数值比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的的置信区间为,把具体的数值代入可得置信区间为。 接下来比较比估计和简单估计的效率,,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。 解:利用简单估计量可得,样本方差为,,样本均值的方差估计值为。 利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。 回归估计量的精度最高的回归系数的估计值为。现在可以得到肉牛现重量的回归估计量为,代入数值可以得到。 回归估计量的方差为,方差的估计值为,代入相应的数值,,显然有。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。 第3章 3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对

《抽样技术复习题》

《抽样技术》期末复习 1、设计效应(Deff ) 答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y) =,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差。设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。如果deff < 1,则所考虑的抽样设计比简单随机抽样的效率高;反之,如果deff > 1,则所考虑的抽样设计比比简单随机抽样的效率低。 deff 对复杂抽样时确定样本量有很大作用,在一定精度条件下,简单随机抽样所需的样本量n '比较容易得到,如果可以估计复杂抽样的deff ,那么复杂抽样所需的样本量为: n = n deff '?。 2、概率抽样 答:概率抽样也称随机抽样。概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。 具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。(2)每个单元被抽中的概率是已知的,或是可以计算出来的。(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关。 概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目。 因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本。 3、非抽样误差 答:非抽样误差是指除了抽样误差以外的,由于各种原因引起的误差。同抽样误差相

抽样检验的基本概念与分类(doc 12页)(完美版)

抽样与检验 一、抽样检验基本概念 1.在质量管理中,一般有来料检验、过程检验、成品检验、出货检验四部分,每一部分中都会有抽样计划、允许水准、具体的抽样方式、统计分析等工作。 2.基本概念 (1)批 各种产品,凡是具有相同的来源,且在相同的条件下生产所得到一群相同规格的产品,可称为一个批,这样的批也可给予一个名字叫“制造批”。一个制造批中的质量变异具有一个分布,在抽样时应尽可能的使检验批的质量接近实际值,这样才可使抽验的结果正确,因此一批可能根据需要可以区分为几个检验批,但必须注意避免将几个批合并为一个检验批。 (2)检验批 在统计学中,可以称为母体或群体。 就是在各种批中,被选定用来做抽样检验的批,该批是根椐其整个批中量的大小,照抽样计划,抽出“小”批加以检验的一个群体。通常检验批要根据允许水准来判定这个检验批是否允收。 (3)批量 是指每个检验批内产品的单位数据,在统计学中也可称为“母体数”,通常以“N”表示。 (4)样本

是指从检验批中所抽出的以一个以上单位组成的产品,样本中的各个样品均须随机,而且不考虑它的品质的好坏。样本中所含的产品单位的数目称为“样本数”或“样本大小”,通常以“n”表示,它一定小于等批量数“N”。 (5)抽样检验 从双方约定的检验批中,根据批量大小,抽出不同数量的样本。将该样本以事先确定的检验方法加以检验,并将检验的结果与预先确定的要求或“品质标准”比较,以决定该批是否合格。在计数值中,是将样本中不良品的个数所抽样计划中允收不良品的个数比较,以判定该检验批是否允收。在计量值中,是将各样品检验结果加以统计分析,以平均值、离散度、综合指数的判定基准比较,以决定该检验批是否允收。 (6)合格判定数 判定一批产品是否合格或不合格的基准不良个数称为合格判定数,通常以“C”(或AC)表示。 (7)缺陷 产品单位的品质特性不合乎双方所规定的规格、图样、说明或要求等称为缺陷,通常用“d”表示。如若是买卖的关系,缺点一般可分为:(a)严重缺陷(Critical defect),凡有危及产品的使用或携带安全,或使产品的重要功能失效的缺陷; (b)主要缺陷(Major defect),凡使产品使用性能不能达到所期望之目的,或显著减低其实用性能的缺陷; (c)次要缺陷(Minor defect),实际上不影响产品的使用功能或

抽样技术练习题及答案

1.请列举一些你所了解的以及被接受的抽样调查。 2.抽样调查基础理论及其意义; 3.抽样调查的特点。 4.样本可能数目及其意义; 5.影响抽样误差的因素; 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 1)计算样本均值y与样本方差s2; 2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3)根据上述样本数据,如何估计v(y)? 4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

一判断题 1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。 2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。 3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。 5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。 8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。 9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。 10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。 11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。 12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。 13 抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。 14 样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。 15 精度和费用也是评价抽样设计方案优劣的两条准则。 16 简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。 17 当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。 18 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128 157 506 455 127 789 867 954 938 622 19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下:556 485 098 260 485 20 在实际工作中,如果抽样比接近于1时,人们会采用全面调查 二填空题 1 抽样比是指( ),用( )表示。 2 偏倚为零的估计量,满足( ),称为( )。 3 简单随机抽样的抽样误差等于( )。 4 简单随机抽样时重复抽样的抽样误差等于( ) 5 抽样时某一总体单元在第m次被选入样本的概率是( ) 6 简单随机抽样时总体单元被选入样本的概率是( ) 7 某一样本被选中概率是( )。 8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来,随着观察次数( )的增大,( )影响将互相抵消而使规律性有稳定的性质。 9 中心极限定理证明了当( )增大时,观察值的均值将趋向于服从( ),即不论( )服从什么分布,在观察值足够多时其均值就趋向( )分布。 10 抽样调查的核心是估计问题,选择估计量的标准是( ) ( ) ( )。 三简答题

第三节 抽样技术在控制测试中的运用

第三节抽样技术在控制测试中的运用 一、抽样基本概念在控制测试中的运用 在控制测试中,审计人员主要关注抽样风险中的信赖过度风险。可接受的信赖过度风险与样本规模成反比。审计人员愿意接受的信赖过度风险越低,样本规模通常越大。审计人员愿意接受的信赖过度风险越高,样本规模越小。控制测试中选取的样本旨在提供关于控制运行有效性的证据。由于控制测试是控制是否有效运行的主要证据来源,因此,可接受的信赖过度风险应确定在相对较低的水平上。通常,相对较低的水平在数量上是指5%~10%的信赖过度风险。在实务中,一般的测试是将信赖过度风险确定为10%。 在控制测试中,可容忍误差是指可容忍偏差率。可容忍偏差率是指审计人员在不改变其计划评估的控制有效性,从而不改变其计划评估的重大错报风险水平的前提下,愿意接受的对于设定控制的最大偏差率。在确定可容忍偏差率时,审计人员应考虑计划评估的控制有效性。计划评估的控制有效性越低,审计人员确定的可容忍偏差率通常越高,所需的样本规模就越小。一个很高的可容忍偏差率通常意味着,控制的运行不会大大降低相关实质性程序的程度。在这种情况下,由于审计人员预期控制运行的有效性很低,特定的控制测试可能不需进行。反之,如果审计人员在评估认定层次重大错报风险时预期控制的运行是有效的,审计人员必须实施控制测试。换言之,审计人员在风险评估时越依赖控制运行的有效性,确定的可容忍偏差率越低,进行控制测试的范围越大,因而样本规模增加。 在实务中,审计人员通常认为,当偏差率为3%~7%时,控制有效性的估计水平较高;可容忍偏差率最高为20%,偏差率超过20%时,由于估计控制运行无效,审计人员不需进行控制测试。当估计控制运行有效时,如果审计人员确定的可容忍偏差率较高就被认为不恰当。图表9-4 列示了可容忍偏差率与计划评估的控制有效性之间的关系。 图表9-4 可容忍偏差率和计划评估的控制有效性之间的关系

相关文档
相关文档 最新文档