文档库 最新最全的文档下载
当前位置:文档库 › 第六章 参数值的估计

第六章 参数值的估计

第六章 参数值的估计
第六章 参数值的估计

第六章 参数值的估计 第一节 参数估计的一般问题

一、估计量与估计值

参数估计就是用样本统计量去估计总体参数,如用X 估计μ,用S2估计2

σ,用p 估计π等。总体参数可以笼统地用一个符号θ表示。参数估计中,用来估计

总体参数的统计量的名称,称为估计量,用θ

表示,如样本均值、样本比例等就是估计量。用来估计总体参数时计算出来的估计量的具体数值,叫做估计值。 二、点估计与区间估计——参数估计的两种方法 1、点估计

用样本估计量θ

的值直接作为总体参数θ的估计量值。 2、区间估计

它是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。这个区间通常是由样本统计量加减抽样误差而得到。以样本均值的区间估计来说明区间估计原理:

根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值

,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在μ的两侧任何一个标准误差范围内的概率(根据已知的μ,σ计算)。但实际估计时,μ是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。例如:约有95%的样本均值会落在距μ的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括μ。

在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:

α称为显著性水平,

表示用置信区间估计的不可靠的概率,1-为置信水平。 如何解释置信区间:如用95%的置信水平得到某班学生考试成绩的置信区间为(60,80),即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩,(60,80)这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。

三、评价点估计量的标准

1、无偏性

估计量抽样分布的数学期望等于被估计的总体参数。 θ

的抽样分布

E(θ )=θ θ E(θ

) 无偏估计量 有偏估计量

已知E(X )=μ,E(p)=π,E(s 2)=2σ,所以X ,p ,s 2分别是总体均值μ,总体比例π,总体方差2σ的无偏估计量。

2、有效性

同一总体参数的两个无偏点估计量,标准差越小的估计量越有效。

的抽样分布

的抽样分布

θ 1θ 的标准差小,比2θ

更有效 3、一致性

随着样本量的增大,点估计值越来越接近总体参数。以样本均值为例,抽样

分布时,样本均之抽样分布的标准误差SE=σ,样本量越大,SE 越小。当n 无限大时,样本均值称为总体均值的一致估计量。

第二节 一个总体参数的区间估计

一、总体均值的的区间估计 1、大样本的估计方法

当总体服从正态分布且方差已知,或者总体不是正态分布但为大样本时,样

本均值的抽样分布均为正态分布,其数学期望值等于总体均值,方差为2

σ/n 。

样本均值经过标准化以后的随即变量服从标准正态分布,

X ~N(0,1) 对于μ的双侧置信区间,有P(Z <Z /2α)=1-α或P(-Z /2α<Z <Z /2α)=1-α,将统计量Z 代入上式,得:P(-Z /2α

X <Z /2α)=1-α, 经整理有P(X -/2

z

α<μ<X +/2

z

α)=1-α

总体均值所在(1-α)置信水平下的置信区间为:X ±/2

z

α(公式1),

/2

z α

为标准正态分布右侧面积为α/2的z 值,/2

z α是估计总体均值时的允许

误差。

α/ 2 1-α=95% α/2

-/2z α 0 /2z α

如果总体为正态分布但方差未知,或总体不服从正态分布,只要大样本条件

下,公式2中的总体标准差可用样本标准差代替,X ±/2

z

α 公式2

例1:一家食品厂每天产量8000克左右。每袋产品规定重量100克,企业质检部门为对产品质量进行监测,经常抽检分析每袋重量是否达标。先从某天生产的一批产品中随机抽取25袋,测得25袋平均重量为105.36克。已知产品重量分布呈正态分布,总体标准差为10克。试估计该批产品平均重量在95%的置信水平下的置信区间。

解:已知σ=10,n=25,置信水平1-α=95%,查标准正态分布表得

/2

z α=1.96。

X ±/2

z

α=105.36±1.96×

10/=105.36±3.92

即该批食品平均重量的95%的置信区间为(101.44,109.28)。

例2:一家保险公司收集到由36个投保人组成的随机样本,36人的平均年龄为39.5岁,标准差为7.77岁。试确立该公司投保人平均年龄90%的置信区间。 解:已知,n=36,s=7.77,1-α=90%,/2

z α=1.645。由于总体方差未知,但为大

样本,可用样本方差代替总体方差。

X ±/2

z

α=39.5±1.645×

±2.13

投保人平均年龄的90%的置信区间为(37.37,41.63)。 2、小样本的估计方法

在总体为正态分布的情况下,抽取到小样本时,如果方差已知可以按照公1构造;如果方差未知,则样本均值经过标准化处理后的随机变量不再服从Z 分布,而是服从自由度为n-1的t 分布,

用s 2代替2σ,

X 需要用t 分布来构造总体均值的置信区间。

t 分布是类似于正态分布的一种对称分布,通常其比正态分布平坦和分散,一个特定的t 分布依赖于自由度。随着自由度的增大,t 分布逐渐趋于正态分布。

标准正态分布

自由度为20的t 分布 自由度为10的t 分布 根据t 分布建立的总体均值在1-α置信水平下的置信区间为:

X ±/2t α3

t α/2是自由度为n-1时,t 分布中右面积为α/2时的t 值,可通过查t 分布表得。 例3:已知某种灯泡的使用寿命服从正态分布,先从一批灯泡中随机挑出16只,测得平均使用寿命为1490小时,样本标准差为24.77小时,试确定该批灯泡平均寿命95%的置信区间。

解:根据α=0.05查表得,t α/2 (n-1)= t α/2 (15)=2.131。

X ±/2t α±=1490±13.2

该灯泡平均寿命的95%的置信区间为(1476.8,1503.2)。

不同情况下总体均值的区间估计:

总体分布 样本量

方差已知

方差未知

正态分布

大样本(n≥30)

X ±/2

z α

X ±/2

z α

小样本(n <30)

X ± /2z αX ±/2t α非正态分布 大样本(n≥30)

X ±/2

z α

X ±/2

z α

二、总体比例(二项总体参数P )的区间估计

根据中心极限定理,当大样本时,样本比例分布可近似看作正态分布,p 的数学期望等于总体比例,E(p)=π,p 的方差等于σ2p =π(1-π)/n 。p 经过标准化的随机变量服从标准正态分布,z=

~N(0,1)

可得大样本总体比例在1-α置信水平下的区间估计公式:

P =p

±/2z α 公式4

p

是总体比例P 的点估计,/2

z α 例4:某城市希望了解下岗职工中女性的比例,随机抽取100个下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。 解:已知n=100,z α/2=1.96,样本女性比例=65%,

P =p

±/2

z α±±9.35% 该城市下岗职工中女性比例的95%的置信区间是(55.65%,74.35%)。

虽然样本比例p 随着样本量增大而近似服从正态分布,但n 应该多大才能使其呈正态分布呢?这与样本比例p 的取值有关,当p 接近0.5时,用较小的样本就可使其服从正态,而当p 接近0或1时,则需要大样本。 三、总体方差的区间估计

样本方差服从于自由度为n-1的卡方分布,所以用卡方分布构造总体方差的置信区间。

总体方差在1-α的置信区间

2χ1-α/2 2χα/2

建立总体方差的置信区间,就是要找到一个2χ值,使其满足 P(2χ1-α/2 ≤2χ ≤2χα/2)= 1-α 由于2

χ=

2

2

(1)n s σ

-~2χ(n-1),代入上式,有2

χ

1-α/2 ≤

2

2

(1)n s σ

- ≤2

χα/2,可得总体

方差在置信水平下的置信区间为:

2

2/2

(1)n s αχ-≤2

σ≤

2

21/2

(1)n s αχ-- 公式5

例5:仍以例1为例,如不知道总体方差,抽查25袋食品的方差为93.21克。以95%的置信水平构造该厂食品重量方差的置信区间。

解:根据显著性水平α=0.05,自由度n-1=24,查卡方分布表得,2χα/2(24)=39.364,

2χ1-α/2(24)= 12.401。总体方差的置信区间为:

2493.2139.364?≤2σ≤2493.2112.401

?

该厂食品总体重量方差的95%的置信区间为(56.83,180.39)。

第二节 两个参数的区间估计

一、两个总体均值之差的区间估计 1、两个总体均值之差的估计:独立样本 (1)大样本的估计方法

如果两个总体都为正态分布,或者都不是正态分布但都是样本都是大样本(n≥30),则(1x -2x )的抽样分布服从于期望值为(μ1-μ2),方差为σ12/n 1+σ22/n 2的正态分布。两个样本之差经过标准化后服从标准正态分布。

当两个总体的方差已知,(μ1-μ2)在1-α下的置信区间为: (1x -2x )±/2

z α 公式6

当两个总体的方差未知,(μ1-μ2)在1-α下的置信区间为:

(1x -2x )±/2

z

α 公式7 例6:某地区教委想估计两所中学的学生高考英语平均成绩之差,现在两所中学独立抽取两个随机样本,见下表。确定两所中学高考英语平均分之差在95%的置信区间。

解:(1x -2x )±/2

z α±=8±2.97 两所中学高考英语平均分之差在95%的置信区间为(5.03,10.97) (2)小样本估计方法

两个样本都是小样本的情况下,为估计两个总体均值之差,需要作出以下假定:两个总体都服从正态分布;两个总体的方差相等;两个随机样本分别独立地抽自两个总体。

在上述假定下,无论样本量大小,两样本均值之差都服从正态分布,当总体方差已知时,可用公式6计算。

当两个总体方差未知但相等时,则需要用两个样本的方差来估计,需要将两个样本数据组合在一起,计算联合方差,用s

p 2表示,公式为:

s p 2

=22

112212(1)(1)2

n s n s n n -+-+-,公式8

这样,两个样本均值之差经过标准化后服从自由度为n1+n2-2的t 分布。 因此,两总体均值之差在1-α下的置信区间: (1x -2x )±/212(t n n α+-

公式9 例7:为了估计两种方法组装产品所需时间的差异,分别对两种不同组装方法各随机安排12名工人,方法1组的工人平均耗时32.5分钟,方差为15.996分钟;方法2组的工人平均耗时28.8分钟,方差为19.358分钟。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平确定两种方法组装产品所需平均时间之差的置信区间。

解:联合方差s p 2

= 22112212(1)(1)2n s n s n n -+-+-= (121)15.996(121)19.358

12122

-+-+-=17.677

根据α=0.05,自由度=12+12-2=22,查t 分布表得t α/2(22)=2.074。

(1x -2x )

±/212(t n n α+-=(32.5-28.8) ±

=3.7±3.56

两种方法组装产品所需平均时间之差的95%的置信区间为(0.14,7.26)。 2、两个总体均值之差的估计:匹配样本

两个独立样本存在潜在弊端,如例7当中如果存在样本指定不公平,则会掩盖两种方法的真实差异。对此,可以使用匹配样本,如例7可以选择12个工人先用方法一组装,再用方法二组装,这样得到匹配数据。

使用匹配数据进行估计时,大样本条件下,两个总体均值之差μd =μ1-μ2在

1-α置信水平下的置信区间:d ±/2z

α 公式10(d 表示各差值的均值;d σ表

示各差值的标准差;当总体d σ未知时则可用样本d s 表示。)

小样本公式为:d ±/2t α

公式11

例8:由10名学生组成一个随机样本,让他们分别采用AB 两套试卷进行测试,结果如下表所示:试建立两种试卷平均分数之差在95%的置信区间。

解:d =∑d i /n d =110/10=11,s d 根据自由度=9,查t 分布表得0.05/2t (9)=2.262,

d ±/2t α

=11±

±4.67,得置信区间为(6.33,15.67) 二、两个总体比例之差的区间估计

两个二项总体中抽出两个独立样本,两个样本比例之差的抽样分布呈正态分布。由于两个总体比例π1π2通常是未知的,所以用样本比例p 1、p 2来代替。因此,根据正态分布建立的两个总体比例之差在1-α下的置信区间为:

(p 1-p 2) ±/2

z

α 公式12 例9:针对某个电视节目做收视率调查,在农村随机调查400人,有32%的人收看了该节目;在城市中随机调查500人,有45%的人收看了该节目。试以95%置信水平估计城乡收视率差别的置信区间。

解:城市收视率p 1=45%,农村收视率p 2=32%。当α=0.05时,/2z α=1.96。 (p 1-p 2) ±/2

z

α=(45%-32%)±

=13%±6.32%

城乡收视率差别的95%的置信区间为(6.68%,19.32%) 三、两个总体方差比的区间估计

如相比较两总体某种特征的稳定性,须进行两总体方差比的区间估计。 两个样本方差比的抽样分布服从的是F(n 1-1,n 2-1)分布,用F 分布来构造两个总体方差比的置信区间。

总体方差比在1-α的置信区间 0 F 1-α/2 F α/2 α/2

构造两个总体方差比的置信区间,就是要找到一个F 值,使

P(F 1-α/2≤F ≤F α/2)= 1-α,F 等于两个卡方值((n-1)s 2/σ2)相除,得F= s 12σ22/s 22σ12服从F(n 1-1,n 2-1)(样本较大或者样本量相近情况下(n 1-1)/( n 2-1)可视为1)。

由此,可推导出两个总体方差比σ12/σ22在1-α下的置信区间为:

(2222

1212/21/2

//,s s s s F F αα-)公式13。F α/2和F 1-α/2分别是第一自由度n 1-1和第二自由度n 2-1的F 分布右上侧面积为α/2,1-α/2的分位数,但F 表中只给了α/2的F 值,则根据下面的关系求出F 1-α/2的值。

F 1-α/2=1/ F α/2 公式14

例10:为了研究男女学生在生活费支出上的差异,在某大学随机抽取25位男生和25名女生,得到以下结果:男生

1

x =520元,s 12=260元;女生

2

x =480,s 22=280。

试以90%的置信水平估计男女学生生活费支出方差比的置信区间。

解:n 1=25-1=24,n 2=25-1=24。查F 分布表得:F 0.05(24,24)=1.98

F 0.95(24,24)=1/1.98=0.505, (260/280)/1.98≤2

122σσ≤(260/280)/0.505

即男女生生活费支出方差比在90%的置信区间为(0.47,1.84)。

第三节 样本容量的确定

一、估计总体均值时样本量的确定

总体均值的置信区间是由样本均值和允许误差两部分组成的。另E 代表希

望的允许误差,即E=/2

z

α,推导出样本容量确定公式:n=22

/22()z E ασ公式15。

对于给定的

/2

z α和总体标准差σ,可以确定任意希望的允许误差所需样本量。如

果总体标准差未知,则可用相同或相似样本的标准差代替,也可以试调查一个样本计算标准差来代替。

样本容量和置信水平成正比,与总体方差成正比,和允许误差成反比。 例11:拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪在95%的置信区间,希望允许误差为400元,应抽取多大样本? 解:已知σ=2000,α=0.05,E=400,

n=22

/22()z E ασ= 222

1.962000400

?=96.04≈97(小数时一律进位成整数,原则是样本量更大) 二、估计总体比例时样本量的确定

在重复抽样或大量抽样下,估计总体比例时置信区间的允许误差为

/2

z

αE 表示,可推导出样本量计算公式:n=2/22()(1)

Z p p E

α-公式16 给定一个E 值(一般小于0.10)和置信水平,就可确定样本量。样本比例可以根据类似样本比例代替,可以采用试调查办法选一个初始样本计算比例。如果这些方法都无法使用,则取0.5。

例12:根据以往生产统计,某种产品的合格率约为90%,要求允许误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?

解:已知p=90%,E=5%,/2z α=1.96

n=2/22()(1)Z p p E α-=22

(1.96)0.9(10.9)

0.05-=138.3≈139

三、估计两个总体均值之差时样本量的确定

n 1=n 2=222/2122()()Z E ασσ+公式17

四、估计两个总体比例之差时样本量的确定 n 1=n 2=

[]

2/211222

()(1)(1)Z p p p p E α-+-公式18

例13:一家饮料厂想要估计顾客对一种新产品认知的广告效果。在广告前和广

告后个抽取了一个消费者随机样本,询问是否听说过该饮料。如果想以10%的允许误差和95%的置信水平来估计广告前后知道该饮料的消费者比例之差,则应分别抽去多少人?(假定两个样本容量相同) 解:已知E=10%,/2z α=1.96。由于比例未知,用0.5。 n 1=n 2=

[]

2/211222

()(1)(1)Z p p p p E

α-+-=

[]

22

(1.96)0.5(10.5)0.5(10.5)0.1

-+-≈193

第六章参数估计

113 第六章 参数估计 一、 知识点 1. 点估计的基本概念 2. 点估计的常用方法 (1) 矩估计法 ① 基本思想:以样本矩作为相应的总体矩的估计,以样本矩的函数作为相应的总 体矩的同一函数的估计。 (2) 极大似然估计法 设总体X 的分布形式已知,其中),,,(21k θθθθΛ=为未知参数,),,(21n X X X Λ为简单随机样本,相应的),,,(21n x x x Λ为它的一组观测值.极大似然估计法的步骤如下: ① 按总体X 的分布律或概率密度写出似然函数 ∏==n i i n x p x x x L 1 21);();,,,(θθΛ (离散型) ∏==n i i n x f x x x L 1 21);();,,,(θθΛ (连续型) 若有),,,(?21n x x x Λθ使得);,,,(max )?;,,,(2121θθθn n x x x L x x x L ΛΛΘ ∈=,则称这个θ?为参数θ的极大似然估计值。称统计量),,,(?21n X X X Λθ为参数θ的极大似然估计量。 ② 通常似然函数是l θ的可微函数,利用高等数学知识在k θθθ,,,21Λ可能的取值 范围内求出参数的极大似然估计k l x x x n l l ,,2,1),,,,(??21ΛΛ==θθ 将i x 换成i X 得到相应的极大似然估计量 k l X X X n l l ,,2,1),,,,(??21ΛΛ==θθ 注:当);,,,(21θn x x x L Λ不可微时,求似然函数的最大值要从定义出发。 3. 估计量的评选标准 (1) 无偏性:设),,(??21n X X X Λθθ=是参数θ的估计量,如果θθ=)?(E ,则称θ?为θ的无偏估计量。 (2) 有效性:设1?θ,2?θ是θ的两个无偏估计,如果)?()?(21θθD D ≤,则称1?θ较2 ?θ更有效。 4. 区间估计

第六章、参数估计解答

第六章、参数估计 四、计算题: 1.解:因为总体X 的概率密度 1 ,0(,)0,x f x θθθ?<

12 222 11 111() n i i n n i i i i X X n X X X X n n μσ===?==?? ? ?=-= -?? ∑∑∑ 而μ及2 σ的矩估计值就是 122111()n i i n i i x x n x x n μσ==?==?? ??=-?? ∑∑ 3.解:因为总体X 的概率分布 (,),0,1,2,! x p x e x x λ λ λ-= = 中只有一个未知参数λ,所以只需考虑总体X 的一阶原点矩 1 .! x x X E X x e x λ λ νλ∞ -===? =∑()() 用样本一阶原点矩11 1 n i i V X n == ∑作为总体一阶原点矩 1 X ν()的估计量,即有 11n i i X n λ== ∑ 由此解得λ的矩估计量 11n i i X X n λ ===∑ , 而λ的矩估计值就是 1 1n i i x x n λ ===∑ 4.解:由于总体X 服从正态分布2 N μσ(,) ,即 2 2()2(),x u f x x σ --=-∞<<+∞ 故似然函数为 2 2 2 2 1 ()21 1() 2(,)i n i i x n i x n L e μσ μσ μσ=-- =- -= ∑=∏

第六章 参数估计基础

第六章参数估计基础习题 一、是非题 1.总体率的区间估计中, 值越大,置信度越低.( ) 2.样本率的标准误越小,抽样误差越大.( ) 3.对同一样本资料来说,总体均数的置信区间宽度通常会小于医学参考值范围的宽度.() 4.置信度由99%下降到95%,置信区间估计的准确度也下降.( ) 5.在t值相同时,双侧概率正好是单侧格率的2倍.( ) 二、选择题 1.均数的标准误反映了( ). A.个体变异程度B.集中趋势的位置 C.指标的分布特征D.样本均数与总体均数的差异 E.频数分布规律 2.用于描述均数的抽样误差大小的指标是( ). A.S B.S C.CV D.R E.S2 3.抽样误差产生的原因是( ). A.观察对象不纯B.非正态分布 C.个体差异D.非分类变量资料E.随机抽样方法错误4.均数95%置信任区间主要用于(). A.估计“正常人群”某指标95%观察值所在范围 B.反映总体均数有95%的可能在某范围内

C.反映某指标的可能取值范围 D.反映某措标的观察值波动范围 E.反映95%的样本均数在此范围内 5.以下关于参数估计的说法正确的是( ). A.区间估计优于点估计B.样本含量越大,置信区间范围越大 C.样本含量越小,参数估计越精确D.对于一个参数可以获得几个估计值E.标准差大小与置信区间范围无关 三、筒答题 1.已知某地正常成年女性的平均空腹血糖值为 4.95mmol/L,标淮差为 1.03 mmol/L,某医疗机构从该地随机抽取40名正常成年女性,测得其平均空腹血糖值为5.17 mmol/L,试指出5.17 mmol/L与4.95 mmol/L不同的原因是什么?应该用什么指标来表示两者间的差别? 2.样本均数的抽样分布有哪些特点? 3.t分布与Z(标准正态分布)分布相比有什么特点?

第六章参数估计

第六章 参数估计 1.填空题 (1)设总体,),(~p N B X p 未知,是来自总体),,,(21n X X X "X 的样本,则参 数p 的矩估计量是 ;最大似然估计量是 。 (2)设是来自均匀分布),,,(21n X X X ")0)(1,(>+θθθU 总体的一个样本, 则θ的矩估计量是 ;θ的最大似然估计量是 。 2.设总体X 的概率密度为 ???<<=?其它,010),(1 x x x p θθθ 其中θ为未知参数,是从总体),,(1n X X "X 中抽取的一个样本,求θ的矩估计和最大似然估计。 3.设总体X 的分布密度为 +∞<<∞?=?x e x p x ,21);(σσσ ),,,(21n X X X "是来自总体X 的样本,试求σ的矩估计和最大似然估计。 4.设总体X 的分布密度为 0, ,1 )(21221>+∞<<=??θθθθθx e x p x ),,,(21n X X X "为来自总体X 的样本,试求1θ和2θ的矩估计。 5.设总体服从对数正态分布,其分布密度为 0,0 ,2)(ln exp 21 )(22>>???????=σσσπx u x x x p ),,,(21n X X X "是来自总体X 的一个样本,试求参数μ和的最大似然估计。 2σ6.设总体X 的分布密度为 ???<≥=??θθθx x e x p x , 0,)()(),,,(21n X X X "是来自总体X 的一个样本,试求参数θ的最大似然估计。

7.填空题 (1)设总体,是它的一个样本,则当常数 ),(~2σμN X ),,,(21n X X X "=C 时,为的无偏估计。 ∑?=+?1121)(n i i i X X C 2σ(2)设总体)(~λP X ,是它的一个样本,则的一个无偏估计 量为 ),,,(21n X X X "2λ。 8.设和都是参数1?θ2?θθ的两个独立的无偏估计量,且,试求常数2 1?2?θθD D =α和β,使是21??θβθα+θ的无偏估计,且在形如的无偏估计中方差最小。 21??θβθα+9.设总体,是它的一个样本,试求的最大似然估计,是否为的有效估计? ),1(~2σN X ),,,(21n X X X "2 σ2?σ 2?σ2 σ10.设总体X 的分布密度为 ?? ???<0, 是来自X 的样本。 (1) 证明θ的一个最大似然估计量为 ),,,(21n X X X "

第六章 参数估计基础

第六章参数估计基础 一、选择题 (一)A1型 每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。 1、表示均数抽样误差大小的统计指标是() A、标准差 B、方差 C、均数标准误 D、变异系数 E、样本标准误 2、S x 表示() A、总体均数 B、样本标准误 C、总体均数离散程度 D、变量值X的离散程度 E、变量值X的可靠程度 3、标准误越大,则表示此次抽样得到的样本频率() A、系统误差越大 B、可靠程度越高 C、抽样误差越大 D、可比性越差 E、代表性越好 4、要减少抽样误差,通常的做法是() A、适当增加样本例数 B、将个体变异控制在一个范围内 C、严格挑选观察对象 D、增加抽样次数 E、减少系统误差 5、关于t分布的图形,下述哪项是错误 ..的() A、当ν趋于∞时,标准正态分布是t分布的特例 B、当ν逐渐增大,t分布逐渐逼近标准正态分布 C、ν越小,则t分布的尾部越高

D、t分布是一条以0为中心左右对称的曲线 E、t分布是一簇曲线,故临界值因自由度的不同而不同 (二)A2型 每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。 1、已知某地25岁正常成年男性的平均收缩压为113.0mmHg,从该地随机抽取20名25岁正常成年男性,测得其平均收缩压为119.0mmHg。119.0mmHg与113.0mmHg不同的原因是() A、样本例数太少 B、抽样误差 C、总体均数不同 D、系统误差 E、个体差异太大 2、从上述第1题的同一个地区中再抽取20名8名正常男孩,测得其平均收缩压为90.0mmHg,标准差为9.8mmHg。90.0mmHg与113.0mmHg 不同,原因是() A、样本例数太少 B、抽样误差 C、总体均数不同 D、系统误差 E、样本均数不可比 3、用上述第2题的样本,估计该地8岁正常男孩的平均收缩压的95%的置信区间为() A、113.0±t0.05/2,19×9.8 B、90.0±1.96×9.8 C、90.0±t0.05/2,19×9.8/20 D、90.0±1.96×9.8/20 E、90.0±t0.05/2,19×9.8 (三)A3/A4型 以下提供若干案例,每个案例下设若干道题目。请根据题目

第六章 估计与假设检验

第六章 参数估计与假设检验 第一节 参数估计 一、参数估计概述 在许多实际问题中,总体被理解为我们所研究的那个统计指标,它在一定范围内取数值,而且是以一定的概率取各种数值的,从而形成一个概率分布,但是这个概率分布往往是未知的。例如为了制定绿色食品的有关规定,我们需要研究蔬菜中残留农药的分布状况,对这个分布我们知之甚少,以致它属于何种类型我们都不清楚。有时我们可以断定分布的类型,例如在农民收入调查中,根据实际经验和理论分析如概率论中的中心极限定理,我们断定收入服从正态分布,但分布中的参数取何值却是未知的。这就导致统计估计问题。统计估计问题专门研究由样本估计总体的未知分布或分布中的未知参数。直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。本节我们研究参数估计问题。本节及以后假定抽样方法为放回简单随机抽样,样本的每个分量都与总体同分布,它们之间相互独立。 二、参数估计的基本方法 (一)估计量与估计值 1.参数估计就是用样本统计量去估计总体参数 2.用来估计总体参数的统计量的名称称为估计量,如样本均值、样本比例、样本方差等都可以是一个估计量。 3.估计量的具体数值称为估计值 (二)点估计与区间估计 参数估计方法有点估计与区间估计两种方法。 1.参数估计的点估计法 (1)设总体X 的分布类型已知,但包含有未知参数θ,从总体中抽取一个简单随机样本12(,,,)n X X X ,欲利用样本提供的信息对总体未知参数θ进行估计。构造一个适当的 统计量 ?T θ=12(,,,)n X X X 作为θ的估计,称?θ为未知参数θ的点估计量(Point estimate )。当有了一个具体的样本 观察值12(,, ,)n x x x 后,将其代入估计量中就得到估计量的一个具体观察值 T 12(,,,)n x x x ,称为参数θ的一个点估计值。今后点估计量和点估计值这两个名词将不 强调它们的区别,通称为点估计,根据上下文不难知道此处的点估计究竟是点估计量还是点 估计值。 通俗地说,用样本估计量的值直接作为总体参数的估计值称为点估计。 常用的点估计量有:X μ∧=p P ∧ =2 2 2() 1 X X s n σ∧-== -∑ 2、估计的评价标准: (1)无偏性: 设?T θ=12(,,,)n X X X 是未知参数θ的一个点估计量,若?θ满足

第六章参数估计和假设检验(精)

第六章参数估计和假设检验 教学目的及要求:了解参数的点估计、区间估计的含义,掌握区间估计的几个概念,包括置信水平、置信区间、小概率事件,熟练掌握参数区间估计的计算方法,了解不同抽样组织形式下的参数估计,掌握参数估计中样本量的确定。了解假设检验的原假设和备择假设的含义,假设检验的两类错误,掌握总体均值的检验方法。 本章重点与难点:区间估计的计算与总体均值的假设检验方法。 计划课时:授课6课时;技能训练2课时。 授课特点:案例教学 第一节点估计和区间估计 一、总体参数估计概述 ?1、总体参数估计定义 ?就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。 ?2、参数估计应满足的两个条件 二、参数的点估计 ?用样本的估计量直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计 例如:根据一个抽出的随机样本计算的平均分数为80分,我们就用80分作为全班考试成绩的平均分数的一个估计值,这就是点估计。 再例如,要估计一批产品的合格率,根据抽样结果合格率为96%,将96%直接作为这批产品合格率的估计值,这也是点估计 三、参数的区间估计 (一)参数的区间估计的含义 ?区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

(二)有关区间估计的几个概念 置信水平 1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2. 表示为 (1 - α% ) α 为是总体参数未在区间内的比例 3. 常用的置信水平值有 99%, 95%, 90% 相应的显著性水平α 为0.01,0.05,0.10 置信区间 1. 由样本统计量所构造的总体参数的估计区间称为置信区间 2. 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3. 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个 4. 由样本均值的抽样分布可知,在重复抽样或无限总体抽样的情况下,样本均值的数学期望等于总体均值, 5. 样本均值的标准差为 由此可知样本均值落在总体均值μ的两侧各为一个抽样标准差范围内的概率为0。6873 落在总体均值两个抽样标准差范围内的概率为0。9545 落在总体均值三个抽样标准差范围内的概率为0。9973 影响区间宽度的因素 1.总体数据的离散程度,用 σ 来测度 2.样本均值标准差 3.置信水平 (1 - α),影响 z 的大小 评价估计量的标准 x n x σ σ=

生物统计学答案 第六章 参数估计

第六章参数估计 6.1以每天每千克体重52 μmol 5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]: y/(μg · L-1)s/(μg · L-1)n 对照组 4.20 0.35 12 5-羟色胺处理组8.49 0.37 9 建立对照组和5-羟色胺处理组平均数差的0.95置信限。 答:程序如下: options nodate; data common; alpha=0.05; input n1 m1 s1 n2 m2 s2; dfa=n1-1; dfb=n2-1; vara=s1**2; varb=s2**2; if vara>varb then F=vara/varb; else F=varb/vara; if vara>varb then Futailp=1-probf(F,dfa,dfb); else Futailp=1-probf(F,dfb,dfa); df=n1+n2-2; t=tinv(1-alpha/2,df); d=abs(m1-m2); lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); k=vara/n1/(vara/n1+varb/n2); df0=1/(k**2/dfa+(1-K)**2/dfb); t0=tinv(1-alpha/2,df0); lcldmsun=d-t0*sqrt(vara/n1+varb/n2); ucldmsun=d+t0*sqrt(vara/n1+varb/n2); cards; 12 4.20 0.35 9 8.49 0.37 ; proc print; id f; var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun; title1 'Confidence Limits on the Difference of Means'; title2 'for Non-Primal Data'; run; 结果见下表: Confidence Limits on the Difference of Means for Non-Primal Data F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN 1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664 首先,方差是具齐性的。在方差具齐性的情况下,平均数差的0.95置信下限为3.959 07,置信上限为4.620 93。0.95置信区间为3.959 07 ~ 4.620 93。 6.2不同年龄的雄岩羊角角基端距如下表[27]: 年龄/a y/cm s/cm n

教案_第六章 参数估计

《统计学》教案 第七章假设检验 教学目的:介绍统计推断的基本原理,抽样及抽样分布的基本概念、参数估计的基本方法以及参数估计量的评价标准、几种重要的区间估计等。 基本要求:通过本章的学习,要求同学们理解抽样与抽样分布的基本概念,掌握抽样原理和抽样估计的基本方法,同时能熟练运用这些原理和方法去解决各种抽样组织方法的误差计算及其估计问题。 重点和难点:抽样分布、抽样推断的原理和参数估计的方法。 教学内容:§1抽样推断的基本概念与原理§2 参数估计中的点估计与区间估计§3抽样组织方式及其参数估计§4必要样本容量的确定 学时分配:6学时 主要参考书目: 1、陈珍珍等,统计学,厦门:厦门大学出版社,2003年版 2、于磊等,统计学,上海:同济大学出版社,2003年 3、徐国强等,统计学,上海:上海财经大学出版社,2001年版 4、管于华等,统计学,北京,高等教育出版社,2005年版 思考题: 1、理解抽样调查中常用的术语。 2、样本估计量的优良标准是什么? 3、抽样估计的误差范围与可靠程度是什么关系? 4、抽样估计的基本步骤是什么? 5、简述各种抽样组织方法的区别和计算方法。 6、影响样本容量的因素有哪些? 7、不同条件下样本容量的确定方法。 §1抽样推断的基本概念与原理 教学内容 一、抽样推断的特点和作用 1.概念 ■抽样推断是按照随机性原则,从研究对象中抽取一部分进行观察,并根据所得到的观察数值,对研究对象的数量特征作出具有一定可靠程度的估计和推断,以达

到认识总体的一种统计方法。 2.特点 ■根据样本资料对总体的数量特征作出具有一定可靠性的估计和推断 ■按照随机性原则从全部总体中抽取样本单位 ■抽样调查必然会产生误差,这是方法本身决定的 3.作用 ■某些现象不可能进行全面调查,为了解其全面情况就必须采用抽样推断方法■某些理论上可进行抽样调查的现象,用抽样推断可达到事半功倍的效果 ■抽样推断可以对全面调查的结果进行评价和修正 ■抽样推断可用于工业生产过程的质量控制 ■抽样推断可用于某些总体的假设检验,来判断假设的真伪,为决策提供依据二、重复抽样与不重复抽样 ■重复抽样 ■不重复抽样 三、抽样误差与抽样平均误差 ■抽样误差 ■抽样平均误差 四、抽样推断的理论基础 ■大数法则 ■中心极限定理 五、参数估计的基本步骤 ■抽取样本单位进行调查并计算出估计值 ■计算抽样误差 ■依据置信水平查正态分布表,计算抽样极限误差,对总体参数作区间估计 教学方法 采用课堂教学方法 提问与讨论 1.抽样误差与抽样平均误差有何不同?

统计学第六章参数估计教学指导与习题解答

第六章参数估计 Ⅰ.学习目的 本章介绍有关抽样分布的基础知识,阐述参数估计的理论与方法。通过学习,要求:1. 理解抽样的基本概念和不同抽样方式对抽样分布的影响;2。理解总体参数估计量的优良评价标准及点估计公式;3. 掌握总体均值与成数指标的区间估计方法、样本容量的确定方法;4. 应用:学会总体参数的置信区间的估计、样本容量的计算。 Ⅱ.课程内容 第一节抽样分布 一、抽样分布的基本概念 (一)样本容量与样本个数 样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表示一个样本中所包含的单位数。样本个数又称为样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样方法有关。 (二)总体参数与样本统计量 总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的

总体参数有,总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。 样本统计量是样本的一个函数,因此,它是随机变量。我们利用统计量来估计和推断总体的有关参数。常见的统计量有: 样本均值 1 n i i X X n ==∑ 样本成数 1 n P n = 样本方差 2 21 1()1n i i S X X n ==--∑ 样本标准差 S (三)回置抽样与无回置抽样 回置抽样是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一轮单位的抽取。 无回置抽样是指从总体抽出一个单位,登记后不放回原总体,即不参加下一轮抽样,下一次继续从总体中余下的单位抽取样本。 二、抽样分布 (一)样本平均数的抽样分布 样本平均数的期望值与方差分别为: []12121 ()( )()()()n n X X X E X E E X E X E X n n μ++ +== +++=[]2 2 1 21221 ()()()()n x n X X X D D X D X D X n n n σσ++ +==+++=

第六章 参数估计

1 第六章 参数估计 1、 证明在样本的一切线性组合中,X 是总体期望值a 的无偏估计 证:设n X X X ,,,21 是来自总体X 的样本,0≥?i α, n i ,,1 = 11 =∑=n i i α,∑==n i i i X X 1 ~α为n X X X ,,,21 的线性组合. 设总体的期望值为a ,方差为2σ,则 ∑∑∑=======n i i n i i i n i i i a a EX X E X E 1 1 1 )(~ ααα 所以∑==n i i i X X 1 ~α是a 的无偏估计. 2、 设总体ξ服从参数为λ的普阿松分布,求λ的矩估计量. 解:λλλξ-= e k P k ! )(~,则 λξξ==D E 设n X X X ,,,21 为取自总体ξ的简单随机样本,样本均值 为X ,方差为2S ,由 X ξE = 有 X =λ,即X =λ ? 或 2S ξD = 有 2S =λ,即2?S =λ 所以λ的矩估计量为X =λ ?或2?S =λ. 3、 设总体ξ的密度函数为: σ σ σ| |21),(x e x f -= +∞<<∞-x 试求σ的极大似然估计. 解:设n x x ,,1 是样本n X X X ,,,21 的观测值,n X X X ,,,21 取自总体ξ,则参数σ的似然函数为: ∑= ==- =∏n i i x n n n i i e x f L 1 | |11 21);()(σσ σσ 对数似然函数为 ∑- --=∑- ===-n i i n i i n n x n n x L 1 1 1||1 ln 2ln ||1 )2ln()(ln σ σσ σσ 似然方程为 0||1)(ln 1 2=∑+-=??=n i i x n L σσσσ

相关文档