文档库 最新最全的文档下载
当前位置:文档库 › 数理统计第一章

数理统计第一章

数理统计第一章
数理统计第一章

第1章抽样调查

§1.1 引言

数理统计学是数学的一个重要分支.它研究怎样有效地收集、整理和分析带有随机性的数据,以对所考查的问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议.若在以上句子中去掉“带有随机性的”这几个字,那就是统计学的研究范围.统计学就是数据科学(《数理统计学讲义》,高教出版)。

数理统计学是这样一门学科:它使用概率论和数学的方法,研究怎样收集(通过试验和观察)带有随机误差的数据,并在设定的模型下(称为统计模型)之下,对数据进行分析(称为统计分析),以对所研究的问题作出推断(称为统计推断)(《概率论与数理统计》,中科大出版,陈希孺).

由以上关于数理统计学的概念的阐述可以看出数理统计面对的对象就是数据,而数据的“质量”对最终的得出的结论的可靠性有着重大影响.对于普查的数据,数据的有效性、准确性很重要(这类数据的研究不属于数理统计学的范畴).对于抽查数据,数据的概率性质很重要.本章简要地介绍抽样调查的一些概念和技术以及相关理论.在数理统计学中还有另一种获取数据的方法--试验设计(将在后面介绍).

抽样调查是从总体中抽取一小部分个体以获取总体的有关信息.根据研究对象即总体的不同特点需要设计不同的抽样方法以获取高“质量”的数据.抽样技术在很多领域都有应用.

抽样技术本质上具有概率性—总体中每个个体都以特定的概率出现在样本中(简称为入样),并且样本的实际构成是随机的. 随机抽样至少有以下的益处:

? 抽取个体的随机性排除了调查者的偏见,即使是无意识的。

? 与完全枚举

(即普查)相比,小样本减少很多成本,调查更省时。 ?随机抽样的结论实际上可能比完全枚举更精确。小样本的数据质

量更容易监控,完全枚举需要大量的调查人员去实施,由此可能带来更多业务不精的职员。

? 随机抽样技术使得抽样误差估计变得可能。

? 在抽样设计时,通常可以确定出满足预设误差水平的样本容量。 以上的讨论中涉及“总体”和“个体”和“样本”三个名词.总体指研究对象的全体.而组成总体的各个成员称为个体.依总体中个体数有限和无限,总体分为有限总体和无限总体.本章讨论的总体都是有限总体.

在具体的统计问题中,我们总是关注总体中成员的某项(或多项)数量指标.总体中的N 个成员的数量指标值记为N x ,,x ,x 21.如果将总体中的成员依据某一属性分成r 类,我们可以用数值r ,, 1(或

11,0-r ,, )分别代表各个类别(称为分类数据或属性数据),最常见

的是分为二类(比如正品与次品,男性与女性),我们称之为二分变量.

例1.1 作为本章的第一个例子,我们利用Herkson(1976)的研究来解释一些思想.总体由393=N 个短期居留医院组成.我们关注于医

院一个月内出院人数.令i x 表示1968年1月份第i 个医院的出院人数,那么总体为39321x ,,x ,x .总体均值为6.814,总体标准差为7.589.总体的数值都是知道的,我们可通过频数直方图显示总体数值的分布,见P139图7.1.

这里举这个例子是为了教学目的,后面还会用这个例子来说明一些方法和思想.实际中,我们往往是不知道总体的数值,而是希望通过抽样而获得的数据去了解总体的信息,比如估计总体均值等. 在统计问题中,我们特别关注的是总体的一些数值特征,或参数. 总体均值(population mean )

∑==

N

i i x N

1

在分类数据中,各类别的比例. 总体总数(population total) ∑==N

i i x 1τ

总体方差(population variance)

∑==

N

i i

2

)-x

(N

1

21μσ

在二分情况下,总体方差为p)p -1(.

总体标准差(population standard deviation)

2σσ=.

一般地,总体的特征数(或参数)是未知的,而我们要做的工作就是通过观察到的数据即样本来获取总体参数的信息.

样本是指按照一定的抽样方案(或试验方案)从总体中抽取的若干

个个体.由于抽取个体的目的是要调查其某项(或多项)数量指标,因此所得的样本表现为抽取的各个个体的数量指标。记它们的数量指标为n X ,,X 1.我们称n X ,,X 1为样本,抽取的个体数n 称为样本容量. 由于抽样是随机安排的,因此n X ,,X 1是n 个随机变量(或向量).它们的联合分布依赖于总体的分布及抽样方案.抽样观察完成后便得到n 个具体的观察值n x ,,x 1,称n x ,,x 1为样本值, )x ,,(x n 1是

)X ,,(X n 1的一次实现.以后样本值简称为样本,因此以后说到样本可

以是n 个随机变量,也可以是n 个的观察值,这就是所谓的样本的二重性.在不会引起混淆时都用n x ,,x 1表示样本. §1.2 简单随机抽样

最初级的抽样方法是简单随机抽样:每个个体都以相同的概率入样.

简单随机抽样有放回的简单随机抽样(也称为有重复简单随机抽样)和不放回的简单随机抽样(也称为无重复简单随机抽样)两种方式.

有放回的简单随机抽样所得的样本)X ,,(X n 1的概率特性有 (1) 各个i X 具有相同的分布; (2) n X ,,X 1相互独立.

不放回的简单随机抽样所得的样本)X ,,(X n 1的概率特性有 (1)各个i X 具有相同的分布;

(2)n X ,,X 1不相互独立. 任意指定的n 个个体组成样本的概率均为

n N

C 1

两种方式下的样本的第一条概率特性相同,这是由“每个个体都

以相同的概率入样”的缘故.一般而言,简单随机抽样都是指不放回的随机抽样.这里引入有放回的随机抽样是因为(1)放回的随机抽样的样本的概率性质更为简单;(2)给不放回的随机抽样提供一个比较对象.

例如,若总体中N 个个体的数量指标值N x ,,x ,x 21各不相同,那么i X 的概率质量函数为 N ,,,j ,N

)x X P(j i 211

==

= 若总体中N 个个体的数量指标值有相同的,各个体的不同取值记为

m 1,?? ,,且取值j ?的个体数为j n )m ,,,j ( 21=,那么i X 的概率质量函

数为

m ,,,j ,N

n )X P(j j i 21==

=?

若总体为二分变量,那么i X ~)p ,(B 1,其中p 总体中取值为1的个体的比例.

我们往往关心总体均值、总体总数、总体方差等总体参数的估计,通常用样本均值(sample mean )

∑==n

i i X n X 1

1

作为总体均值μ的估计.作为总体总数的一个估计,我们考虑

X N T =

由于样本n X ,,X 1是随机的,所以样本均值X 也是随机的,它的概率分布称为抽样分布.X 的抽样分布决定了X 估计μ的精度,粗略地讲,

抽样分布越紧密地集中在μ附近,估计越好.

例1.2 为了解释抽样分布的概念,我们再一次考虑393个医院的总体.当然,在实践中,总体是未知的.出于教学的目的,我们考如来自这个总体的样本均值的抽样分布.例如,假如我们想寻找容量为16的样本

均值的抽样分布,原则上,我们可以得到所有的16

393C 个样本,并计算每

个样本的均值.但是这样的样本个数是2810阶,这显然是不可行的.因此我们利用称之为模拟的技术.我们抽取很多个容量同为n 的样本,计算均值,然后绘制其直方图,用以估计抽样分布.图7.2(见P141)显示了样本容量为32,16,8和64的500次模拟结果.值得注意的是该图的三个特征:

1. 所有的直方图集中在总体均值6.814上.

2. 随着样本容量的增加,直方图发散程度降低.

3. 尽管总体直方图(图7.1)关于均值不对称,但图7.2的直方图接近于对称.

一般而言,得出X 的精确抽样分布很困难.下面计算X 的期望、方差,以了解该估计量的统计性质,并由此看出该估计的优良性. 首先在简单随机抽样下,i X 的期望、方差分别为

μ???====∑∑==m

j j j m

j j j j i n N )(X P )E(X 111

21

1)(σμ?==∑=m j 2

j j i -(n N X Var )

以上性质无论放回抽样还是不放回抽样都成立,但对于协方差

)X ,X Cov j i ((j i ≠)会不一样,在放回抽样时)X ,X Cov j i (0=;而不放回

抽样时, )X ,X Cov j i (1

2

--

=N σ,

由以上讨论易得

性质1.2.1 简单随机抽样下,

τ

μ==)T (E )X E(

要注意的是,由于X 是随机的,结论μ=)X (E 可以解释“平均地”

μ=X .一般地利用样本构造的统计量θ?估计总体参数θ时,如果无论θ

取何值,总有θθ

=)(E ?,我们称θ?为θ的无偏估计.因此X 是μ的无偏估计.但这并不意味着X 会恰好等于μ,X 与μ总会有偏差的,为此还需考验该估计的精度.一般地我们可用均方误差

2)??θθθθ

-=(E ),MSE( 来衡量估计的精度.称),MSE(θθ?为标准误差.易得

2)???θθθθθ

-+=E ()ar(V ),MSE( θθ

-)(E ?称为偏差或偏倚.若θ?为θ的无偏估计,那么 )ar(V ),MSE(θθθ

??= 性质1.2.2 在简单随机抽样下, (1) 若放回抽样,则 n

)X Var(2

σ=

, n

X σ

σ=

22σn N )T (Var =,n

N T σσ= (2) 若不放回抽样,则

)1

1

1(2

---

=

N n n

)X Var(σ )1

11(22---=N n n N )T (Var σ, (3)在二分情形下,

p )X E(=,

n )

p -(p )X (Var 1=

,(放回抽样时) )1

1

11---=N n (n )p -(p )X (Var ,(不放回抽样时)

可以看出,样本均值的精度与n 和σ有关,两种抽样方式X 的方差相差一个因子 1

111--=---

N n N N n 称它为有限总体校正.比值N

n

称为抽样比例,若抽样比例非常小时 1

1

1---

N n 1≈ 两种抽样方式下样本均值的方差差别不大.

例1.3 如果无重复地抽取医院总体,样本容量为32=n ,那么样本均值的标准差为 39231

132

7.58911132

)(-

=---

=

=N n X Var X σ

σ 0.10096.02.104=?=

为了说明0.100=X σ是精度合理的度量,再次审视图7.2b,观测到大部分样本均值在总体均值(814)的2倍标准误差之内,也就是说大部分样

本均值在)1014

,614(内. 例1.4 在医院总体中,小于1000个出院人数的比例是654.0=p .如果利

用样本比例p

?估计这个总体比例,可得该估计的标准误差为

08.096.032

346

.0654.0111)1(?=??=----=

N n n p p p σ 总体方差2σ是一个重要的总体参数,也需要通过样本对其作出估计,并且由上面的讨论可看出样本均值作为总体均值的估计时,其精度与总体方差有关,在实现中总体方差未知,我们可由样本对其作出估计,从而对样本均值作为总体均值的估计时的精度作出评估. 下面是一个常用的2σ的估计量

∑==n

i i 2

)X -X (n 1

21?σ

性质1.2.3 在简单随机抽样下, (1) 若放回抽样,则

n

)n ()E(2

2

1?σσ-=

(2) 若不放回抽样,则

)1

1?22

-N N (n )n ()E(σσ

-= 由此可见2?σ

是2σ的有偏估计,而且总有 22?σσ

<)E( 也即该估计系统地偏小,为了具有无偏性,我们可对以上估计作如下修正

∑==n

i i )X -X (-n S 1

22

11,(放回抽样时), 21221111~S N

-N )X -X ()N -N (-n S n i i ==∑=,(不放回抽样时),

从无偏性角度,2S (或2~

S )优于2?σ

.但从均方误差准则角度,2σ?往往

优于2S (或2~

S ).在实际中人们往往不希望把总体方差估计得偏小,因此总体方差的估计常用2S (或2~

S ).我们易得下面结论 性质1.2.4 样本均值X 的方差)X (Var 的无偏估计为

n

S S 22

=,(放回抽样时),

)N

n (n S S 2X -=1~2

,(不放回抽样时)

性质 1.2.5 在二分总体中,p 的估计X p

=?的方差)p (Var ?的无偏估计为

1?1??-n )p -(p

S 2

p =

,(放回抽样时), )N

n (-n )p -(p S 2p -=11?1??

,(不放回抽样时) 如果我们知道了实际的总体方差2σ,那么可用σ来度量p

,X ?的估计精度;如果总体方差2σ未知(实际中2σ通常未知),那用估计的标准误差替代他们,这是通常的做法.

例 1.5 从医院总体中抽取一个样本容量为50的样本,并算得样本均值为5.938=x ,标准差为53.614=s .那么可得样本均值X 的方差的估计为

)1(?22

N

n

n s X

-=σ

6592= X 的估计标准误差是

19.81?=X σ

注意,真正的标准误差是 7839249

150

7.589)(=-=

=X Var X σ

例1.6 令p 为出院人数少于1000人的医院比例,从医院总体中抽取一个样本容量为50的样本,其中有26个医院出院人数少于1000.那么

p 的估计值为

52.050

26?==p

p

?的方差的估计为 0045.0)1()?1(??2?=--=

N

n

n p p p σ p

?的估计标准误差为 067.0??=p σ

以上例子说明通过简单随机抽样不仅可以得到未知的总体参数的估计,还可以利用样本数据的估计的标准误差刻画估计的误差水平.总结如下表:

前面己经讨论了样本均值X 的期望与方差,在理想情况下,我们想知道X 的抽样分布,这样做就可以告诉我们估计精度的一切特征.然而,在没有总体本身的信息时,我们是不能确定抽样分布的.但由中心极限定理我们可以导出其近似分布----正态分布,这种近似可以用

来计算估计误差的概率限.

若随机变量序列 ,X ,,X ,X n 21独立同分布,且期望,EX i μ=方差

2

σ=i VarX ,记∑==n

i i n X n X 1

1,那么中心极限定理知

n

X n /σμ

-

依分布收敛于标准正态分布)1,0(N .也即当n 充分大时,n X 近似服从正态分布)/,(2n N σμ.

由以上结论可知,若n X ,,X ,X 21是从某总体中按放回的简单随机抽样方法得到的样本,总体均值和方差分别为μ和2σ,那么当样本容量

n 充分大时,X 近似服从正态分布)/,(2n N σμ.

若n X ,,X ,X 21是从某总体中按不放回的简单随机抽样方法得到的样本,此时情况所有不同,诸i X 并不独立,且让样本容量n 趋于无穷是没有意义的.但是当样本容量n 很大,且相对于N 仍很小时,X 近似服

从正态分布),(2

N σμ.

由以上的近似分布,我们可以近似地计算用X 估计μ时误差小于某常数δ的概率)|δμ<-X P(|, )|δμ<-X P(|12-Φ≈)(X

σδ

, 或

)|δμ>-X P(|]1[2)(

X

σδ

Φ-≈ 例1.7 再次考虑医院总体,容量为64的样本均值的标准差为 5.6739263

164

7.589)(=-=

=X Var X σ

那么样本均值X 近似服从正态分布)5.67,(2μN ,这里814=μ为总体均值.由此可近似地计算出样本均值与总体均值的绝对偏差在100以上的概率

)100|>-μX P (|138.0]5

.67100

1[2=Φ-≈)(

例1.8 续例1.6 p 的真实值为6540.,p 的估计值为520?.p

=,两者差距为134.0|?=-p p

|,下面近似计算两者的绝对偏差超过134.0的概率. 由于p

?近似服从正态分布)064.0,(2p N ,因而 )134.0|?>-p p

P(|04.0]064

.0134

.01[2=Φ-≈)( 我们看到这样的样本非常“不幸”,超过这个误差的发生几率仅是4%.

§1.3 比例的估计

上一节简单随机抽样奠定了抽样调查的理论基础.在此基础上,这一节和下一节介绍抽样调查的一些高深话题.

这一节,我们考虑比例估计,假设观察到总体成员的两个数值x 和

y .感兴趣的是比例

x

y N

i i

N

i i

x

y r μμ==

∑∑==11 这里∑==N

i i y y N 1

1μ,∑==N i i x x N 11μ

比例在抽样调查中经常出现.例如,如抽取家庭,可以计算下面的比例:

如果y 是家庭中年龄为20-30岁的失业男性人数,x 是家庭中年龄为

20-30岁的男性人数,那么r 是年龄为20-30岁的男性失业比例. 如果y 是周食品消费支出,x 是家庭成员数,那么r 是人均家庭周食品消费支出.

在农业调查中,y 可能是种植小麦亩数,x 是所有的亩数.等等. 下面考虑比例的估计问题,设有样本n ,,,i ),Y ,X i i 21=(,很自然地利用X

Y

R =

估计r .我们希望能推导出该估计量的期望E(R)和方差)R (Var 的表达式.但是由于R 是X 和Y 的非线性函数,得出期望E(R)和方差

)R (Var 的显出表达式行不通.但可以得到他们近似式,下面不加证明

地给出结论.

性质1.3.1 在简单随机抽样下,X

Y

R =的近似方差为 )r -r ()R Var(Y X Y X x

σσσμ

21

2

222+≈

)r -r ()-N -n -

(n

xy y x 2x

σσσμ2111112

22+= 其中 )X (Var X =2σ,)Y (Var Y =2

σ,)Y ,X (Cov Y X =σ

∑==N i x i x

)-x (N 1221μσ,∑==N i y i y )-y (N 1

2

21μσ,∑==N i y i x i xy )-y )(-x (N 11μμσ

xy σ称为x 和y 的总体协方差.而总体相关系数定义为

y

x xy

σσσρ=

以上)R (Var 的近似式又可表示为 )r -r ()-N -n -(n

)R (Var y x y x 2x

σρσσσμ2111112

22+≈ 由以上近似结果可以看出,R 的方差取决于多种因素,其中的因素

之一是x 与y 的相关性,x 与y 具有强的正相关性时,会减少方差.x μ是影响方差的另一因素,||x μ越小,方差越大,这也好理解,因此||x μ越小,比率X

Y

R =

的波动幅度会变大. 性质1.3.2 在简单随机抽样下,X

Y

R =

的近似期望为 )-r ()-N -n -(n r E(R)y x x x

σρσσμ2

211111+≈

由以上近似结果可以看出,R 不是r 的无偏估计,其偏差的阶是n /1,所以它对均方误差的贡献是21n /,而方差的阶是n /1,因此对于大样本而言,估计的标准误差主要取决于方差,而偏差可忽略不计. 在大样本下,R 近似服从正态分布.利用近似分布,我们可以构造r 的置信区间.也可以找出这种估计的误差的概率限.

为了估计R 的标准误差或者说为了具体地计算出R 的标准误差.还

必须估计出x μ,22y x ,σσ以及ρ,r .前三者分别用2x S ,X 和2

y S 估计,r 用R 估

计.为估计ρ,我们先对总体协方差作如下估计:

∑==n i i i xy )Y -)(Y X -X (-n S 1

11 那么ρ的估计为

y

x xy S S S =ρ

?

因此R 的估计方差为

)S S R -S S R (X

)-N -n -(n S y x y x R

ρ

?2111112

2222

+≈ r 的近似α-1的置信区间为R S U R 2/1α-±.

例1.9 假设调查了100个最近购房的居民,得到每个购房者的每月

按揭付款额和月总收入。令y (单位:美元)表示月按揭付款额,x (单位:美元)表示月总收入。假设 3100=x , 868=y 1200=x s ,250=y s

850?.=ρ

则2803100

868

.R ==

, 若忽略有限总体校正,R 的估计标准误差是 006.0120025085.028.022********.03100

1101222=????-+??=

R s r 的近似95%的置信区间为012.028.0006.096.128.0±=?±。

比例可以用于估计总体均值和总体总数.由比例

x

y

N

i i

N

i i

x

y r μμ=

=

∑∑==11 立即可得

x N

i i N

i i y r x r y ττ===∑∑==1

1

x y r μμ=

如果x 的总数x τ或均值x μ是知道的,那么就可以通过比例r 的估计

R 得到y μ和y τ的估计

x R y R Y μμ

==? x y y R T ττ==?,

这样的估计分别称为总体均值的比例估计和总体总数的比例估计。 我们在前面介绍过可直接利用样本n Y ,,Y 1而得到估计:

∑===n

i i y y n Y 1

1?μ

Y N T y ==τ?

那么比例估计与上面的估计(称为普通估计)相比,是否有改进?什么情况下会有改进?改进的程度如何?这是需要回答的问题.下面先看几个例子.

例1.10 从医院总体中模拟容量为64的样本500个,结果直方图如7.6a(P155)图所示.我们再用出院人数与医院床位数的比例来估计平均出院人数,这500个样本得出的平均出院人数的比例估计的直方图如图7.6b(P155)所示.两图对比可清楚地显示出比例估计非常有效地减少了估计的变异性.

为了评估估计量R y Y =μ

?,需要推导其均值和方差,精确推导难以进行,下面给出近似结果:

性质 1.3.3 y μ的比例估计的方差为 )r -r )(-N -n -(n

)Y (Var y x y x R σρσσσ21

111

2

22+≈ y μ的比例估计的期望为

)-r ()-N -n -

(n

)Y (E y x x x

y R σρσσμμ2

11111+≈ 由此可见,R Y 是有偏估计,但其偏差在均方误差中的贡献可以忽略不计,故比较均方误差只需比较方差.为简便起见,我们忽略有限总体校正,普通估计Y 的方差为 n

)Y (Var y

2

σ=

如果

0222

那么比例估计有较小的方差.在0>r 时,上式等价于 x y r σρσ>2 即 y

x

y y x x C C ))/((

2121=

>μσμσρ 其x x x /C μσ=,y y y /C μσ=,x C 和y C 称为变异系数(coefficients of variation).

为了估计R Y 的精度,需要由样本数据给出其方差的估计值. 性质 1.3.5 R Y 的方差的估计为 )S S R -S S R )(-N -n -(n S y x y x 2Y R

ρ

?21

1112

22+= y μ的近似α-1的置信区间为R

Y R S U Y 2/1α-±

例1.11 对于医院总体,我们有

8274.x =μ,1213.x =σ

6814.y =μ,7589.y =σ

962.r =, 910.=ρ

这里y ,x 分别表示床位数和出院人数. R Y 的方差近似为

n

.)...-...(n )Y (Var R 4

68697758922139622758922139621222=???+?≈ n

.R

Y 1

262≈

σ. 包含有限总体校正,64=n 时 0.3039263

164

1262=-≈

.R

Y σ

图7.6显示的500个样本的比例估计值的标准差为29.9,两者非常接近.而这500个估计值的平均值为816.2,与真实值814.6相比也非常接近.

容量为64=n 的简单随机样本下,Y 的标准差为

3.66392

63

187589=-=

.Y σ 比较Y σ与R

Y σ,可以看出y μ的比例估计大大减少了变异性.

对不同的估计法的比较还有另一种方式:在相同的精度下,对所需的样本容量作对比.显然在达到相同的精度条件下所需的样本容量越小越优.

例1.12继续分析上例.

如果抽取容量为1n 的简单随机样本,Y 的方差为

1

2

7.589)(n Y Var =

如果抽取容量为2n 的简单随机样本,R Y 的方差为

2

2

1.262)(n Y Var R =

221.262n 1

2

7.589n =

则 12195.0n n =

也就是说,要使两个估计具有相同的精度,普通方法所需的样本量是比例估计的5倍多. §1.4 分层抽样

在许多情况中,人们在拟订抽样方案前,往往对总体有一些了解.比如在企业调查时,我们除了知道企业数,还对企业的规模有大概的了解,哪些企业属大型企业,哪些企业属中型企业,哪些企业属小型企业等方面的信息事先就知道.并且就调查的指标而言,不同模型的企业可能差异较大,而同等模型的企业可能差异较小.这种情况下,如还用简单随机抽样方法,就可能出现极端情况:抽查的企业大多是大型企业,或大多是小型企业.如出现这种情况,调查结果的代表性就会很差,由此得出的统计结果可能与真实情况会有较大偏差,统计结论的可靠性值得怀疑.用分层抽样方法能较好地克服以上弊端.

分层抽样:将总体分成若干次级总体,即层(strata),然后在各层中独立取样(采用简单随机抽样),最后将在各层中的抽样结果组合在一起估计总体参数.

层的划分有时是“自然”形成,有时根据某些指标及已有的信息划分.下面给出几个分层的例子.

?在审计金融交易时,可根据面值将交易分层.

?在人群样本中,经常根据地理位置划分自然层.

?在对公司经营状况调查时,可根据公司规模分层.也可根据公司所属行业分层.

采用分层抽样的原因有很多,采用分层抽样主要是为了提高样本的代表性,提升效果.另外,如除了对总体的整体信息感兴趣外,还希望得到自然次总体的信息,采用分层抽样是自然的选择.

本节主要讨论分层样本均值的性质,以及如何在层间分配样本容量,

数三概率论与数理统计教学大纲

数三《概率论与数理统计》教学大纲 教材:四川大学数学学院邹述超、何腊梅:《概率论与数理统计》,高等教育出版社出,2002年8月。 参考书:袁荫棠:《概率论与数理统计》(修订本),中国人民大学出版社。 四川大学数学学院概率统计教研室:《概率论与数理统计学习指导》 总学时:60学时,其中:讲课50学时,习题课10学时。 学分:3学分。 说明: 1.生源结构:数三的学生是由高考文科生和一部分高考理科生构成。有些专业全是文科生或含极少部分理科生(如:旅游管理,行政管理),有些专业约占1/4~1/3的理科生(国贸,财政学,经济学),有些专业全是理科生(如:国民经济管理,金融学)。 2.高中已讲的内容:高中文、理科都讲了随机事件的概率、互斥事件的概率、独立事件的概率,即教材第一章除条件概率以及有关的内容以外,其余内容高中都讲了。高中理科已讲离散型随机变量的概率分布(包括二项分布、几何分布)和离散型随机变量的期望与方差,统计基本概念、频率直方图、正态分布、线性回归。而高中文科则只讲了一点统计基本概念、频率直方图、样本均值和样本方差的简单计算。 3.基本要求:学生的数学基础差异大,不同专业学生对数学课重视程度的差异大,这就给讲授这门课带来一定的难度,但要尽量做到“分层次”培养学生。高中没学过的内容要重点讲解,学过的内容也要适当复习或适当增加深度。讲课时,既要照顾数学基础差的学生,多举基本例子,使他们掌握大纲要求的基本概念和方法;也要照顾数学基础好的学生,使他们会做一些综合题以及简单证明题。因为有些专业还要开设相关的后继课程(如:计量经济学),将用到较多的概率统计知识;还有一部分学生要考研,数三的概率考研题往往比数一的难。 该教材每一章的前几节是讲述基本概念和方法,习题(A)是针对基本方法的训练而编写的,因此,这一部分内容须重点讲解,并要求学生必须掌握;每一章的最后一节是综合例题,习题(B)具有一定的综合性和难度,可以选讲部分例题,数学基础好的学生可选做(B)题。 建议各章学时分配(+号后面的是习题课学时): 第一章随机事件及其概率 一、基本内容 随机事件的概念及运算。概率的统计定义、古典定义及公理化定义。概率的基本性质、加法公式、条件概率与乘法公式、全概率公式、贝叶斯公式。事件的独立性,独立随机试验、

数理统计茆诗松第二章自测题

《数理统计》第二章自测题 时间:120分钟,卷面分值:100 分 一、填空题:(每题2分,共10分) 得分 1.设总体X 服从参数为λ的泊松分布,X 1, X 2, …, X n 是取自X 的随机样本,其均值和方差 分别为X 和2S ,如果2 ?(23)aX a S λ =+-是λ的无偏估计,则a = 。 2.设总体X 的密度函数为???<≥=--,,θθθθx x e x f x , 0,),()(,n X X X ,,,21Λ为来自该总体的一 个简单随机样本,则参数θ的矩估计量为 。 3.已知1?θ,2?θ为未知参数θ的两个无偏估计,且1?θ与2?θ不相关,12??()4()D D θθ=。如果 312???a b θθθ=+也是θ的无偏估计,且是1?θ,2 ?θ的所有同类型线性组合中方差最小的,则 a = ,b = 。 4.设X 是在一次随机试验中事件A 发生的次数,进行了n 次试验得一组样本X 1, X 2, …, X n , 其中事件A 发生了k 次,则事件A 发生的概率为p ,的最大似然估计为 ;p(1-p)的矩估计为 。 5.设总体 均为未知参数, 为来自总体X 的一个样本,当用 作为的估计时,最有效的是 。 二、选择题:(每题3分,共24分) 得分 1. 设总体X 服从[a,b](a

概率论与数理统计第一章课后习题及参考答案

概率论与数理统计第一章课后习题及参考答案 1.写出下列随机试验的样本空间. (1)记录一个小班一次数学考试的平均分数(以百分制记分); (2)一个口袋中有5个外形相同的球,编号分别为1,2,3,4,5,从中同时取 出3个球; (3)某人射击一个目标,若击中目标,射击就停止,记录射击的次数; (4)在单位圆内任意取一点,记录它的坐标. 解:(1)}100,,2,1{ =Ω; (2)}345,235,234,145,135,134,125,124,123{=Ω; (3)},2,1{ =Ω; (4)}|),{(22y x y x +=Ω. 2.在}10,,2,1{ =Ω,}432{,,=A ,}5,4,3{=B ,}7,6,5{=C ,具体写出下列各式:(1)B A ;(2)B A ;(3)B A ;(4)BC A ;(5)C B A . 解:(1),9,10}{1,5,6,7,8=A , }5{=B A ;(2)}10,9,8,7,6,5,4,3,1{=B A ; (3)法1:}10,9,8,7,6,2,1{=B , }10,9,8,7,6,1{=B A , }5,4,3,2{=B A ; 法2:}5,4,3,2{===B A B A B A ; (4)}5{=BC , }10,9,8,7,6,4,3,2,1{=BC , }4,3,2{=BC A , }10,9,8,7,6,5,1{=BC A ;

(5)}7,6,5,4,3,2{=C B A , {1,8,9,10}=C B A . 3.设}20|{≤≤=Ωx x ,}121| {≤<=x x A ,}2 341|{≤≤=x x B ,具体写出下列各式:(1)B A ;(2)B A ;(3)AB ;(4)B A . 解:(1)B B A = , }22 3,410|{≤<<≤==x x x B B A ;(2)=B A ?; (3)A AB =, }21,10|{≤<≤ ≤==x x x A AB ;(4)}231,2141|{<<<≤=x x x B A .4.化简下列各式:(1)))((B A B A ;(2)))((C B B A ;(3)))((B A B A B A .解:(1)A B B A B A B A ==)())(( ; (2)AC B C A B C B B A ==)())((;(3))())()((B A B B A B A B A B A =AB AB A A B A A === )(.5.A ,B ,C 表示3个事件,用文字解释下列事件的概率意义:(1)C B A C A C B A ;(2)BC AC AB ;(3)(C B A ;(4)BC AC AB . 解:(1)A ,B ,C 恰有一个发生; (2)A ,B ,C 中至少有一个发生; (3)A 发生且B 与C 至少有一个不发生; (4)A ,B ,C 中不多于一个发生. 6.对于任意事件A ,B ,证明:Ω=-A B A AB )(.

概率论和数理统计期末考试题及答案

概率论与数理统计期末复习题一 一、填空题(每空2分,共20分) 1、设X 为连续型随机变量,则P{X=1}=( 0 ). 2、袋中有50个球,其编号从01到50,从中任取一球,其编号中有数字4的概率为(14/50 或7/25 ). 3、若随机变量X 的分布律为P{X=k}=C(2/3)k ,k=1,2,3,4,则C=( 81/130 ). 4、设X 服从N (1,4)分布,Y 服从P(1)分布,且X 与Y 独立,则 E (XY+1-Y )=( 1 ) ,D (2Y-X+1)=( 17 ). 5、已知随机变量X ~N(μ,σ2 ),(X-5)/4服从N(0,1),则μ=( 5 );σ=( 4 ). 6 且X 与Y 相互独立。 则A=( 0.35 ),B=( 0.35 ). 7、设X 1,X 2,…,X n 是取自均匀分布U[0,θ]的一个样本,其中θ>0,n x x x ,...,,21是一组观察值,则θ的极大似然估计量为( X (n) ). 二、计算题(每题12分,共48分) 1、钥匙掉了,落在宿舍中的概率为40%,这种情况下找到的概率为0.9; 落在教室里的概率为35%,这种情况下找到的概率为0.3; 落在路上的概率为25%,这种情况下找到的概率为0.1,求(1)找到钥匙的概率;(2)若钥匙已经找到,则该钥匙落在教室里的概率. 解:(1)以A 1,A 2,A 3分别记钥匙落在宿舍中、落在教室里、落在路上,以B 记找到钥匙.则 P(A 1)=0.4,P(A 2)=0.35,P(A 3)=0.25, P(B| A 1)=0.9 ,P(B| A 2)=0.3,P(B| A 3)=0.1 所以,49.01.025.03.035.09.04.0)|()()(3 1 =?+?+?== ∑=i i i A B P A P B P (2)21.049.0/)3.035.0()|(2=?=B A P 2、已知随机变量X 的概率密度为 其中λ>0为已知参数.(1)求常数A; (2)求P{-1<X <1/λ)}; (3)F(1). ?? ?? ?<≥=-0 00)(2x x e A x f x λλ

概率论与数理统计第二章答案

第二章 随机变量及其分布 1、解: 设公司赔付金额为X ,则X 的可能值为; 投保一年内因意外死亡:20万,概率为0.0002 投保一年内因其他原因死亡:5万,概率为0.0010 投保一年内没有死亡:0,概率为1-0.0002-0.0010=0.9988 所以X 2、一袋中有5X 表示取出的三只球中的最大号码,写出随机变量X 的分布律 解:X 可以取值3,4,5,分布律为 10 61)4,3,2,1,5()5(1031)3,2,1,4()4(10 11)2,1,3()3(35 2 435 2 335 2 2=?= === ?==== ?= ==C C P X P C C P X P C C P X P 中任取两球再在号一球为中任取两球再在号一球为号两球为号一球为 也可列为下表 X : 3, 4,5 P :10 6, 103,101 3、设在15只同类型零件中有2只是次品,在其中取三次,每次任取一只,作不放回抽样,以X 表示取出次品的只数,(1)求X 的分布律,(2)画出分布律的图形。 解:任取三只,其中新含次品个数X 可能为0,1,2个。 35 22 )0(315313= ==C C X P 3512)1(3 15213 12=?==C C C X P 35 1)2(3 15 113 22= ?= =C C C X P 再列为下表 X : 0, 1, 2 P : 35 1, 3512,3522 4、进行重复独立实验,设每次成功的概率为p ,失败的概率为q =1-p (0

概率论与数理统计第一章测试题

第一章 随机事件和概率 一、选择题 1.设A, B, C 为任意三个事件,则与A 一定互不相容的事件为 (A )C B A ?? (B )C A B A ? (C ) ABC (D ))(C B A ? 2.对于任意二事件A 和B ,与B B A =?不等价的是 (A )B A ? (B )A ?B (C )φ=B A (D )φ=B A 3.设A 、B 是任意两个事件,A B ?,()0P B >,则下列不等式中成立的是( ) .A ()()P A P A B < .B ()()P A P A B ≤ .C ()()P A P A B > .D ()()P A P A B ≥ 4.设()01P A <<,()01P B <<,()()1P A B P A B +=,则( ) .A 事件A 与B 互不相容 .B 事件A 与B 相互独立 .C 事件A 与B 相互对立 .D 事件A 与B 互不独立 5.设随机事件A 与B 互不相容,且()(),P A p P B q ==,则A 与B 中恰有一个发生的概率等于( ) .A p q + .B p q pq +- .C ()()11p q -- .D ()()11p q q p -+- 6.对于任意两事件A 与B ,()P A B -=( ) .A ()()P A P B - .B ()()()P A P B P AB -+ .C ()()P A P AB - .D ()()() P A P A P AB +- 7.若A 、B 互斥,且()()0,0P A P B >>,则下列式子成立的是( ) .A ()()P A B P A = .B ()0P B A > .C ()()()P AB P A P B = .D ()0P B A = 8.设()0.6,()0.8,()0.8P A P B P B A ===,则下列结论中正确的是( ) .A 事件A 、B 互不相容 .B 事件A 、B 互逆

《概率论与数理统计》期末考试试题及解答

一、填空题(每小题3分,共15分) 1. 设事件B A ,仅发生一个的概率为0.3,且5.0)()(=+B P A P ,则B A ,至少有一个不发 生的概率为__________. 答案:0.3 解: 3.0)(=+B A B A P 即 )(25.0)()()()()()(3.0AB P AB P B P AB P A P B A P B A P -=-+-=+= 所以 1.0)(=AB P 9.0)(1)()(=-==AB P AB P B A P . 2. 设随机变量X 服从泊松分布,且)2(4)1(==≤X P X P ,则==)3(X P ______. 答案: 161-e 解答: λλ λ λλ---= =+==+==≤e X P e e X P X P X P 2 )2(, )1()0()1(2 由 )2(4)1(==≤X P X P 知 λλλ λλ---=+e e e 22 即 0122 =--λλ 解得 1=λ,故 16 1)3(-= =e X P 3. 设随机变量X 在区间)2,0(上服从均匀分布,则随机变量2 X Y =在区间)4,0(内的概率 密度为=)(y f Y _________. 答案: 04,()()0,. Y Y X y f y F y f <<'===? 其它 解答:设Y 的分布函数为(),Y F y X 的分布函数为()X F x ,密度为()X f x 则 2 ()()())))Y X X F y P Y y P X y y y y y =≤=≤ =≤- - 因为~(0,2)X U ,所以(0X F = ,即()Y X F y F = 故

概率论与数理统计期末总结

第1章 概率论的基本概念 1.1 随机试验 称满足以下三个条件的试验为随机试验: (1)在相同条件下可以重复进行; (2)每次试验的结果不止一个,并且能事先明确所有的可能结果; (3)进行试验之前,不能确定哪个结果出现。 1.2 样本点 样本空间 随机事件 随机试验的每一个可能结果称为一个样本点,也称为基本事件。 样本点的全体所构成的集合称为样本空间,也称为必然事件。必然事件在每次试验中必然发生。 随机试验的样本空间不一定唯一。在同一试验中,试验的目的不同时,样本 空间往往是不同的。所以应从试验的目的出发确定样本空间。 样本空间的子集称为随机事件,简称事件。 在每次试验中必不发生的事件为不可能事件。 1.3 事件的关系及运算 (1)包含关系 B A ?,即事件A 发生,导致事件B 发生; (2)相等关系 B A =,即B A ?且A B ?; (3)和事件(也叫并事件) B A C ?=,即事件A 与事件B 至少有一个发生; (4)积事件(也叫交事件) B A AB C ?==,即事件A 与事件B 同时发生; (5)差事件 AB A B A C -=-=,即事件A 发生,同时,事件B 不发生; (6)互斥事件(也叫互不相容事件) A 、 B 满足φ=AB ,即事件A 与事件B 不同时发生; (7)对立事件(也叫逆事件) A A -Ω=,即φ=Ω=?A A A A ,。

1.4 事件的运算律 (1)交换律 BA AB A B B A =?=?,; (2)结合律 ()()()()C AB BC A C B A C B A =??=??,; (3)分配律 ()()()()()()C A B A BC A AC AB C B A ??=??=?,; (4)幂等律 A AA A A A ==?, ; (5)差化积 B A AB A B A =-=-; (6)反演律(也叫德·摩根律)B A AB B A B A B A B A ?==?=?=?,。 1.5 概率的公理化定义 设E 是随机试验,Ω为样本空间,对于Ω中的每一个事件A ,赋予一个实数P (A ),称之为A 的概率,P (A )满足: (1)1)(0≤≤A P ; (2)1)(=ΩP ; (3)若事件 ,,, ,n A A A 21两两互不相容,则有 () ++++=????)()()(2121n n A P A P A P A A A P 。 1.6 概率的性质 (1)0)(=φP ; (2)若事件n A A A ,, , 21两两不互相容,则())()()(2121n n A P A P A P A A A P +++=??? ; (3))(1)(A P A P -=; (4))()()(AB P B P A B P -=-。 特别地,若B A ?,则)()(),()()(B P A P A P B P A B P ≤-=-; (5))()()()(AB P B P A P B A P -+=?。

概率论与数理统计期末考试题及答案

创作编号: GB8878185555334563BT9125XW 创作者: 凤呜大王* 模拟试题一 一、 填空题(每空3分,共45分) 1、已知P(A) = 0.92, P(B) = 0.93, P(B|A ) = 0.85, 则P(A|B ) = 。 P( A ∪B) = 。 3、一间宿舍内住有6个同学,求他们之中恰好有4个人的生日在同一个月份的概率: ;没有任何人的生日在同一个月份的概率 ; 4、已知随机变量X 的密度函数为:, ()1/4, 020,2 x Ae x x x x ??

8、设总体~(0,)0X U θθ>为未知参数,12,,,n X X X 为其样本, 1 1n i i X X n ==∑为样本均值,则θ的矩估计量为: 。 9、设样本129,, ,X X X 来自正态总体(,1.44)N a ,计算得样本观察值10x =, 求参数a 的置信度为95%的置信区间: ; 二、 计算题(35分) 1、 (12分)设连续型随机变量X 的密度函数为: 1, 02()2 0, x x x ??≤≤?=???其它 求:1){|21|2}P X -<;2)2 Y X =的密度函数()Y y ?;3)(21)E X -; 2、(12分)设随机变量(X,Y)的密度函数为 1/4, ||,02,(,)0, y x x x y ?<<??

《概率论与数理统计》课程教学大纲

《概率论与数理统计》课程教学大纲 一、课程基本信息 课程编号:450006 课程名称:概率论与数理统计 课程类别:公共基础课(必修) 学时学分:理论48学时/3学分 适用专业:计算机、自动化、经管各专业 开课学期:第一学期 先修课程:高等数学 后续课程: 执笔人: 审核人: 制(修)订时间:2015.9 二、课程性质与任务 概率论与数理统计是研究随机现象客观规律性的数学学科,是高等学校理、工、管理类本科各专业的一门重要的基础理论课。通过本课程的教学,应使学生掌握概率论与数理统计的基本概念,了解它的基本理论和方法,从而使学生初步掌握处理随机事件的基本思想和方法,培养学生运用概率统计方法分析和解决实际问题的能力。 三、课程教学基本要求 本课程以课堂讲授为主,致力于讲清楚基本的概率统计思想,使学生掌握基本的概率、统计计算方法。注意培养基本运算能力、分析问题和解决实际问题的能力。讲授中运用实例来说明本课程应用的广泛性和重要性。每节课布置适量的习题以巩固所学知识,使学生能够运用概率统计思想和方法解决一些实际问题。 四、课程教学内容及各教学环节要求 (一)概率论的基本概念

1、教学目的 理解随机现象、样本空间、随机事件、概率等概念,掌握事件的关系与运算,掌握古典概犁及其计算、条件概率的计算、全概率公式和贝叶斯公式的应用。 2、教学重点与难点 (1)教学重点 ① 概率、条件概率与独立性的概念; ② 加法公式;乘法公式;全概率公式;贝叶斯公式。 (2)教学难点 ① 古典概型的有关计算;② 全概率公式的应用; ③ 贝叶斯公式的应用。 3、教学方法 采用传统教学方式,以课堂讲授为主,课堂讨论、多媒体演示、课下辅导等为辅的教学方法。加强互动教学,学生对课程的某一学术问题通过检索资料、实际调查来提高自学能力和实践应用能力。 4、教学要求 (1)理解随机试验、样本空间、随机事件等基本概念;熟练掌握事件的关系及运算 (2)理解频率和概率定义;熟练掌握概率的基本性质 (3)理解等可能概型的定义性质;,会计算等可能概型的概率 (4)理解条件概率的定义;熟练掌握加法公式、乘法公式、全概率公式和贝叶斯公式(5)理解事件独立性概念,掌握应用独立性进行概率计算 (二)随机变量及其分布 1、教学目的 了解随机变量的概念;理解离散型随机变量的分布律和连续型随机变量的概率密度的概念及性质,会利用性质确定分布律和概率密度;理解分布函数的概念及性质,会利用此概念和性质确定分布函数,会利用概率分布计算有关事件的概率;掌握正态分布、均匀分布、指数分布、0-1分布、二项分布、泊松分布,会求简单的随机变量函数的分布 2、教学重点与难点 (1)教学重点 ① 随机变量及其概率分布的概念; ② 离散型随机变量分布律的求法;

《概率论与数理统计》期末考试题及答案

西南石油大学《概率论与数理统计》期末考试题及答案 一、填空题(每空3分,共45分) 1、已知P(A) = 0.92, P(B) = 0.93, P(B|A ) = 0.85, 则P(A|B ) = 。 P( A ∪B) = 。 2、设事件A 与B 独立,A 与B 都不发生的概率为 1 9 ,A 发生且B 不发生的概率与B 发生且A 不发生的概率相等,则A 发生的概率为: ; 3、一间宿舍内住有6个同学,求他们之中恰好有4个人的生日在同一个月份的概率: ;没有任何人的生日在同一个月份的概率 ; 4、已知随机变量X 的密度函数为: ,0 ()1/4,020,2 x Ae x x x x ??

(完整版)概率论与数理统计课程标准

《概率论与数理统计》课程标准 一、课程概述 (一)课程定位 《概率论与数理统计》(Probability Theory and Mathematical Statistics),由概率论和数理统计两部分组成。它是研究随机现象并找出其统计规律的一门学科,是广泛应用于社会、经济、科学等各个领域的定量和定性分析的科学体系。从学科性质讲,它是一门基础性学科,它为建筑专业学生后继专业课程的学习提供方法论的指导。 (二)先修后续课程 《概率论与数理统计》的先修课程为《高等数学》、《线性代数》等,这些课程为本课程的学习奠定了理论基础。 《概率论与数理统计》的后续课程为《混凝土结构设计》、《地基与基础》等课程。通过该课程的学习可为这些课程中的模型建立等内容的知识学习奠定良好的基础,在教学中起到了承上启下的作用。 二.课程设计思路 本课程的基本设计思路是极力用较为通俗的语言阐释概率论的基本理论和数理统计思想方法;理论和方法相结合,以强调数理统计理论的应用价值。总之,强调理论与实际应用相结合的特点,力求在实际应用方面做些有益的探索,也为其它学科的

进一步学习打下一个良好的基础。 三、课程目标 《概率论与数理统计》是一门几乎遍及所有的科学技术领域以及工农业生产和国民经济各部门之中。通过学习该课程使学生掌握概率、统计的基本概念,熟悉数据处理、数据分析、数据推断的各种基本方法,并能用所掌握的方法具体解决工程实践中所遇到的各种问题。 (一)能力目标 力求在简洁的基础上使学生能从整体上了解和掌握该课程的内容体系,使学生能够在实际工作中、其它学科的学习中能灵活、自如地应用这些理论。 (二)知识目标 1.理解掌握概率论中的相关概念和公式定理; 2.学会应用概率论的知识解决一些基本的概率计算; 3.理解数理统计的基本思想和解决实际问题的方法。 (三)素质目标 1.培养学生乐于观察、分析、不断创新的精神; 2.培养具有较好的逻辑思维、较强的计划、组织和协调能力; 3.培养具有认真、细致严谨的职业能力。 四、课程内容 根据能力培养目标的要求,本课程的主要内容是随机事件、随机变量、随机向量、数字特征、极限定理。具体内容和学时分配见表4-1。 表4-1 课程内容和学时分配

概率论与数理统计第一章答案

习题一 1. 用三个事件 ,,A B C 的运算表示下列事件: (1) ,,A B C 中至少有一个发生;(2),,A B C 中只有A 发生; (3) ,,A B C 中恰好有两个发生;4),,A B C 中至少有两个发生; (5),,A B C 中至少有一个不发生;(6) ,,A B C 中不多于一个发生. 解:(1)A B C (2)ABC (3) ABC ABC CAB (4) AB BC CA (5) A B C (6) AB BC C A 2. 在区间[0,2]上任取一数x , 记 1{|1},2A x x =<≤ 13{|}42B x x =≤≤,求下列事件的表达式: (1)AB ; (2)AB ; (3) A B . 解:(1) {|1412132}x x x ≤≤<≤或 (2)? (3){|014121x x x ≤<<≤或 3. 已知 ()0.4,()0.2,()0.1P A P BA P CAB ===,求()P A B C . 解:0.2()()P A P AB =-, 0.1()(())()()()()()()P C AB P C A B P C P CA CB P C P CA P CB P ABC -=-=-=--+ ()()()()()()()()P A B C P A P B P C P AB P BC P CA P ABC =++---+ = 0.40.20.10.7++= 4. 已知()0.4,()0.25,()0.25P A P B P A B ==-=,求()P B A -与 ()P AB .

解: ()()()0.25P A B P A P AB -=-=, ()0.15P AB =, ()()()0.250.150.1P B A P B P AB -=-=-=, ()()1()()()P AB P A B P A P B P AB ==--+ 10.40.250.150.5=--+= 5.将13个分别写有,,,,,,,,,,,,A A A C E H I I M M N T T 的卡片随意地排成一行,求恰好排单词“MATHEMATICIAN ”的概率. 解:232224813!13!p ????= = 6. 从一批由45件正品、5件次品组成的产品中任取3件产品,求其中恰好有1件次品的概率. 解: 1254535099392C C p C == 7. 某学生研究小组共有12名同学,求这12名同学的生日都集中在第二季度(即4月、5月和6月)的概率. 解: 12 12312p =: 8. 在100件产品中有5件是次品,每次从中随机地抽取1件,取后不放回,求第三次才取到次品的概率. 解:设i A 表示第i 次取到次品,1,2,3i =, 12395945()0.0461009998P A A A == 9. 两人相约7点到8点在校门口见面,试求一人要等另一人半小时以上的概率. 解: 1112122214p ???== 10. 两艘轮船在码头的同一泊位停船卸货,且每艘船卸货都需要6小时.假设它们在一昼夜的时间段中随机地到达,求两轮船中至少有一轮船在停靠时必须等待的概率. 解:22246371( )1()24416p -=-=-=

概率论与数理统计课本_百度文库

第二章随机变量及其分布第一节随机变量及其分布函数 一、随机变量 随机试验的结果是事件,就“事件”这一概念而言,它是定性的。要定量地研究随机现象,事件的数量化是一个基本前提。很自然的想法是,既然试验的所有可能的结果是知道的,我们就可以对每一个结果赋予一个相应的值,在结果(本事件)数值之间建立起一定的对应关系,从而对一个随机试验进行定量的描述。 例2-1 将一枚硬币掷一次,观察出现正面H、反面T的情况。这一试验有两个结果:“出现H”或“出现T”。为了便于研究,我们将每一个结果用一个实数来代表。比如,用数“1”代表“出现H”,用数“0”代表“出现T”。这样,当我们讨论试验结果时,就可以简单地说成结果是1或0。建立这种数量化的关系,实际上就相当于引入一个变量X,对于试验的两个结果,将X的值分别规定为1或0。如果与样本空间 { } {H,T}联系起来,那么,对于样本空间的不同元素,变量X可以取不同的值。因此,X是定义在样本空间上的函数,具体地说是 1,当 H X X( ) 0,当 T 由于试验结果的出现是随机的,因而X(ω)的取值也是随机的,为此我们称 X( )X(ω)为随机变量。 例2-2 在一批灯泡中任意取一只,测试它的寿命。这一试验的结果(寿命)本身就是用数值描述的。我们以X记灯泡的寿命,它的取值由试验的结果所确定,随着试验结果的不同而取不同的值,X是定义在样本空间 {t|t 0}上的函数 X X(t) t,t 因此X也是一个随机变量。一般地有 定义2-1 设 为一个随机试验的样本空间,如果对于 中的每一个元素 ,都有一个实数X( )与之相对应,则称X为随机变量。 一旦定义了随机变量X后,就可以用它来描述事件。通常,对于任意实数集合L,X在 L上的取值,记为{X L},它表示事件{ |X( ) L},即 。 {X L} { |X( ) L} 例2-3 将一枚硬币掷三次,观察出现正、反面的情况。设X为“正面出现”的次数,则X是一个随机变量。显然,X的取值为0,1,2,3。X的取值与样本点之间的对应关系如表2-1所示。 表2-1 表2-1

概率论和数理统计第二章课后习题答案解析

概率论与数理统计课后习题答案 第二章 1.一袋中有5 只乒乓球,编号为1,2,3,4,5,在其中同时取3只,以X 表示取出的3只 球中的最 大号码,写出随机变量X 的分布律. 【解】 35 35 24 35 3,4,51 (3)0.1C 3(4)0.3C C (5)0.6 C X P X P X P X ====== ==== 2.设在15只同 类型零件中有2只为次品,在其中取3次,每次任取1只,作不放回抽样,以X 表示取出 的次品个数,求: (1) X 的分 布律; (2) X 的分 布函数并作图; (3) — 133{},{1},{1},{12}222 P X P X P X P X ≤<≤≤≤<<. 【解】 31331512213 3151133 150,1,2. C 22 (0). C 35 C C 12(1). C 35 C 1 (2).C 35 X P X P X P X ========== 故X 的分布律为

(2) 当x <0时, F (x )=P (X ≤x )=0 当0≤x <1时 ,F (x )=P (X ≤x )=P (X =0)= 2235 当1≤x <2时 ,F (x )=P (X ≤x )=P (X =0)+P (X =1)=3435 当x ≥2时, F (x )=P (X ≤x )=1 故X 的分布函 数 0, 022 ,0135 ()34,12351,2x x F x x x

概率论和数理统计期末考试题库Word版

数理统计练习 一、填空题 1、设A 、B 为随机事件,且P (A)=0.5,P (B)=0.6,P (B A)=0.8,则P (A+B)=__ 0.7 __。 2、某射手对目标独立射击四次,至少命中一次的概率为 8180,则此射手的命中率3 2。 3、设随机变量X 服从[0,2]上均匀分布,则=2)] ([)(X E X D 1/3 。 4、设随机变量X 服从参数为λ的泊松(Poisson )分布,且已知)]2)(1[(--X X E =1,则=λ___1____。 5、一次试验的成 功率为p ,进行100次独立重复试验,当=p 1/2_____时 ,成功次数的方差的值最大,最大值为 25 。 6、(X ,Y )服从二维正态分布),,,,(2 22121ρσσμμN ,则X 的边缘分布为 ),(2 11σμN 。 7、已知随机向量(X ,Y )的联合密度函数 ?????≤≤≤≤=其他 , 010,20, 2 3 ),(2y x xy y x f ,则 E (X )=3 4。 8、随机变量X 的数学期望μ=EX ,方差2σ=DX ,k 、b 为常数,则有)(b kX E += ,k b μ+;)(b kX D +=22k σ。 9、若随机变量X ~N (-2,4),Y ~N (3,9),且X 与Y 相互独立。设Z =2X -Y +5,则Z ~ N(-2, 25) 。 10、θθθ是常数21? ,?的两个 无偏 估计量,若)?()?(21θθD D <,则称1?θ比2 ?θ有效。 1、设A 、B 为随机事件,且P (A )=0.4, P (B )=0.3, P (A ∪B )=0.6,则P (B A )=_0.3__。 2、设X B (2,p ),Y B (3,p ),且P {X ≥ 1}=9 5,则P {Y ≥ 1}=27 19。 3、设随机变量X 服从参数为2的泊松分布,且Y =3X -2, 则E (Y )=4 。 4、设随机变量X 服从[0,2]上的均匀分布,Y =2X +1,则D (Y )= 4/3 。 5、设随机变量X 的概率密度是: ?? ?<<=其他 103)(2 x x x f ,且{}784 .0=≥αX P ,则α=0.6 。 6、利用正态分布的结论,有 ? ∞ +∞ ---=+-dx e x x x 2 )2(22 )44(21 π 1 。

最新概率论与数理统计期末考试卷附答案

概率论与数理统计期末考试卷 课程名称: 概率论与数理统计 考试时间 专业 班 学号 姓名 一、填空题(每格3分,共18分) 1. 设 3 1)()()(321= ==A P A P A P ,321,,A A A 相互独立,则(1)321,,A A A 至少出现一 个的概率为_ __;(2)321,,A A A 恰好出现一个的概率为_ _ _。 2. 设)2,1(~2N X ,)1(~P Y ,6.0=XY ρ,则=+-2)12(Y X E __ ____。 3.设Y X ,是相互独立的两个随机变量,它们的分布函数分别为)(x F X ,)(y F Y 则 },max{Y X Z =的分布函数是 。 4.若随机变量X 服从正态分布),(2 σμN ,20 21,,,X X X Λ是来自X 的一个样本,令 ∑∑==-=20 11 101 43i i i i X X Y ,则Y 服从分布 。 5. 若对任意给定的0>x ,随机变量y 的条件概率密度???>=-其它 ,00,)(y xe x y f xy z y 则 y 关于x 的回归函数==)(x x y μμ . 二、单项选择题(每小题2分,共10分)

1. 设函数)(x f 在区间],[b a 上等于x sin ,而在此区间外等于0,若)(x f 可以做为某连续型随机变量X 的密度函数,则区间],[b a 为( )。 (A) ]2,0[π ; (B) ],0[π; (C) ]0,2 [π - ; (D) ]2 3, 0[π 。 2. 假设随机变量X 的概率密度为)(x f ,即)(~x f X ,期望μ与方差2 σ都存在,样本)1(,,,21>n X X X n Λ取自X ,X 是样本均值,则有( ) (A) )(~x f X ; (B) )(~min 1x f X i n i ≤≤; (C) )(~max 1x f X i n i ≤≤ ; (D) )(~ ),,,(1 21∏=n i i n x f X X X Λ。 3. 总体2 ~(,)X N μσ,2σ已知,n ≥( )时,才能使总体均值μ的置信度为0.95 的置信区间长不大于L 。(975.0)96.1(=Φ) (A )2215/L σ; (B )22 15.3664/L σ; (C )22 16/L σ; (D )16。 4. 对回归方程的显著性的检验,通常采用3种方法,即相关系数检验法,-F 检验法 和-t 检验法,下列说法正确的( )。 (A) F 检验法最有效; (B) t 检验法最有效; (C) 3种方法是相通的,检验效果是相同的; (D) F 检验法和t 检验法,可以代替相关系数的检验法。 5.设n X X X ,,,21Λ来自正态总体),(2 σμN 的样本(2 σ已知),令n X u /σμ -= ,并且2 1α - u 满足 απ αα-=?- - --121 2 12 122 /dx e u u x (10<<α),则在检验水平α下, 检验00:μμ=H 时,第

天津理工大学概率论与数理统计第二章习题答案详解

第2章一维随机变量 习题2 一. 填空题: 1.设 离 散 型 随 机 变 量 ξ 的 分 布 函 数 是 (){}x P x F ≤=ξ, 则 用 F (x) 表 示 概 {}0x P =ξ = __________。 解:()()000--x F x F 2.设 随 机 变 量 ξ 的 分 布 函 数 为 ()()+∞<<∞-+= x arctgx x F π 1 21 则 P{ 0<ξ<1} = ____14_____。 解: P{ 0<ξ<1} = =-)0(F )1(F 1 4 3.设 ξ 服 从 参 数 为 λ 的 泊 松 分 布 , 且 已 知 P{ ξ = 2 } = P{ ξ = 3 }, 则 P{ ξ = 3 }= ___ 278 3 e - 或 3.375e -3____。 4.设 某 离 散 型 随 机 变 量 ξ 的 分 布 律 是 { }???===,2,1,0,! k k C k P K λξ, 常 数 λ>0, 则 C 的 值 应 是 ___ e -λ _____。 解: {}λλλλξ-∞ =∞ =∞==?=?=?=?==∑ ∑∑e C Ce k C k C k P K K K K K 11! 1! 10 5 设 随 机 变 量 ξ 的 分 布 律 是 {}4,3,2,1,21=?? ? ??==k A k P k ξ 则 ??????<<252 1 ξP = 0.8 。 解: ()A A k P k 1615 1618141214 1 =??? ??+++==∑=ξ 令 15161A = 得 A =1615 ()()21252 1 =+==??? ??<<ξξξp p P 8.041211516=??????+= 6.若 定 义 分 布 函 数 (){ }x P x F ≤=ξ, 则 函 数 F(x)是 某 一 随 机 变 量 ξ 的 分 布 函 数 的 充 要 条 件 是 F ( x ) 单 调 不 减 , 函 数 F (x) 右 连 续 , 且 F (- ∞ ) = 0 , F ( + ∞ ) = 1

相关文档
相关文档 最新文档