文档库 最新最全的文档下载
当前位置:文档库 › 第四章大数定律和中心极限定理

第四章大数定律和中心极限定理

第四章大数定律和中心极限定理
第四章大数定律和中心极限定理

第四章 大数定律和中心极限定理

教学内容:本章主要讲述契比雪夫不等式,契比雪夫大数定律,贝努里大数定律和中心极限定理等内容.

教学重点:讲清大数定律的条件、结论和中心极限定理的条件、结论。

教学难点:随机变量序列的两种收敛性及大数定律和中心极限定理的应用。

在本课程一开始引入概率这个概念时,我们曾经指出,频率是概率的反映,随着观察次数n 的增大,频率将会逐渐稳定到概率。还曾经指出,当n 很大时,频率会概率是会非常“靠近”的,某些读者可能早就有了疑问:这里说的“逐渐稳定”和非常“靠近”究竟是什么意思?与数学分析中的极限概念有关系吗?这个问题提得非常好,前面提到的“逐渐稳定”和非常“靠近”都只是一种直观的说法,它的严格的数学家意义确实需要我们进一步阐明,本章就是要讨论这一类问题。

第一节 切比雪夫不等式

一、 契比雪夫不等式(Chebyshev inequality )

设随机变量X 的均值()E X 及方差()D X 存在,则对于任意正数ε,有不等式

2

2}|)X (E X {|P ε

σ≤ε≥-

或221}|)X (E X {|P ε

σ-

≥ε<- 成立。

我们称该不等式为契比雪夫(Chebyshev )不等式。

证明:(我们仅对连续性的随机变量进行证明)设()f x 为X 的密度函数,记μ=)X (E ,

2

)(σ=X D

?

?

≥-≥--≤

=

≥-εμε

με

μεx x dx

x f x dx x f X E X P )()

()(}|)({|2

2

2

2

2

2

2

)

(1

)()(1

ε

σε

με

X D dx x f x =

?≤

-≤?

+∞

-

从定理中看出,如果()D X 越小,那么随机变量X 取值于开区间((),())E X E X εε-+中的概率就越大,这就说明方差是一个反映随机变量的概率分布对其分布中心(distribution center)()E X 的集中程度的数量指标。

利用契比雪夫不等式,我们可以在随机变量X 的分布未知的情况下估算事件

{}()X

E X ε

-<的概率。

【例1】设随机变量X 的数学期望()10E X =,方差()0.04D X =,估计{}9.211

P X <<的大小。 解:

{}{}{}9375

.0)

8.0(04.018.0101108.0112.92

=-

≥<-≥<-<-=<

因而 {}9.211P X <<不会小于0.9375.

第二节 大数定理

概率论中用来阐明大量随机现象平均结果的稳定性的一系列定理称为大数定理。 定义4.1 依概率收敛

设{Xn}为随机变量序列,a 为随机变量,若任给ε>0, 使得

1}|a

X {|P lim n n =ε<-∞

则称{Xn}依概率收敛于a. 可记为

?→?P

n X a

意思是:当∞→n 时,Xn 落在)a ,a (ε+ε-内的概率越来越大。 定理4.1(切比雪夫大数定律)

设相互独立的随机变量12,,,,n X X X 分别具有均值1(),E X 2(),E X ,(),n E X 及方差12(),(),,(),n D X D X D X ,并且方差有共同的上界,即 D (Xi ) ≤K ,i =1,2, …,

则对于任意正整数ε,有

1

)(11

lim 11

=???

???<-

==∞

→εn

k k n

k k n X E n

X n

P

∑∑==?→

?n

1

i i

P

n

1

i i

EX n

1

X n

1

证明:∑∑==ε<-n

1i n

1

i i

i

}|)X n

1

(

E X n

1

{|

P

∑∑==ε<-

=n

1i n

1

i i

i

}|)X (E n

1

X n

1

{|

P

2

n

1

i i

)

X

n

1(D 1ε

-

≥∑= 2

2n

1

i i

n )

X

(D 1ε

-

=∑= )n (1n nM 12

2

∞→→ε

-

1}|)X n

1

(

E X n

1

{|

P n

1

i n

1i i

i

≤ε<-∑∑== 又

所以∑∑==∞

→=ε<-

n

1

i n

1

i i

i

n 1}|)X (E n

1

X n

1

{|

P lim

切比雪夫大数定律表明,n 个相互独立的随机变量,在定理的条件下,它们的算术均值

∑=n

1

i i

X

n

1

随n 的增大,将几乎必然地密集在该平均值的数学期望

∑=n

1

i i

EX n

1

的附近。

推论:设{Xk,k=1,2,...}为独立的随机变量序列,且有相同的数学期望μ,及方差σ2

>0,则

μ?→?=

∑=P

n

1

k k

n X n

1

Y

即若任给ε>0, 使得

1}|Y {|P lim n n =ε<μ-∞

证明:由切比雪夫不等式

.)Y (D 1}|)Y (E Y {|P 2

n n n ε

-

≥ε<-

这里μ==

∑=n

1

k k

n )X (E n

1

)Y (E

n

)X

(D n

1)Y (D 2

n

1

k k

2

n σ

=

=

∑=

故.n 1}|Y {|P 2

2n ε

σ

-

≥ε<μ-

1}|Y {|P lim n n =ε<μ-∞

定理4.2 伯努里大数定律

设进行n 次独立重复试验,每次试验中事件A 发生的概率为p ,记fn 为n 次试验中事件A 发生的频率,则

∞→→n p

f p

n

证明:设

不发生次试验第发生次试验第A A i i 01X i ?

??=

则)p 1(p )X (D ,p )X (E i i -==

由切比雪夫大数定理

p n

X

f P

n

1

i i

n →=

∑=

贝努里大数定律是切比雪夫大数定律的特例。它是1713年由贝努里提出的概率极限定理中的第一个大数定律。

上面介绍的几种大数定律,由于在它们的证明中,均以切比雪夫不等式为基础,所以都有随机变量的方差是存在的假定。但是,进一步的研究表明,在独立同分布的情况下,方差存在这个条件并非是必要的。下面的辛钦大数定律便说明了这一点。 定理4.3 辛钦大数定律

若{Xk,k=1.2,...}为独立同分布随机变量序列, EXk=μ <∞, k=1,2,… 则

μ?→?=

∑=P

n

1

k k

n X n

1

Y

推论:若{Xi,i=1.2,...}为独立同分布随机变量序列, E(X1k)= <∞,则

)X (E X n

1

k

1P n

1

i k i

?→?∑=

注:贝努里大数定律是辛钦大数定律的特例。

辛钦大数定律的数学意义:辛钦大数定律为实际生活中经常采用的算术平均值法提供了理论依据。它断言:如果诸i ξ是具有数学期望、相互独立、同分布的随机变量,则当n 充

分大时,算术平均值

n

n

ξξξ+++ 21一定以接近1的概率落在真值a 的任意小的邻域内。

据此,如果要测量一个物体的某指标值a ,可以独立重复地测量n 次,得到一组数据:

n x x x ,,,21 ,当n 充分大时,可以确信n

x x x a n

+++≈

21,且把

n

x x x n

+++ 21作

为a 的近似值比一次测量作为a 的近似值要精确的多,因a E i =ξ,a n E n

i i =??

?

??∑=1

1

ξ;但

2

σξ=i D ,n n

D n i i

2

11

σξ=??

?

??∑=,即∑=n

i i n 1

1ξ关于a 的偏差程度是一次测量的偏差程度的

n

1,

n 越大,偏差越小。再比如要估计某地区小麦的平均亩产量,只要收割一部分有代表性的地

块,计算它们的平均亩产量,这个平均亩产量就是

∑=n

i i

n

1

1

ξ,在n 比较大的情形下它可以作

为全地区平均亩产量,即亩产量的期望a 的一个近似。这种近似或“靠近”并不是我们数学

分析中的极限关系,而是依概率收敛原理。

辛钦大数定律也是数理统计学中参数估计理论的基础,通过第六章的学习,我们对它会有更深入的认识。

第三节 中心极限定理

概率论中有关论证独立随机变量的和的极限分布是正态分布的一系定理,称为中心极限定理。

设{Xn}为随机变量序列,X 为随机变量,其对应的分布函数分别为Fn(x), F(x).若在F(x)的连续点,有

),x (F )x (F lim n n =∞

则称{Xn}依分布收敛于X. 可记为.X X w

n ?→?

.

}X {),

1,0(N ~Y .v .r Y ,X Y n n

1

k w

*n n k n 满足中心极限定理

则称的标准化若现令ξ?→?=∑=

一、中心极限定理的客观背景

在实际问题中,常常需要考虑许多随机因素所产生总影响。例如:炮弹射击的落点与目标的偏差,就受着许多随机因素的影响。如瞄准时的误差,空气阻力所产生的误差,炮弹或炮身结构所引起的误差等等。对我们来说重要的是这些随机因素的总影响。

自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见。观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大。则这种量一般都服从或近似服从正态分布。

现在我们就来研究独立随机变量之和所特有的规律性问题。当n 无限增大时,这个和的极限分布是什么呢?在什么条件下极限分布会是正态的呢?

由于无穷个随机变量之和可能趋于∞,故我们不研究n 个随机变量之和本身而考虑它的标准化的随机变量

∑∑∑===-=

n

1

k k n

1

k n

1k k k

n )

X (D )

X (E X

Z 的分布函数的极限。

考虑 ∑∑∑===-=

n

1

k k n

1

k n

1k k k

n )

X (D )

X (E X

Z 的分布函数的极限分布

可以证明,满足一定的条件,上述极限分布是标准正态分布。

二、几个常用的中心极限定理

1.独立同分布中心极限定理(Levy-Lindeberg)

设{Xn}为独立同分布随机变量序列,若EXk=μ<∞,DXk=σ2<∞,k=1,2,…,则{Xn}满足中心极限定理。

根据上述定理,当n 充分大时

?

∑∞

--

=

σ

μ-Φ≈≤x

2

t

n

1

i i dt e

21)n n x (

}x X {p 2

2.德莫佛-拉普拉斯中心极限定理(De Moivre-Laplace

设随机变量ηn(n=1, 2, ...)服从参数为n,p(0

).1,0(N ~npq

np w

n ξ?→?-η

证明:设

不发生次试验第发生

次试验第A A i i 01X i ?

?

?= 则∑==

η-==n

1

i i

n i i X

),p 1(p )X (D ,p )X (E

由中心极限定理,结论得证。

3.李雅普诺夫(liapunov)中心极限定理

设{Xn}为独立的随机变量序列,若EXk=μk <∞,DX k = σk 2<∞,k=1,2, …,记

→→-δσ

=∑∑=δ+=n ,

0u X

E B

1,0,B n 1

i i i

2n

n

1i 2i

2n

使

若存在

则对任意实数x,有

dt

e

21x B u X P lim x X D X E X P lim 2

t

x

n

n

1

i n

1

i i

i n n

1i i n 1i n 1i i i n 2

-

-==∞→===∞→?

∑∑∑π

=

???

??

?

??≤-=??????????????≤?

?? ????? ??- 该中心定理告诉我们,一个随机变量,如果它是由大量相互独立的随机因素共同作用的结果,而其中每个随机因素的作用相对微小,则这一随机变量将近似服从正态分布。

由于此类情形在客观世界中是相当普遍的,因而正态分布广泛存在,也确立了正态分布在概率统计的理论与实际应用中的特殊地位。

【例2】将一颗骰子连掷100次,则点数之和不少于500的概率是多少?

解:设X k 为第k 次掷出的点数,k=1,2,…,100,则X 1,…,X 100独立同分布。

12

354

49k 6

1

)X (D ,2

7)X (E 6

1

i 2

11=

-

=

=

∑=

由中心极限定理

?

???

?

?

???-Φ-≈≥∑

=1235

10271005001}500X {P 100

1

i i 0)78.8(1≈Φ-=

【例3】根据以往经验,某种电器元件的寿命服从均值为100小时的指数分布。现随机地取16只,设它们的寿命是相互独立的。求这16只元件的寿命的总和大于1920小时的概率。 解:设第i 只元件的寿命为X i , i =1,2, …,16,由题给条件知,诸X i 独立,且E (X i )=100,

D (X i )=10000,则16只元件的寿命的总和为∑==

16

1

k k

X

Y ,依题意,所求为P (Y >1920)。

由于E (Y )=1600,D (Y )=160000 由中心极限定理,

400

1600Y -近似N (0,1)

P(Y >1920)=1-P(Y ≤1920)≈1-)400

1600

1920(

-Φ=1-Φ(0.8)=1-0.7881=0.2119

【例4】(供电问题)某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换工件等常需停车。设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1千瓦。问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产? 解:对每台车床的观察作为一次试验,每次试验观察该台车床在某时刻是否工作,工作的概率为0.6,共进行200次试验。用X 表示在某时刻工作着的车床数,依题意,X ~B (200,0.6), 现在的问题是:求满足P (X ≤N )≥0.999的最小的N 。由德莫佛-拉普拉斯极限定理)

p 1(np np X --近似N (0,1),

于是

P (X ≤N )= P (0≤X ≤N )

)48

120(

)48

120

N (

-Φ--Φ≈)48

120

N (

-Φ≈

由)48

120

N (

-Φ≥0.999,查正态分布函数表得999.0)1.3(=Φ,故

48

120

N -≥3.1,

即所求N=142。也就是说,应供应142 千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产。

小 结

中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实。

在后面的课程中,我们还将经常用到中心极限定理。

概率论与数理统计:中心极限定理

中心极限定理 无论随机变量12,,,, n X X X 服从什么分布,当n 充分大时,其和的极限分布是正 态分布,这就是我们今天要讲的中心极限定理。 定理 5.5(独立同分布中心极限定理)设随机变量12,,,,n X X X 相互独立,服从同一 分布,且具有数学期望和方差2 (),()0,i i E X D X μσ==>1,2,i =,则随机变量之和1 n i i X =∑的标 准化变量 n i n X n Y μ -= ∑ 的分布函数()n F x 对于任意X 满足 2/2lim ()lim d ()n i x t n n n X n F x P x t x μΦ-→∞→∞ ?? -??? =≤==????? ∑? 定理 5.5表明,对于均值为,μ方差为2 0σ>的独立同分布的随机变量的和1 n i i X =∑的标准 化随机变量,不论12,,,, n X X X 服从什么分布,当n 充分大时,都有 ~(0,1)n i n X n Y N μ-= ∑近似 , 从而,当n 充分大时 21 ~(,)n i i X N n n μσ=∑近似. 定理5.5′ 设随机变量列12,,,,n X X X 相互独立,服从同一分布,且具有数学期望和方差2(),()0,i i E X D X μσ==>1,2, i =,令1 1n n i i X X n == ∑,则当n 充分大时 ~(0,1)N 近似 ,即2~(,/)n X N n μσ近似. 例5.3 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100 g,标准差是10 g,求一盒螺丝钉的重量超过10.2 kg 的概率. 解 设i X 为第i 个螺丝钉的重量,,100,,2,1 =i Y 为一盒螺丝钉的重量,则

考研数学一-概率论与数理统计大数定律和中心极限定理(一).doc

考研数学一-概率论与数理统计大数定律和中心极限定理(一) (总分:48.00,做题时间:90分钟) 一、选择题(总题数:9,分数:9.00) 1.假设随机变量序列X1,…,X n…独立同分布且EX n=0 (A) 0. 1.00) A. B. C. D. 2.设X1,…,X n…是相互独立的随机变量序列,X n服从参数为n的指数分布(n=1,2,…),则下列随机变量序列中不服从切比雪夫大数定律的是 (A) X1,X2/2,…,X n/n,…. (B) X1,X2,…,X n,…. (C) X1,2X2,…,nX n,…. (D) X1,22X2,…,n2X n,…. (分数:1.00) A. B. C. D. 3.假设X n,n≥1n充分大时,可以用正态分布作为S n的近似分布,如果 (A) X n,n≥1相互独立、同分布. (B) X n,n≥I (C) X n,n≥1 (D) X n,n≥1 1.00) A. B. C. D. 4.设X n,n≥1为相互独立的随机变量序列且都服从参数为λ的指数分布,则 1.00) A. B. C.

5.设随机变量X1,…,X n-林德伯格中心极限定理,当n充分大时,S n近似服从正态分布,只要X1,…,X n (A) PX i=m=p m q1-m,m=0,1,…(1≤i≤n). ≤i≤n). ≤i≤n) 1.00) A. B. C. D. 6.假设X1,…,X n,…为独立同分布随机变量序列,且EX n=0,DX n=σ2 (A) 0. 1.00) A. B. C. D. 7.下列命题正确的是 (A) 由辛钦大数定律可以得出切比雪夫大数定律. (B) 由切比雪夫大数定律可以得出辛钦大数定律. (C) 由切比雪夫大数定律可以得出伯努利大数定律. (D) 由伯努利大数定律可以得出切比雪夫大数定律. (分数:1.00) A. B. C. D. 8.设随机变量X1,X2,…,X n,…独立同分布,EX i=μ(i=1,2,…),则根据切比雪夫大数定律,X1,X2,…,X n,…依概率收敛于μ,只要X1,X2,…,X n,… (A) 共同的方差存在. (B) 服从指数分布. (C) 服从离散型分布. (D) 服从连续型分布. (分数:1.00) A. B. C. D. 9.假设天平无系统误差.将一质量为10克的物品重复进行称量,则可以断定“当称量次数充分大时,称量结果的算术平均值以接近于1的概率近似等于10克”,其理论根据是 (A) 切比雪夫大数定律. (B) 辛钦大数定律. (C) 伯努利大数定律. (D) 中心极限定理. (分数:1.00) A.

大数定律与中心极限定理及其应用

重庆三峡学院毕业设计(论文)大数定律与中心极限定理及其应用 分院数学与统计学院 专业数学与应用数学(师范) 班级 10数本1班 学号201006034109 姓名张永东 指导教师陈飞翔 (讲师) 2014年5月10日

目录 摘要.................................................................................................................................................. I ABSTRACT. ..................................................................................................................................II 1大数定律的应用 .. (3) 1.1引言 (3) 1.2预备知识 (3) 1.2.1相关定义 (3) 1.2.2切比雪夫不等式及其应用 (4) 1.3几类重要的大数定律的应用 (4) 1.3.1切比雪夫大数定律及其在测绘方面的应用 (4) 1.3.2伯努利大数定律及其在重复事件方面的应用 (6) 1.3.3辛钦大数定律及其在数学分析方面的应用 (6) 1.4大数定律的意义 (8) 2 中心极限定理的应用 (8) 2.1前言 (8) 2.2几类重要的中心极限定理的应用 (9) 2.2.1林德伯格定理及其在保险方面的应用 (9) 2.2.2列维定理及其在极限求解方面的应用 (10) 2.2.3棣莫弗-拉普拉斯定理及其在实际生活方面的应用 (11) 2.2.4 李雅普诺夫中心极限定理及其在具体分布方面的应用 (14) 3 大数定律和中心极限定理的比较应用 (15) 3.1大数定律和中心极限定理的比较应用 (15) 结论 (16) 致谢 (17) 参考文献 (18)

中心极限定理的创立与发展

中心极限定理的创立与发展 -----杨静邓明立 概率论极限理论是概率论的重要组成部分,是概率论的其他分支和数理统计的重要基础。的概率现象是由于无数的随机因素共同作用的结果---这些因素每一个都起到一点作用,但都没有起到很大的甚至决定性的作用。而极限定理告诉我们,这类多随机因素作用的现象必然会收敛于某个正态分布的概率模型。因此,该定理为人们用正态分布来描述和解决大量的概率问题提供了坚实的理论基础。 现实中有许多随机变量都具有上述特点,比如,大炮的射程受到多种因素影响:炮身结构,炮弹外形,炮弹几炮弹内炸药质量,瞄准的误差,风速,风向的干扰,大炮的使用年限等等,其中每种因素的微小差异对总的影响作用都不大,并且可以看作是互相独立的、互相不影响的。每种因素都会引起一个微小的误差,而炮弹落点的误差就是这许多随机误差的总和所影响的。由此看出,研究随机变量和的极限对于搞清楚随机现象的本质有着极其的重要价值。 在生产和生活中,有许多随机变量的取值呈现出“中间多,两头少,左右对称”的特点。例如,一般来说我国北方男性身高在170厘米左右的居多,而高于180厘米和低于160厘米的较少。或者在生产条件不变的情况下产品的抗压强度、长度、等许多随机变量指标也都存在这样类似的情况。这样的随机变量所服从的分布就是所谓的“正态分布”。许多随机变量服从正态分布。 极限理论中的中心极限定理曾是概率论的中心课题。中心极限定理有很多形式。凡是关于随机变量的数目无限增多时,其和的分布函数在一定的条件下收敛于正态分布函数的任何论断,都称为中心极限定理。 “中心极限定理”这一名称的来源有两种说法。波利亚认为这个定理十分重要,在概率论中具有中心地位,所以他加上了“中心”这一名称,于1920年引入这一术语。另一种说法是,现代法国概率论学派认为极限定理描述了分布函数中心的情况,而不是尾部的情况。 历史上有不少数学家对中心极限定理的研究做出了贡献。中心极限定理的发展主要分为三个阶段。 创立阶段:1733-----1853年 人们通常认为,法国数学家隶莫弗在1733年首次证明了,二项发布近似正态分布。然而,当时正态发布的概念,隶莫弗并不知道自己本质上证明了“中心极限定理”。

中心极限定理及其应用论文

青岛农业大学本科生课程论文 题目:中心极限定理及其应用姓名: 学院: 专业: 班级: 学号: 指导教师: 2012 年06 月27 日

青岛农业大学课程论文任务书 论文题目中心极限定理及其应用 要求完成时间 2012年 07 月 02 日 论文内容(需明确列出研究的问题):研究中心极限定理的目的就是为了更深入的了解中心极限定理,更好的了解中心极限定理的作用,更好地使用它解决现实生活中的问题。 资料、数据、技术水平等方面的要求论文要符合一般学术论文的写作规范,具备学术性、科学性和一定的创造性。文字要流畅、语言要准确、论点要清楚、论据要准确、论证要完整、严密,有独立的观点和见解。内容要理论联系实际,计算数据要求准确,涉及到他人的观点、统计数据或计算公式等要标明出处,结论要写的概括简短。参考文献的书写按论文中引用的先后顺序连续编码。 指导教师签名:年月日

中心极限定理及其应用 信息与计算科学专业(学生姓名) 指导教师(老师姓名) 摘要:中心极限定理在概率论与数理统计中占有重要地位,本文阐述了中心极限定理的内容并简单介绍了它在实际中的应用。 关键词:中心极限定理;正态分布;随机变量

Central limit theorem and its application Student majoring in Information and Computing Science Specialty (学生英文名) Tutor (老师英文名) Abstract:The central limit theorem in probability theory and mathematical statistics plays an important role,this paper expounds the content of the central limit theorem and briefly introduces its application in practice. Key words: Central limit theorem Normal distribution Random variable

中心极限定理及其应用

中心极限定理及其应用 [摘要] 在中心极限定理的基础上,通过实例介绍它的应用。 [关键词] 中心极限定理随机变量应用 中心极限定理是棣莫佛在18世纪首先提出的,至今其内容已经非常丰富。它不仅是概率论中的重要内容,而且还是数理统计中大样本统计推断的理论基础。一种随机现象可能会受到许多不确定因素的影响,如果这些彼此之间没有什么依存关系,且谁也没有特别突出的影响,那么,这些影响的“累积效应”将会使现象近似地服从正态分布。中心极限定理在很一般的情况下证明了,无论随机变量服从什么分布,个随机变量的和当时的极限分布是正态分布。因此,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释在现实中为什么很多数量指标都服从或近似服从正态分布这一事实。在中心极限定理的教学中,通过列举一些用中心极限定理解决问题的实例,能使学生较深地理解中心极限定理的理论与实用价值。 一、两个常用的中心极限定理 根据不同的假设条件,有多个中心极限定理。这里只介绍两个常用的中心极限定理。 定理1 列维—林德伯格(Levy-Lindeberg)定理(独立同分布的中心极限定理) 设随机变量相互独立,服从同一分布,且具有数学期望和方差.则随机变量 的分布函数Fn(x)对于任意x满足 (5.7) 从定理1的结论可知,当n充分大时,有 或者说,当n充分大时,有 如果用表示相互独立的各随机因素。假定它们都服从相同的分布(不论服从什么分布),且都有有限的期望与方差(每个因素的影响有一定限度)。则(5.8)式说明,作为总和这个随机变量,当n充分大时,便近似地服从正态分布。 定理2(棣莫佛-拉普拉斯(De Moivre Laplace)定理) 设随机变量X服从参数为n,p (0<p<1)的二项分布,即,则

中心极限定理的内涵和应用

中心极限定理的涵和应用 在概率论与数理统计中,中心极限定理是非常重要的一节容,而且是概率论与数理统计之间承前启后的一个重要纽带。中心极限定理是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从于正态分布的条件。故为了深化同学们的理解并掌握其重要性,本组组员共同努力,课外深入学习,详细地介绍了中心极限定理的涵及其在生活实践中的应用。 一、独立同分布下的中心极限定理及其应用 在对中心极限定理的研究中,我们不妨由浅入深地来学习,为此我们先来研究一下在独立同分布条件下的中心极限定理,即如下的定理1: 定理l (林德伯格-勒维中心极限定理)设{}n X 是独立同分布的随机变量序列,且0)(,)(2>==σμi i X Var X E 存在,若记 n n X Y n i i n σμ-= ∑=1 则对任意实数y ,有 {}?∞--∞→=Φ=≤y t n n t y y Y P .d e π21)(lim 22 (1) 证明:为证明(1)式,只须证}{n Y 的分布函数列弱收敛于标准正态分布。由定理可知:只须证}{n Y 的特征函数列收敛于标准正态分布的特征函数。为此,设μ-n X 的特征函数为)(t ?,则n Y 的特征函数为 n Y n t t n ??????=)()(σ?? 又因为E(μ-n X )=0,Var(μ-n X )=2σ,所以有()0?'=0,2)0(σ?-=''。于是,特征函数)(t ?有展开式 )(2 11)(2)0()0()0()(22222t o t t o t t +-=+''+'+=σ???? 从而有 =??????+-=+∞→+∞→n n Y n n t o n t t n )(21lim )(lim 22?22t e - 而22 t e -正是N(0,1)分布的特征函数,定理得证。

数理统计作业二__用数学实验的方法验证大数定理和中心极限定理

验证大数定理: 1、实验原理: 证明大数定理即证明样本均值趋近于总体均值。 2、实验步骤: ①在excel中,用公式 =RAND( )*9+1 生成2000个1到10之间的随机数。 ②选择样本的前50个,前100个,前150个…前2000个,分别求出均值。 ③利用excel作出上述求出值的样本均值折线图(图一)和总体均值折线图(图二): 图一 图二 从图一和图二中可以看出样本均值最终趋于水平,即趋于总体均值,大数定理得证。

验证中心极限定理: 1、实验原理: 证明中心极限定理即证明N个独立同分布的随机变量和的极限分布为正态分布。本次实验采用独立同分布于0-1分布B(1,0.5)的随机变量序列E k,k=1,2,3······来验证中心极限定理。因为E k, k=1,2,3······之间是独立同分布,所以 )5.0, ( ~ E n 1 k k n B ∑ =。由中心极 限定理可知,当n的取值足够大时,∑ = n 1 k k E 这一随机变量的分布与正太分 布具有很好的近似,下面用MATLAB软件分别画出n取不同值时∑ = n 1 k k E 的分 布及对应的正太分布的图像,通过对比这两条曲线的相似度来验证中心极限定理。 2、实验步骤: ①当n=10时,对应正态分布为N(5,2.5)。 MATLAB结果图:

MATLAB源程序: MATLAB结果图:

MATLAB源程序: MATLAB结果图:

MATLAB源程序: MATLAB结果图:

MATLAB源程序: ⑤观察得出,当N足够大时,其密度函数服从正态分布,即满足 中心极限定理。

中心极限定理的发展

中心极限定理的创立和发展 1141010113 万帅 关键词:中心极限定理,创立,严格证明,新的发展,三阶段。 引言:这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。该定理为人们用正态分布来描述和解决大量的概率问题提供了坚实的理论基础。 中心极限定理,是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。该定理为人们用正态分布来描述和解决大量的概率问题提供了坚实的理论基础。 “中心极限定理”这一名称的来源有两种说法。波利亚认为这个定理十分重要,在概率论中具有中心地位,所以他加上了“中心”这一名称,于1920年引入这一术语。另一种说法是,现代法国概率论学派认为极限定理描述了分布函数中心的情况,而不是尾部的情况。 历史上有不少数学家对中心极限定理的研究做出了贡献。中心极限定理的发展主要分为三个阶段。 创立阶段:1733-----1853年 人们通常认为,法国数学家隶莫弗在1733年首次证明了,二项发布近似正态分布。然而,当时正态发布的概念,隶莫弗并不知道自己本质上证明了“中心极限定理” 法国数学家拉普拉斯写了很多论文,想推广棣莫弗的工作。他意识到需要一种新的数学技巧,并在1785年成功地发明了这个技巧:特征函数的简单形式和反演公式。拉普拉斯把他的两个主要研究方向结合起来得到了这个方法-----母函数和积分的监禁展开。通过把母函数中的t换成it e ,就得到了特征函数。然而,直到1810年他才发表了特征函数与反演公示的一般理论,并证明了中心极限定理。他之所以推迟到1810年,有一种解释是,从1786年开始,他就专注于《天体力学》的写作,这本书1805年才完成。1810年,拉普拉斯证明了中心极限定理,先是服从均匀发布的连续随机变量的情形,接着是服从任意分布的随机变量。拉普拉斯的证明显然对独立有界的随机变量和成立,证明过程使用了现在所谓的特征函数,或傅里叶变换,即itXEe(t为实数)。在1812年,他先后考虑了对称的、离散的均匀分布,对称的连续分布,任意分布情形。最后,拉普拉斯在他的名著《概率的分析理论》中对任意的p证明了如下中心极限定理:【1】 泊松完善和推广了拉普拉斯关于中心极限定理的证明。在所有考虑的情况里,都假设随机变量是独立的。泊松证明了服从相同分布的随机变量的情况,还推广到服从不同分布的随机变量的情况。1824年,泊松证明了连续随机变量的中心极限定理,并给出了三个反例,其中包括服从柯西分布的随机变量和,这时中心极限定理不成立。受当时传统的影响,泊松没有明确阐明中心极限定理成立的条件。但是,从他的证明和例子中,可以看到,他假设每个变量的方差都是有界的,且不等于零。其他数学家也做了这方面工作,比如贝塞尔和柯西。拉普拉斯等人给出证明的前提假设是,和的分布是有限的,因此所有的矩都存在。他们把结果推广到无限情形,但没有给出证明,并隐含假定了矩的存在。以现在的观点来看,只要沿着拉普拉斯的方向继续下去,法国数学家们是可以给出中心极限定理的严格证明的,比如柯西,他知道特征函数和稳定率。 从当时环境来看,大约1870年代,概率学家还处于心理上的劣势,苦于自己的研究领

(完整word版)概率论与数理统计教程习题(大数定律与中心极限定理)

习题10(切比雪夫不等式) 一.填空题 1. 设随机变量X 的数学期望μ=)(X E ,方差2 )(σ=X D ,则由切比雪夫不等式,得 ≤≥-)3(σμX P . 2. 随机掷6枚骰子,用X 表示6枚骰子点数之和,则由切比雪夫不等式,得≥<<)2715(X P . 3. 若二维随机变量),(Y X 满足,2)(-=X E ,2)(=Y E ,1)(=X D ,4)(=Y D , 5.0),(-=Y X R ,则由切比雪夫不等式,得≤≥+)6(Y X P . 4. 设ΛΛ,,,,21n X X X 是相互独立、同分布的随机变量序列,且0)(=i X E ,)(i X D 一致有界),,,2,1(ΛΛn i =,则=<∑=∞ →)( lim 1 n X P n i i n . 二.选择题 1. 若随机变量X 的数学期望与方差都存在,对b a <,在以下概率中,( )可以由切比雪夫不等式进行取值大小的估计。 ①)(b X a P <<; ②))((b X E X a P <-<; ③)(a X a P <<-; ④))((a b X E X P -≥-. 2. 随机变量X 服从指数分布)(λe ,用切比雪夫不等式估计≤≥ -)1 (λ λX P ( ). ①λ; ②2 λ③4 λ; ④ λ 1 . 三.解答题 1. 已知正常男性成年人的血液里,每毫升中白细胞含量X 是一个随机变量,若7300)(=X E , 2700)(=X D ,利用切比雪夫不等式估计每毫升血液中白细胞含量在5200至9400之间的概率。 2. 如果n X X X ,,,21Λ是相互独立、同分布的随机变量序列,μ=)(i X E ,

大数定理和中心极限定理

大数定理 概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。概率论中讨论随机变量序列的算术平均值向常数收敛的定律。概率论与数理统计学的基本定律之一,又称弱大数理论。 发展历史 1733年,德莫佛—拉普拉斯在分布的极限定理方面走出了根本性的一步,证明了二项分布的极限分布是正态分布。拉普拉斯改进了他的证明并把二项分布推广为更一般的分布。1900年,李雅普诺夫进一步推广了他们的结论,并创立了特征函数法。这类分布极限问题是当时概率论研究的中心问题,卜里耶为之命名“中心极限定理”。20世纪初,主要探讨使中心极限定理成立的最广泛的条件,二三十年代的林德贝尔格条件和费勒条件是独立随机变量序列情形下的显著进展。伯努利是第一个研究这一问题的数学家,他于1713年首先提出后人称之为“大数定律”的极限定理。 表现形式 大数定律有若干个表现形式。这里仅介绍高等数学概率论要求的常用的三个重要定律:?切比雪夫大数定理 设 是一列两两不相关的随机变量,他们分别存在期望 和方差 。若存在常数C使得: 则对任意小的正数ε,满足公式一: 将该公式应用于抽样调查,就会有如下结论:随着样本容量n的增加,样本平均数将接近于总体平均数。从而为统计推断中依据样本平均数估计总体平均数提供了理论依据。 ?伯努利大数定律 设μ是n次独立试验中事件A发生的次数,且事件A在每次试验中发生的概率为P,则对任意正数ε,有公式二: 该定律是切比雪夫大数定律的特例,其含义是,当n足够大时,事件A出现的频率将几乎接近于其发生的概率,即频率的稳定性。 在抽样调查中,用样本成数去估计总体成数,其理论依据即在于此。 ?辛钦大数定律

第五章大数定律及中心极限定理

第五章 大数定律及中心极限定理 第一节引言、第二节大数定律 一、教学目的要求 1.了解大数定律及中心极限定理的提出和发展历史。 2.掌握引理:切贝雪夫不等式。 3.掌握常用的切贝雪夫大数定律、贝努里大数定理、辛钦大数定律的适用条件及定律内容,会解答有关问题。 二、教学方法 讲授法:讲授大数定律、中心极限定理的概念。 演绎法:推导切贝雪夫不等式、定理1,2,3及例题 三、重点难点 重点:掌握切贝雪夫不等式及握常用的大数定律。 难点:大数定律应用具体应用。 四、课时安排:2课时 五、教具准备:多媒体。 六、教学步骤: (一)明确目标:通过问题引入本次课的教学,明确大数定律、中心极限定理的概念,掌握贝雪夫不等式的推导及应用,定理1及2的证明,了解定理3的条件及应用。 (二)教学过程及教学内容: 1问题引入:大数定律及中心极限定理的提出和发展历史 2.内容: (1)定义5.2.1 设ΛΛ,,,,21n X X X 是随机变量序列,记 )(1 21n n X X X n Y +++= Λ, 若存在一个常数序列ΛΛ,,,,21n a a a ,使得对任意正数ε,有 {}1lim =<-∞ →εn n n a Y P 则称随机变量序列{}n X 服从大数定律(Law of Great Numbers )。 (2)定义5.2.2 设ΛΛ,,,,21n X X X 是随机变量序列,a 是一个常数,若对任意正数ε,有 {}1lim =<-∞ →εa X P n n 则称随机变量序列{}n X 依概率收敛(Convergence In Probability)于常数a ,记为:a X P n ?→?。 (3)推论:可以证明:若a X P n ?→? ,b Y P n ?→?,),(y x g 在点),(b a 连续,则有:

中心极限定理及其意义

题目:中心极限定理及意义 课程名称:概率论与数理统计 专业班级: 成员组成: 联系方式: 2012年5月25日 摘要: 本文从随机变量序列的各种收敛与他们的关系谈起,通过对概率经典定理——中心极限定理在独立同分布和不同分布两种条件下的结论做了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性。经过对中心极限定理的讨论,给出了独立随机变量之和的分布用正态分布来表示的理论依据。同样中心极限定理的内容也从独立分布与独立不同分布两个角度来研究。同时通过很多相关的正反例题,进行说明这些定理所给出的条件是否是充要条件;签掉在实际问题中灵活的应用和辨别是否服从我们给出的定理条件。最后了解一些简单简便的中心极限定理在数理统计、管理决策、仅是计算以及保险业务等方面的应用,来进一步的阐明了中心极限定理分支学课中的中重要作用和应用价值。

关键词: 随机变量,独立随机变量,特征函数,中心极限定理 引言: 在客观实际中有许多随机变量,他们是由大量的相互独立的随机因数的综合 影响所形成的,而其中每一个别因数在总的影响中所起的作用都是渺小的,这种随机变量往往近似地服从正态分布,这种现象就是中心极限定理的客观背景。 中心极限定理自提出至今,其内容已经非常丰富。在概率论中,把研究在什么条件下,大量独立随机变量和的分布以正态分布为极限的这一类定理称为中心极限定理。但其中最常见、最基本的两个定理是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。 一、三个重要的中心极限定理 1.独立同分布的中心极限定理 设随机变量??????,,,,21n X X X 相互独立,服从统一分布,具有数学期望和方差 ()()) ,2,1(0,2???=>==k X D X E k k σμ,则随机变量之和 ∑=n k k X 1 的标准化变量, σ μ n n X X D X E X Y n k k n k k n k k n k k n -=?? ? ????? ??-=∑∑∑∑====1 111 的分布函数)(x F n 对于任意x 满足, ()x dt e x n n X P x F t x n k k n n n Φ==????????? ?? ??? ≤-=-∞-=∞→∞→?∑2/1221lim )(lim πσμ 2.李雅普诺夫定理 设随机变量??????,,,,21n X X X 相互独立,它们具有数学期望和方差 ()()) ,2,1(0,2???=>==k X D X E k k k k σμ,

中心极限定理和概率统计

若{}n X 的分布函数序列{()}n F x 与X 的分布函数()F x 有,在任意连续点x , lim ()()n n F x F x →∞ =。 依概率收敛 若0ε?>,有()0n n P X X ε→∞ ->???→。准确的表述是,0ε?>,0δ?>, ,N n N ?>,有()n P X X εδ-><成立 (3)几乎必然收敛 如果有(lim )1n n P X X →∞ ==。准确的表述是,除掉一个0概率集A ,对所有的\A ω∈Ω, 有lim ()()n n X X ωω→∞ =成立。这是概率空间上的点收敛。 定理1。(切贝雪夫大数律){}n X 相互独立,且有相同的期望和方差,(不一定同分布) ()n E X u =2 ()n D X σ=,,n ? 记1 1n n i i Y X n ==∑,则P n Y u ??→。 统计发生——事物某方面的定量记录事前是不确定的,发生后的数据由真值和误差两部分构成,εμ+=X 。X 是数据,μ是真值,ε是误差。导致误差的原因有: 1. 系统性误差:偏离真值的本质性错误,有内在原因所致; 2. 随机性误差:偏离真值的偶然性错误,没有内在原因,是纯偶然因素所致。 总体就是一个特定的随机变量 通过抽样,获得样本,构造样本统计量,由此推断总体中某些未知的信息 从总体中抽样是自由的,且当总体数量足够大,有放回与无放回抽样区别不大,有理由认为,取得的抽样观察值是没有关系的。所以,样本在未抽取前它们是与总体X 同分布的随机变量,且是相互独立的,称此为随机样本。 定义2。设1,,n x x 是取自总体X 的一组样本值, 1(,,)n g x x 是Borel 可测函数,则称随机变量1(,,)n g X X 是一个样本统计量。

大数定理与中心极限定理的关系及应用

本科生毕业论文(设计) 题目大数定律与中心极限定理的 关系及应用 姓名学号 院系数学科学学院 专业数学与应用数学 指导教师职称 2013年4 月16 日 曲阜师范大学教务处制

目录 摘要 (3) 关键词 (3) Abstract (3) Key words (3) 引言 (3) 1 大数定律与中心极限定理的关系 (4) 1.1预备知识 (4) 1.1.1大数定律 (4) 1.1.2中心极限定理 (5) 1.2大数定律与中心极限定理的关系 (6) 1.2.1服从大数定律不服从中心极限定理的例子 (7) 1.2.2服从中心极限定理不服从大数定律的例子 (8) 1.2.3大数定律与中心极限定理均不服从的例子 (9) 2 大数定律与中心极限定理在实际生活中的应用 (10) 2.1 在误差分析中的应用 (10) 2.2 在数学分析中的应用 (11) 2.3 在近似计算中的应用 (13) 2.4 在保险业中的应用 (14) 2.5 在企业管理方面的应用 (15) 结论 (16) 致谢 (16) 参考文献 (17)

大数定律与中心极限定理的 关系及应用 摘要:本文通过对大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性。经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据。另外,叙述了大数定律与中心极限定理之间的关系,同时通过举出很多相关的反例说明二者的关系。最后给出了一些简便的大数定律与中心极限定理在误差分析、数学分析、近似计算、保险业及企业管理等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值。 关键词:大数定律中心极限定理随机变量应用 Relationship and Applications between the Law of Large Number and Central Limit Theorem Student majoring in mathematics and applied mathematics Bai Yanfei Tutor Liu Li Abstract: Based on the law of large numbers and central limit theorem in the independent distribution with the different distribution of both cases, it makes more systematic exposition, and reveals the phenomenon of the random nature of the most fundamental an average of the results of the Stability. Through the central limit theorem discussion, it gives out the random variables and the distribution of the normal distribution. At the same time, it demonstrates the relationship between the two aspects through lots of anti-related examples. Finally, it gives out several aspects of applications of a number of simple law of large numbers and the central limit theorem in error analysis, mathematical analysis, the approximate calculation, the insurance industry and business management to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value. Key words: Laws of large number; Central-limit theorem; Random variables; Applications 引言概率论与数理统计是研究随机现象的统计规律的一门学科,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。大数定律是概率论中一个非常重要的课题,而且是概率论与数理统计之间一个承前启后的重要纽带。大数定律阐明了大量随机现象平均结果具有稳定性,证明了在大样本条件下,样本平均值可以看作总体平均值,它是“算数平均值法则”的基本理论,通俗地说,这个定理就是在试验不变的条件下,重复试验多次,随机事件的频率以概率为稳定值。在现实生活中经常可以见到这一类型的数学模型,比如,我们向上抛一枚硬币,硬币落下后哪一面朝上本来是偶然的,但当我们向上抛硬币的次数足够多时,达到上万次甚至几十万几百万次之后,我们会发现,硬币向上的次数约占总次数的二分之一,偶然中包含着必然。 而中心极限定理是概率论中讨论随机变量序列部分和的分布渐近于正态分

概率论大数定律与中心极限定理

‘、第五章 大数定律与中心极限定理 第一节 大数定律 在第一章中我们已经指出,人们经过长期实践认识到,虽然个别随机事件在某次试验中可能发生也可能不发生,但是在大量重复试验中却呈现明显的规律性,即随着试验次数的增大,一个随机事件发生的频率在某一固定值附近摆动.这就是所谓的频率具有稳定性.同时,人们通过实践发现大量测量值的算术平均值也具有稳定性.而这些稳定性如何从理论上给以证明就是本节介绍的大数定律所要回答的问题. 在引入大数定律之前,我们先证一个重要的不等式——契比雪夫(Chebyshev )不等式. 设随机变量X 存在有限方差D (X ),则有对任意ε>0, P {|X -E (X )|≥ε}≤2) (εX D .(5.1) 证 如果X 是连续型随机变量,设X 的概率密度为f (x ),则有 P {|X -E (X )|≥ε}= ??≥-≥--≤ εεε)(22)()()()(X E x X E x x x f X E x x x f d d ≤[].)()()(1 222?+∞∞-=-ε εX D x x f X E x d 请读者自己证明X 是离散型随机变量的情况. 契比雪夫不等式也可表示成 P {|X -E (X )|<ε}≥1-2) (εX D . 5.2) 这个不等式给出了在随机变量X 的分布未知的情况下事件{|X -E (X )|<ε}的概率的下限估计,例如,在契比雪夫不等式中,令ε=3)(X D ,4)(X D 分别可得到 P {|X -E (X )|<3)(X D }≥0.8889, P {|X -E (X )|<4)(X D }≥0.9375. 例5.1 设X 是掷一颗骰子所出现的点数,若给定ε=1,2,实际计算P {|X -E (X )|≥ε},并验证契比雪夫不等式成立. 解 因为X 的概率函数是P {X =k }=1/6(k =1,2,…,6),所以 E (X )=7/2, D (X )=35/12, P {|X -7/2|≥1=P {X =1}+P {X =2}+P {X =5}+P {X =6}=2/3; P {|X -7/2|}≥2}=P {X =1}+P {X =6}=1/3. ε=1: 2)(εX D =35/12>2/3, ε=2:2) (εX D =1/4×35/12=35/48>1/3.

大数定律及中心极限定理 应用题

大数定律与中心极限定理 应用题 1. 设各零件质量都是随机变量,且独立同分布,其数学期望为0.5kg ,标准差 为0.1kg, 问(1)5000只零件的总质量超过2510kg 的概率是多少?(2)如果用一辆载重汽车运输这5000只零件,至少载重量是多少才能使不超重的概率大于0.975? 解 设第i 只零件重为i X ,500,...,2,1=i ,则5.0=i EX ,21.0=i DX 设 ∑==500 1i i X X ,则X 是这些零件的总重量 250050005.0=?=EX ,5050001.02=?=DX 由中心极限定理 )1,0(~50 2500N X a - (1))2510(≥X P =)50 25002510502500(-≥-X P )2(10Φ-≈=9213.01-=0.0787 (2) 设 汽车载重量为a 吨 )(a X P ≤=)502500502500(-≤-a X P 95.0)50 2500(0≥-Φ≈a 查表得 64.150 2500≥-a 计算得 59.2511≥a 因此汽车载重量不能低于2512公斤 2. 有一批建筑房屋用的木柱,其中80%的长度不小于3m ,先从这批木柱中随 机的取100根,求其中至少有30根短于3m 的概率? 解 设X 是长度小于3m 的木柱根数,则)2.0,100(~b X 由中心极限定理 )16,20(~N X a )30(≥X P =)16 20301620(-≥-X P )5.2(10Φ-≈=9938.01-=0.0062 3. 一个食品店有三种蛋糕出售,由于售出哪一种蛋糕是随机的,因而售出一种 蛋糕的价格是随机变量,它取1元,1.2元,1.5元的概率分别为0.3,0.2,0.5.若售出300只蛋糕,(1)求收入至少400元的概率 (2)售价为1.2元蛋糕售出多于60只的概率。

第四章大数定律和中心极限定理

第四章 大数定律和中心极限定理 教学内容:本章主要讲述契比雪夫不等式,契比雪夫大数定律,贝努里大数定律和中心极限定理等内容. 教学重点:讲清大数定律的条件、结论和中心极限定理的条件、结论。 教学难点:随机变量序列的两种收敛性及大数定律和中心极限定理的应用。 在本课程一开始引入概率这个概念时,我们曾经指出,频率是概率的反映,随着观察次数n 的增大,频率将会逐渐稳定到概率。还曾经指出,当n 很大时,频率会概率是会非常“靠近”的,某些读者可能早就有了疑问:这里说的“逐渐稳定”和非常“靠近”究竟是什么意思?与数学分析中的极限概念有关系吗?这个问题提得非常好,前面提到的“逐渐稳定”和非常“靠近”都只是一种直观的说法,它的严格的数学家意义确实需要我们进一步阐明,本章就是要讨论这一类问题。 第一节 切比雪夫不等式 一、 契比雪夫不等式(Chebyshev inequality ) 设随机变量X 的均值()E X 及方差()D X 存在,则对于任意正数ε,有不等式 22 }|)X (E X {|P εσ≤ε≥- 或22 1}|)X (E X {|P ε σ-≥ε<- 成立。 我们称该不等式为契比雪夫(Chebyshev )不等式。 证明:(我们仅对连续性的随机变量进行证明)设()f x 为X 的密度函数,记μ=)X (E , 2)(σ=X D 则 ??≥-≥ --≤= ≥-ε μ εμεμεx x dx x f x dx x f X E X P )()()(}|)({|2 2 2 22 22 ) (1 )()(1 εσεμεX D dx x f x = ?≤ -≤ ? ∞ +∞ - 从定理中看出,如果()D X 越小,那么随机变量X 取值于开区间((),())E X E X εε-+中的概率就越大,这就说明方差是一个反映随机变量的概率分布对其分布中心(distribution center)()E X 的集中程度的数量指标。 利用契比雪夫不等式,我们可以在随机变量X 的分布未知的情况下估算事件 {}()X E X ε-<的概率。

中心极限定理

心极限定理(上) 骰子和生日 了解中心极限定理 马克.吐温讽刺道:有三种避免讲zhenxiang的方式:谎言,该死的谎言和统计数据。这个笑话很中肯,因为统计信息频繁地看似一个黑匣子——了 解统计定理怎样让通过数据取得结论变成可能,这是有难度的。 但因为不论是喷气发动机可靠性还是安排我们平日看的电视节目的流程,数据分析,类似的任何事情中都扮演着重要角色,所以至少获取对统 计基本理解是重要的。要了解其中一个重要概念是中心极限定理。 在这篇文章中,我们将解释中心极限定理,通过普通的例子,诸如掷骰子和美国职业棒球联赛球员生日来展示如何操作它。 定义中心极限定理 某典型课本对中心极限定理的定义如下:

当样本容量增加时,样本均值X的分布接近均值等于μ,标准差σ/√n 注: μ是总体均值 σ是总体标准差 n是样本大小 换句话说,如果我们多次采用大小为n的独立随机抽样,那么当n足够大的时,样本平均值的分布就接近正态分布。 那么多大才是足够大呢?一般来说,样本容量大于或者等于30认为是足够大,此时中心极限定理起作用。如果总体分布越要接近正态分布,那么需要更多的样本来使用该定理。对于严重不对称的或者有几个模板的总体来说,也许要求更大的样本。 为什么有关呢 从一个总体中收集所有的数据是很难操作或者不可行的,统计学就是基于这个情况产生的。换种方式来做,我们可以从总体中获取数据的子集,然后对这个样本进行统计分析,以得到总体的结论。 举例来说,我们可以从工业生产流程中收集多个随机样本,然后使用各个样本的平均值来推断整个过程的稳定性。 2个常用于解释总体的特征值分别是平均值和标准差。当数据遵循正态分布,均值表示分布的中心位置,标准差揭示分布情况。

相关文档
相关文档 最新文档