文档库 最新最全的文档下载
当前位置:文档库 › 数理统计第6章

数理统计第6章

数理统计第6章
数理统计第6章

第6章数理统计的基本概念

一.本章导学

一.教学目的

1 正确理解总体、个体、简单随机样本、统计量等概念;

2 熟悉样本均值、样本方差和样本的高阶矩。

二.内容提要

主要介绍数理统计的基本概念:总体、样本、统计量和样本的数字特征。

数理统计同概率论一样,其研究对象也是随机现象,但研究方法不同,数理统计是通过对随机现象的观测或试验来获取数据,通过对数据的分析与推断去寻找隐藏在数据中的统计规律性。它是研究怎样以有效的方式收集、整理、分析带随机性的数据,并在此基础上,对所研究的问题做出统计推断,直至对可能作出的决策提供依据或建议。概率论为数理统计提供理论基础。

本章主要介绍数理统计的一些基本概念

第一节

一.个体和总体

统计中常把所研究对象的全体称为总体或母体,构成总体的每个成员称为个体。然而在我们的研究中往往关心的是每一成员的某个数量指标,因而将个体所具有的数量指标的全体作为一个总体,而每一成员的指标就是一个个体。例如,把某月的整批产品视为一总体,则每个产品为个体;若只要检查产品的质量,可用数量表征ξ来反映。产品分别为一、二、三等品,令ξ 取值分别为1、2、3。因此为了更清楚的表示总体,可以用随机变量ξ或其概率分布来表示总体。当用随机变量ξ表示总体时,可以简称总体ξ ,如果ξ的分布函数为F(x),那么F(x)也是总体的分布函数,所以也可以用F(x)表示一个总体。譬如当描述总体的随机变量ξ服从正态分布时,也称该总体为正态总体;今后称“从某总体中抽样”也可称“从某分布中抽样”。

在统计中,用来描述总体的分布通常是未知的,因此确定总体的概率分布就是统计所要研究的一个问题。有的总体的分布类型是已知的,但是其中的参数未知,那时就要研究如何确定总体的参数。在有些问题中,我们对每一研究对象可能要观测两个或多个指标,则可用多维随机向量

去描述总体,也可用其联合分布函数去描述总体,这种总体称为

p维总体。这是“多元分析”中研究的对象。我们主要研究一维总体,有时会涉及二维总体。二.样本

由于总体可以用随机变量ξ来描述,因此研究总体就要研究ξ的分布或分布的某些特征量。这就需要对总体进行观察。从总体中抽出的部分个体组成的集合称为样本(也称为子样),样本中所含个体称为样品,样本中样品的个数称为样本容量(也称样本量)。

例1 对某型号的20辆汽车记录每加仑汽油各自行驶的里程数(单位:公里)如下:

29.8 27.6 28.3 28.7 27.9 30.1 2 9.9 28.0 28.7 27.9

28.5 29.5 27.2 26.9 28.4 27.8 28.0 30.0 29.6 29.1

在样本中常用n表示样本容量,从总体中抽出的容量为n的样本记为ξ=,这

里每个都看成是随机变量,因为第i个被抽到个体具有随机性,在观察前是不知其值的。样本

的观察值记为。样本ξ=所可能取值的全体称为样本空间。一

个样本观察值就是样本空间的一个点。

我们抽取样本的目的是为了对总体进行各种分析推断。为了能从样本正确推断总体就要求所抽取的样本能很好地反映总体的信息,所以要有一个正确的抽取样本的方法。最常用的抽取样本的方法是“简单随机抽样”,它要求抽取的样本满足如下要求:

(1)代表性,即要求每一个体都有同等机会被选入样本,这意味着每个分量与总体ξ有相

同的分布F(x)。

(2)独立性,即要求样本中每一样品取什么值不受其它样品的影响,这意味,

为相互独立的随机变量。

满足上述两点性质的样本称为简单随机样本,获得简单随机样本的抽样方法称为简单随机抽

样。今后若不作特别说明均指简单随机样本,对于简单随机样本ξ=,其分布可由

总体的分布函数F(x)完全决定,的分布函数是

第二节

一.统计量

样本是总体的代表和反映,但样本的信息较为分散,需要加工和提炼,一种有效的方法是构造样本的函数不同的样本函数反映总体的不同特征.。.这种样本的函数便是统计量。

定义 1.2.1 ξ=是取自某总体的一个容量为n的样本,假如样本函数

中不含任何未知参数,则称T为统计量。

上述定义中规定“不含任何未知参数”是强调在获得了样本的观察值后,代入

统计量立即可以算得统计量的观察值

例1 设总体ξ服从N(μ,),其中μ与为未知参数,从该总体获得的一个样本为

,则为统计量,但都不是统计量,因为它们含有未知参数。

二.次序统计量与经验分布

次序统计量是一类常用的统计量,有它可派生一些有用的统计量。

定义1.2.2 设是取自总体ξ的一个样本,被称为该样本的第i个次序统

计量,它是样本的满足如下条件的函数:每当样本得到一组观测值

第i个值是的观测值,称,i=1,…,

时,将它们从小到大排列为

n为该样本的次序统计量,、分别称为该样本的最小、最大次序统计量。

定义1.2.3 样本最大次序统计量与样本最小次序统计量之差称为样本极差,常用R表示。若

样本容量为n,则样本极差。它表示样本取值范围的大小,也反映了总体取值分散与集中的程度,而且计算方便。

表示。设

定义1.2.4 样本按大小次序排列后处于中间位置上的称为样本中位数,常用

是来自某总体的一个样本,其次序统计量为,i=1,…,n,则

定义1.2.5设是来自某总体的一个样本,其次序统计量为,i=1,…,n,样是指由下式决定的统计量:

本的p分位数

式中k的是不超过(n+1)p的最大整数。

例2 由上节例1知数据从小到大排序后为:

26.9 27.2 27.6 27.9 27.9 27.9 28.0 28.0 28.3 28.4

28.5 28.7 28.7 29.1 29.5 29.6 29.8 29.9 30.0 30.1

=26.9,=30.1,==28.45由于5/21<0.25<6/21,

因而

故=27.9+(27.9-27.9)×0.25=27.9 经验分布函数可以用来描述总体分布函数的大致形状。

第二节样本的数字特征及其分布

一、定义1.2.6 设总体ξ的分布函数为F(x),从中获得的样本观测值为

,将

它们从小到大排列成

则称为该样本的经验分布函数。

在x点的函数值其实就是观测值中小于x的频率,它是

经验分布函数

一个左连续的非降函数,且,因而它具有分布函数的性质,可以将它看成是以等的离散随机变量的分布函数。经验分布函数的图象是一个非降左连续的阶梯

概率取

函数。

对于x的每一数值而言,经验分布函数为样本的函数,它是一统计

概率,由于相互独立且有相同的分布函数F(x),因而它等价于n次独立重复试验

的贝努里概型中事件“”发生k次而其余n-k次不发生的概率,即有:

其中,它是总体ξ的分布函数。

二、随样本观测值不同,经验分布函数也不同,但只要样本容量n增大,那么

也将在概率意义下越来越“靠近”总体分布函数F(x),对此不加证明的给出如下定理。

是取自总体分布函数F(x)的

定理1(格里汶科定理)对任给的自然数n,设

一个样本观测值,为其经验分布函数,又记

则有

这一定理中的可衡量与F(x)在x的一切值上的最大差异。定理表明n足够大

后,对一切x,与F(x)之差的绝对值都很小这一事件发生的概率接近于1。

三.样本均值

定义1.3.1 设是取自某总体的一个样本,它的算术平均数称为样

后代入上式,可求得样本均值的观测值,亦简称样本

本均值。当获得了样本观测值

均值:

由于样本中的数据有大有小,而样本均值总处于样本的中间位置,小于的数据的偏

差是负的,大于的数据的偏差是正的,此种偏差之和恒为零,这是因为

。而总体分布数学期望也是位于取值范围的中心位置,且,因此只要样本是简单随机样本,那么样本均值是反映总体分布数学期望所在位

置信息的一个统计量,如果总体数学期望是μ ,那么样本均值将是μ的一个很好的估计量。

在样本来自正态分布场合,其样本均值的分布为

。现在我们来讨论当样本来自非正态总体时,其样本均值的分布。

定理1 设是从某总体随机抽取的一个样本,该总体的分布未知(可能是离

散的,也可能是连续的,可能是均匀分布,也可能是偏态分布等),但知其均值为μ,方差为

(有限且不为0),则当样本量n充分大时,样本均值近似服从正态分布,其均

值仍为μ,方差为/n。

证:由中心极限定理可知。这一定理表明,无论总体分布是什么,只要样本容量n充分大,

则样本均值总可近似看作正态分布。譬如,样本来自,,

则总体期望为p,方差为p(1-p),那么当n充分大时,样本均值近似服从正态分布。

四、样本方差和样本标准差

定义 1.3.2 设是取自某一总体的样本,它关于样本均值的平均偏差平方和

称为样本方差,其算术根称为样本标准差。

在n不大时,常用作为样本方差(也称修正方差),其算术根

称为样本标准差。

当把观察值代入后可得样本方差与样本标准差的观察值:

在实际应用中也简称它们为样本方差和样本标准差。

在后面我们主要用的是与,但在涉及到具体数值计算时一般用小写的与。

样本方差与样本标准差反映了数据取值分散与集中的程度,即反映了总体方差与标准差的信息。

五、样本的高阶矩

定义1.3.3 设是来自某总体的一个样本,则称为

样本的k阶原点矩,称为样本的k阶中心矩。

与k阶中心矩的信息。特别

它们分别反映了总体k阶原点矩

定理2 如果F(x)存在4阶矩,则对样本方差,有

其中分别是总体的二阶和四阶中心矩。

定理3 如果总体存在2k阶矩,则对于样本的k阶原点矩,有

定义1.3.4 设是来自某总体的一个样本,则称为样本偏度。SK

反映了总体分布密度曲线的对称性信息。当SK>0时,分布的形状是右尾长,称为正偏的;当SK<0时,分布的形状是左尾长,称为负偏的。

定义1.3.5 设是来自某总体的一个样本,则称为样本峰度。

KU反映了总体分布密度曲线在其峰值附近的陡峭程度的信息。当KU>0时,分布密度曲线在其峰附近比正态分布来得陡;当KU<0时,比正态分布来得平坦。

例某厂实行计件工资制,为及时了解情况,随机抽取30名工人,调查各自在一周内加工的零件数,然后按规定算出每名工人的周工资如下:(单位:元)

156134 160 141 159 141 161 157 171 155

149144 169 138 168 147 153 156 125 156

135156 151 155 146 155 157 198 161 151

这便是一个容量为30的样本观察值,其样本均值为:

它反映了该厂工人周工资的一般水平。

易得,由于,所以样本方差为

样本标准差为

由于

为此需先求出,, ,而它们可利用下列展开式来求:

为此需先求出

,由于

=23738.5,

=3699818.3, =581404755.3

由此得

=176.25,

=1849.80,

=172273.88

从而求得 SK=0.79 , KU=2.55

该组样本稍呈正偏,右尾较长,在峰处较陡。

备注:

1、这些观察值仍分别称为样本均值, 样本方差, 样本标准差, 样本k 阶(原点)矩以及样本k 阶中心矩

2、经验分布函数 以作出与总体分布函数F (x )相应的统计量----经验分布函数, 它的作法为, 设X 1,X 2,...,Xn 是总体F 的一个样本, 用S (x ),

-∞

例如

(1) 设总体F 具有一个样本值1,2,3, 则经验分布函数F 3(x )的观察值为

.

),(1

)(∞<<∞-=x x S n

x F n ????????≥<≤<≤<=.

3,

1,32,32

,21,3

1,1,0)(3x x x x x F 若若若若

一般, 设x 1,x 2,...,xn 是总体F 的一个容量为n 的样本值. 先将x 1,x 2,...,xn 按自小到大的次序排列, 并重新编号, 设为 x (1)≤x (2)≤...≤x (n ). 则经验分布函数Fn (x )的观察值为

对于经验分布函数Fn (x ), 格里汶科(Glivenko)在1933年证明了以下的结果: 对于任一实数x , 当n ∞→时Fn (x )以概率1一致收敛于分布函数F (x ), 即

因此, 对于任一实数x 当n 充分大时, 经验分布函数的任一个观察值Fn (x )与总体分布函数F (x )只有微小的差别, 从而在实际上可以当作F (x )来使用. 对于任意固定的x , -∞

补充:

(一) c 2分布 设X 1,X 2,...,Xn 是来自总体N (0,1)的样本, 则称统计量

? 服从自由度为n 的c 2分布, 记为c 2~c 2(n ).

? 此处, 自由度是指(2.1)式右端包含的独立变量的个数. c 2(n )分布的概率密度为

c 2分布的可加性 设c 12~c 2(n 1), c 22~c 2(n 2), 并且c 12, c 22独立, 则有

c 12+c 22~c 2(n 1+n 2

c 2分布的数学期望和方差

???????≥<≤<=+.

,1,

,,

,0)()()1()()1(n k k n x x x x x n

k

x x x F 若若若.1}0|)()(|sup lim {==-∞<<∞-∞→x F x F P n x n )

1.2(2

22212n

X X X +++= χ)

2.2(.,

0,0,e )2/(21)(2/12/2

/?????

>Γ=--其它y y n y f y n n

若c 2~c 2(n ), 则有

E (c 2)=n , D (c 2)=2n

c 2分布的分位点 对于给定的正数a , 0

注:实际上许多常用的办公软件都有关于上a 分位点的相应函数, 例如, excel 电子表格的函数

chiinv(a,n)就可以计算给定a,n 值的上a 分位点.

MATLAB 中统计工具箱的相应函数

为:chi2inv(X,V))

(二)t 分布 设X ~N (0,1), Y ~c 2(n ), 且X ,Y 独立, 则称随机变量

? 服从自由度为n 的t 分布, 记为t ~t (n ).

? t 分布又称学生氏(Student)分布, t (n )分布的概率密度函数为

h (t )关于t =0对称, 当n 充分大时其图形类似于标准正态变量概率密度的图形. 不难证明 故当n 足够大时t 分布近似于N (0,1)分布, 但对于较小的n , t 分布与N (0,1)分布相差较大. 由t 分布上a 分位点的定义及h (t )图形的对称性知

t 1-a (n )=-ta (n )

(2.12)

222

()

2

2{()}()d (2.6)

()()n P n f y y n n ααχαχχχχα

>=-------?

)

8.2(/n

Y X

t =

)

9.2(,1)2/(]2/)1[()(2

/)1(2∞

<<-∞???

?

??+Γ+Γ=+-t n t n n n t h n π2

/2e 21)(lim t n t h -∞

→=

π

t 分布的上a 分位点可自附表4查得, 在n >45时, 对于常用的a 的值, 就用正态近似:

ta (n )≈za

注: MATLAB 中统计工具箱的相应函数为:

tinv(X,V))

tinv(0.975,15

(三)F 分布 设U ~c 2(n 1), V ~c 2(n 2), 且U ,V 独立, 则称随机变量

服从自由度为(n 1,n 2)的F 分布, 记为F ~F (n 1,n 2). F 分布的概率密度为

注:在Excel 软件中的函数FINV 可以查出F 分 布的分布函数逆函数, 也就容易查出上a 分位点. MATLAB 中统计工具箱的相应函数为:

finv(X,V1,V2))

若F ~F (n 1,n 2), 按定义

)

14.2(//2

1n V n U F =

)

15.2(.,0,0,)]/(1)[2/()2/()/](2/)[()(2

/)(21211

)2/(2/21212111??

?

??>+ΓΓ+Γ=+-其它y n y n n n y n n n n y n n n n ψ)2(.),(1),(~1

)1(.

),(11),(1

11),(111),(1

1)},({112122112112112112

11ααααααααα=?

??

???>=?

?????>?

?

????>-=??????≥-=??????<=>=------n n F F P n n F F

n n F F P n n F F P n n F F P n n F F P n n F F P 知再由

于是

由(1),(2)式可得F 分布的上a 分位点满足:

(2.18)式常用来求F 分布表中未列出的常用的上a 分位点, 例如

(四)正态总体的样本均值与样本方差的分布

设总体X (不管服从什么分布, 只要均值和方差存在)的均值为m , 方差为s 2, X 1,X 2,...,Xn 是来

自X 的一个样本,则:样本均值,样本方差 E (S 2)=s 2的证明:

定理一 设X 1,X 2,...,Xn 是来自总体N (m ,s 2)的样本, `X 是样本均值, 则有 定理二 设X 1,X 2,...,Xn 是来自总体N (m ,s 2)的样本, `X 和S 2是样本均值和样本方差, 则有 )

18.2(,

)

,(1

),(12211n n F n n F αα=

-.

357.080

.21

)12,9(1)9,12(05.095.0===F F .

)/()(11)()(1111)(2221222122122

σμσμσ=??????+-+-=??

????--=?????

???? ??--=∑∑∑===n n n X nE X E n X n X n E S E n i n i i n i i )./,(~2n N X σμ.)2()

21.2();

1(~)1()

1(2

222

独立与S X n S n --χσ

)

1(~)(),(~)

(,)()()()()()1()(1122

1

2

22

1

2

2222112

2

1

22

---=-++-+-=-=---=∑∑∑∑====n X X

n X

X E X X X X X X X X X S n X X n S n

i i

n

i i

i n n

i i n i i χσχσμμ但

换成如果将上式的因此

定理三 设X 1,X 2,...,Xn 是来自总体N (m ,s 2)的样本, `X 和S 2是样本均值和样本方差, 则有 证 由定理一, 定理二 且两者独立, 由t 分布定义知

定理四

则有

证 (1)由定理二

由假设S 12,S 22独立, 则由F 分布的定义知 )

22.2().

1(~/--n t n

S X μ),1(~)1(),1,0(~/22

2

---n S n N n

X χσσμ).1(~)1()1(/2

2

----n t n S n n

X σσμ1212

121222

11221112

2222

1211

12,,,,,,(,)(,),.

11

,;

11(),()11.

n n n n i i

i i n n i i

i i X X X Y Y Y N N X X Y Y

n n

S X X S Y Y n n μσμσ=====

==

-=---∑∑

∑∑

2212

122212

22

2121222

2112212(1)

~(1,1);

(2),

)~(2),

(1)(1),2

w

w S S F n n X Y t n n n S n S S S n n σσ

σσσ--==+--+-==+- )

1(~)1(),

1(~)1(2222

2

2

212

2

12

11----n S n n S n χσχσ).

1,1(~),1,1(~)1()1()1()1(2122

212

2

21212

2

22

2

2211211--------n n F S S n n F n S n n S n σ

σσσ即

则按t 分布的定义可知

作业:第六章 1,4, 小结2 、5 随堂练习

1 从一批机器零件毛坯中随机抽取8件,测得其重量(单位:kg )为:230,243,185,240,228,196,246,200。(1)写出总体,样本,样本值,样本容量;(2)求样本的均值,方差及二阶原点距。

解: 1(1)总体为该批机器零件重量ξ,样本为

,样本值为230,243,185,240,

228,196,246,200,样本容量为n=8;

2

2

2

21122

122

2

22

21122

1222

~(0,1).

(1)(1)~(1),

~(1),

(1)(1)~(2).

.

X Y U N n S n S n n n S n S V n n U V χχσσχσσ=

------=

+

+- ).

2(~1

1)

()()2().

2(~)1()1().1,0(~11)()(212

121212122

2

2

22

2112121-++

---=

-+-+-+

-=

+---=n n t n n S Y X n n V U n n S n S n V N n n Y X U w μμχσ

σ

σ

μμ

2若样本观察值的频数分别为,试写出计算平均值和样本方差的公式

(这里)。

解:

2

3设某商店100天销售电视机的情况有如下统计资料:

日售出台数 2 3 4 5 6 合计

天数20 30 10 25 15 100

求样本容量n,经验分布函数,样本均值,样本方差,样本修正方差。

解:3(1)样本容量为n=100(2)经验分布函数

样本均值,样本方差,样本修正方差分别为

4 设总体服从泊松分布P(λ),是一样本:(1)写出的概率分

布;(2)计算和;(3)设总体容量为10的一组样本观察值为(1,2,4,3,3,4,5,6,4,8)试计算样本均值, 样本方差和次序统计量的观察值。

解:

4(1)

(2)

(3)

将样本观察值依照从小到大的顺序排列即得顺序统计量的观察值如下:(1,2,3,3,4,4,4,5,6,8)。

5 设总体ξ服从两点分布B(1,p),其中p是未知参数,是来自总

体的简单随机样本。指出之中哪些是统计量,哪些不

解:5

都是统计量,不是统计量,因p是未知参数。

6 设总体ξ服从正态分布,其中已知,未知,是来自

总体的简单随机样本。(1)写出样本的联合密度函数;

(2)指出之中哪些是统计量,哪些不是统计量。

解:6(1)因为ξ服从正态分布,而是取自总体ξ的样本,所以有服从

,即

故样本的联合密度函数为。

(2)都是统计量,因为它们均不包含任何未知参数,

而不是统计量。

天津理工大学概率论与数理统计第六章习题答案详解

第六章 数理统计的基本概念 一.填空题 1.若n ξξξ,,,21 是取自正态总体),(2σμN 的样本, 则∑==n i i n 11ξξ服从分布 )n ,(N 2 σμ . 2.样本),,,(n X X X 21来自总体),(~2 σμN X 则~)(22 1n S n σ - )(1χ2-n ; ~)(n S n X μ- _)(1-n t __。其中X 为样本均值,∑=--=n i n X X n S 122 11)(。 3.设4321X X X X ,,,是来自正态总体).(220N 的简单随机样本, +-=221)2(X X a X 243)43(X X b -,则当=a 20 1=a 时,=b 1001=b 时,统计量X 服从2 X 分布,其自由度为 2 . 4. 设随机变量ξ与η相互独立, 且都服从正态分布(0,9)N , 而12 9(,, ,) x x x 和 129(,,,)y y y 是分别来自总体ξ和η的简单随机样本, 则统计量 ~U = (9)t . 5. 设~(0,16),~(0,9),,X N Y N X Y 相互独立, 12 9 ,, ,X X X 与 1216 ,,,Y Y Y 分别 为X 与Y 的一个简单随机样本, 则22 2 1292 22 1216 X X X Y Y Y ++ +++ +服从的分布为 (9,16).F 6. 设随机变量~(0,1)X N , 随机变量2~()Y n χ, 且随机变量X 与Y 相互独立, 令T =, 则2~T F (1,n ) 分布. 解: 由T =, 得22 X T Y n =. 因为随机变量~(0,1)X N , 所以22~(1).X χ

金融数学专业攻读硕士学位研究生(学术型)

金融数学专业攻读硕士学位研究生(学术型)培养方案 (专业代码:070121) 一、培养目标 在本门学科上掌握坚实的理论基础和系统的专门知识;具有从事科学研究工作或独立担负专门技术工作的能力。培养面向世界,面向未来,面向现代化,德智体全面发展的,为社会主义现代化建设服务的高层次专门人才。具体要求是: 1、较好地掌握马列主义、毛泽东思想和邓小平建设有中国特色的社会主义理论,坚持四项基本原则, 树立正确的世界观、人生观、价值观,遵纪守法,热爱祖国,热爱社会主义,具有勇于追求真理和献身于科学教育事业的敬业精神,富有历史责任感。具有良好的道德品质和学术修养。 2、掌握本专业坚实的基础理论和系统的专业知识,了解本学科目前的进展与动向,具有从事科学研究工作或独立担负专门技术工作的能力。 3、掌握一门外国语,并能运用该门外国语比较熟练的阅读本专业的外文资料。 4、具有健康的体魄和心理素质。 二、研究方向 1、非线性数学期望及其在金融中的应用 2、保险,金融中的数学理论和应用 3、随机分析在数理金融中的应用 4、金融数学,金融工程与金融管理 5、金融统计 6、数理经济 三、学习年限 全日制硕士研究生的学制为3年,在校学习期限为2-3年。原则上不提前毕业,对于特别优秀者,最多可提前一年。提前毕业的硕士研究生除完成培养方案规定的课程外,必须有一篇以上SCI论文发表,并须经学位委员会审核通过。所取得的科研成果均要求研究生为第一作者,作者单位需为山东大学。 四、培养方式 根据宽口径、厚基础的原则,提倡按一级学科培养硕士研究生;充分利用校内外优质教育资源,鼓励研究生进行“三种经历”,实行双导师合作培养。 五、应修满的总学分数 应修总学分:30 ,其中必修24学分(含前沿讲座与社会实践),选修 6学分。 六、课程的类别及设置 硕士研究生课程分为必修课与选修课两大类。 1.必修课是为达到培养目标要求,保证研究生培养质量而必须学习的课程。必修课分学位公共课、学位基础课和学位专业课。学位基础课一般按一级学科进行设置,学位专业课一般按二级学科设置。 经学校批准建设的全英语教学课程要纳入培养方案的课程体系中。如本专业培养方案中有2门及以上全英语教学必修课程的,相应专业研究生可免修专业外语,直接获得相应学分。 (1)思想政治理论,计3学分; (2)第一外国语,计3学分。 由学科开设的专业必修课包括:

概率论与数理统计第4章作业题解

第四章作业题解 4.1 甲、乙两台机床生产同一种零件, 在一天内生产的次品数分别记为 X 和 Y . 已知 ,X Y 的概率分布如下表所示: 如果两台机床的产量相同, 问哪台机床生产的零件的质量较好? 解: 11.032.023.014.00)(=?+?+?+?=X E 9.0032.025.013.00)(=?+?+?+?=Y E 因为 )()(Y E X E >,即乙机床的平均次品数比甲机床少,所以乙机床生产的零件质量较好。 4.2 袋中有 5 个球, 编号为1,2,3,4,5, 现从中任意抽取3 个球, 用X 表示取出的3 个球中的 最大编号,求E (X ). 解:X 的可能取值为3,4,5. 因为1.01011)3(35 == = =C X P ;3.010 3)4(35 2 3== = =C C X P ; 6.010 6)5(3 5 24=== =C C X P 所以 5.46.053.041.03)(=?+?+?=X E 4.3 设随机变量X 的概率分布1 {}(0,1,2,),(1) k k a P X k k a +===+ 其中0a >是个常 数,求()E X 解: 1 1 2 1 1 1 ()(1) (1) (1) k k k k k k a a a E X k k a a a -∞ ∞ +-=== = +++∑∑ ,下面求幂级数11 k k k x ∞ -=∑的和函数, 易知幂级数的收敛半径为1=R ,于是有 1 2 1 1 1()( ),1,1(1) k k k k x k x x x x x ∞ ∞ -==''=== <--∑ ∑

第六章、数理统计的基本知识解答

第五章、数理统计的基本知识 五、证明题: 1.证:因为随机变量12,,,n X X X 相互独立,并且与总体X 服从相同的正态分布 2(,)N μσ,所以,它们的线性组合 112 22111111[, ()](,)n n i i i i n n i i X X X n n N N n n n σμσμ======??=∑∑∑∑ 即样本均值X 服从正态分布2 (, )N n σμ. 2.证:因为随机变量12,,,n X X X 相互独立,并且与总体X 服从相同的正态分布 2(,)N μσ,所以,它们的线性组合 112 22111111[, ()](,)n n i i i i n n i i X X X n n N N n n n σμσμ======??=∑∑∑∑ 即样本均值X 服从正态分布2 (, )N n σμ。所以,将X 标准化,即得 ~(0,1 )u N = . 3.证:因为随机变量12,,,n X X X 相互独立,并且与总体X 服从相同的正态分布 2(,)N μσ,即 2~(,),1,2,i X N i n μσ= 所以得 ~(0,1),1,2,,i X N i n μ σ -= 又因为12,,,n X X X 相互独立,所以 12,,, n X X X μ μ μ σσσ --- 也相互独立。 于是,2 2 222 1 1 1 ()( )~()n n i i i i X X n μ μσ σ ==-χ= -=χ∑∑.

4.证:由§5.4定理2知,统计量 ~(0,1) u N =; 又由§5.4定理4知,统计量 2 22 2 (1) ~(1) n S n σ - χ=χ- 因为X与2S 独立,所以统计量u= 2 2 2 (1) n S σ - χ=也是独立的。于是,根据§5.3定理2可知,统计量 ~(1) t t n ===-. 5.证:由§5.4定理1知: 22 12 12 12 ~(,),~(,) X N Y N n n σσ μμ. 因为X与Y独立,所以可知: 22 12 12 12 ~(,) X Y N n n σσ μμ --+. 于是,得 ~(0,1) U N =. 6.证:由§5.4定理6的推论知,统计量 ~(0,1) U N =. 又由§5.4定理4知: 2 22 11 11 2 2 22 22 22 2 (1) ~(1), (1) ~(1). n S n n S n σ σ - χ=χ- - χ=χ- 因为2 1 S与2 2 S独立所以2 1 χ与2 2 χ也是独立的,由2χ分布的可加性可知,统计量

应用统计硕士专业学位研究生培养方案

应用统计硕士专业学位研究生培养方案 (专业代码025200) 一、培养目标 为适应经济社会发展的需要,以实际应用为导向,职业需求为目标,培养具有良好的职业道德和社会责任,能够熟练掌握数据采集、数据处理与挖掘,熟练应用计算机处理和数据分析能力的专门人才。以应用统计实践领域对专门人才的知识与素质需求为指导,培养具有实际操作能力,能创造性的解决实际问题的专门人才。 二、招生对象 具有国民教育序列大学本科学历(或本科同等学力)人员。 三、学习方式及年限 采用全日制学习方式,学习年限一般为2年。 四、课程设置 注重理论与实践相结合的原则,突出应用统计实践导向,加强实践教学与案例教学。课程设置分为学位基础课程,专业必修课程,专业选修课程,实践与实习四个模块。培养课程突出应用统计实践导向,加强实践与实习,实践与实习时间原则上不少于半年。实践与实习包括专题阅读、专题讲座和实习等实践形式。实践与实习在相关的统计或金融部门进行,相关统计或金融部门出具的实习合格证明计6学分。总学分不少于32学分。

五、学位论文及学位授予 应用统计硕士专业学生修完学分后,必须提交具有专业学位水平的学位论文。学位论文要与应用统计实际问题、实际数据分析和实际案例紧密结合,能充分体现学生运用应用统计分析、解决应用统计实际问题的能力。论文类型可以是学术论文、案例分析报告、调研报告、数据分析报告。修满规定学分,并通过论文答辩者,经学位授予单位学位评定委员会审核,授予应用统计硕士专业学位,同时获得硕士研究生毕业证书。 主要课程介绍 课程编号:010312 课程名称:高等数理统计 总课时:72 学分:3 开课单位:数学学院开课学期:Ⅰ 教学目的: 通过本课程的学习,使学生了解现代高等数理统计的基本概念,基本定理,掌握数理统计学中常用的一些基本原理(参数估计,非参数估计,假设检验,回归分析),熟练运用概率统计的思想来处理相关的数学问题。 教学要求: 正确理解数理统计的基本概念,熟练掌握和运用数理统计的基本原理(统计推断,假设检验,回归分析,时间序列分析)。 教材及主要参考书目:

概率论与数理统计第4章作业题解25554

第四章作业题解 4.1 甲、乙两台机床生产同一种零件, 在一天内生产的次品数分别记为 X 和 Y . 已知 ,X Y 的概率分布如下表所示: 如果两台机床的产量相同, 问哪台机床生产的零件的质量较好? 解: 11.032.023.014.00)(=?+?+?+?=X E 9.0032.025.013.00)(=?+?+?+?=Y E 因为 )()(Y E X E >,即乙机床的平均次品数比甲机床少,所以乙机床生产的零件质量较好。 4.2 袋中有 5 个球, 编号为1,2,3,4,5, 现从中任意抽取3 个球, 用X 表示取出的3 个球中的 最大编号,求E (X ). 解:X 的可能取值为3,4,5. 因为1.01011)3(35====C X P ;3.010 3 )4(3523====C C X P ; 6.010 6 )5(3524====C C X P 所以 5.46.053.041.03)(=?+?+?=X E 4.3 设随机变量X 的概率分布1 {}(0,1,2,),(1)k k a P X k k a +== =+L 其中0a >是个常 数,求()E X 解: 1121 1 1()(1)(1)(1)k k k k k k a a a E X k k a a a -∞∞ +-====+++∑∑g g ,下面求幂级数1 1k k kx ∞ -=∑的和函数,易知幂级数的收敛半径为1=R ,于是有 1 2 1 1 1 ()(),1,1(1)k k k k x kx x x x x ∞ ∞ -==''===<--∑∑

根据已知条件,0a >,因此011a a < <+,所以有 2 21 ()(1)(1)1a E X a a a a = =+-+g . 4.4 某人每次射击命中目标的概率为p , 现连续向目标射击, 直到第一次命中目标为止, 求射击次数的期望. 解:因为X 的可能取值为1,2,……。依题意,知X 的分布律为 1(),1,1,2,k P X k q p q p k -===-=L L 所以)1( )()()(1 1 1 1 '-='='== ∑∑∑∞ =∞=∞ =-q q p q p q p p kq X E k k k k k k p p p q p 1 1)1(12 2=?=-= 4.5 在射击比赛中, 每人射击4 次, 每次一发子弹. 规定4弹全未中得0分, 只中1弹得15 分, 中2弹得30 分, 中3弹得55分, 中4弹得100分. 某人每次射击的命中率为0.6, 此人期 望能得到多少分? 解:设4次射击中命中目标的子弹数为X ,得分为Y ,则X ~B (4,0.6) 因为 0256.04.06.0)0(4 4=?==C X P 1536.04.06.0)1(311 4=?==C X P 3456.04.06.0)2(2224=?==C X P 3456.04.06.0)3(1334=?==C X P 1296.04.06.0)4(0444=?==C X P 所以Y 的分布律为 故期望得分为 1296.01003456.0553456.0301536.0150256.00)(?+?+?+?+?=Y E = 44.64 4.6 设随机变量 X 的概率分布为1 32 {(1)}(1,2,,),3 k k k k P X k +=-= =L 说明X 的期望不存在。

070103概率论与数理统计-2019年

070103概率论与数理统计专业(全日制或非全日制) 硕士研究生培养方案 一、培养目标 本专业培养德、智、体全面发展,适应现代科技发展和国民经济建设需要,能在政府、企事业单位和经济管理部门从事统计调查、统计信息分析与管理、数据分析等开发、应用和管理工作,或在科研部门、高等院校从事科学研究和教学工作的高级专门人才工程技术及管理的高级专门人才。具体要求如下: 1、具有坚定正确的政治方向,努力学习掌握马克思主义的基本原理,树立正确的世界观、人生观和价值观;遵纪守法,品行端正,作风正派,具有较高的综合素质和愿为社会主义建设艰苦奋斗的献身精神。 2、掌握概率论与数理统计的基本理论和方法,能熟练地运用统计软件分析数据,具有独立从事科学研究和解决实际问题的能力。 3、熟练掌握一门外国语,具有阅读外文资料和使用外文写作论文的能力;具备熟练地使用计算机及数学软件进行科学计算以及借助互联网阅读专业资料的能力。 4、身心健康、德才兼备。 二、研究方向 本学科设置以下研究方向: 1、数理统计与金融学 2、随机分析 3、统计学习算法 4、统计与大数据分析 三、学习年限 学习年限一般为3年,最长不超过4年。课程学习时间为一年半。硕士生应在规定的学习期限内完成培养计划要求的课程学习和论文等工作。 四、课程设置与学分 本专业课程设置包括学位课、非学位课和实践环节,应修总学分不少于34学分(具体课程设置见附表)。其中 1、学位课:不少于19学分。其中,公共学位课9学分。 2、非学位课:不少于13学分。 3、实践环节:2学分。 五、实践环节 硕士研究生应参加学术活动、教学实践、科研实践或社会实践等实践活动。学术活动为

物理电子学专业硕士研究生培养方案2018年修订

物理电子学专业硕士研究生培养方案(2018年修订) 专业代码:080901 一、培养目标与培养规格 培养德、智、体全面发展,具有较高政治理论素养、宽厚专业基础知识、创新意识强,具备一定科研工作能力,并能在电子科学与技术领域从事物理电子学专业的教学、科研、工程应用等工作的专业技术型高级人才。具体培养规格如下: (1) 深入学习、掌握马克思主义基本原理,确立辩证唯物主义与历史唯物主义的世界观;坚持四项基本原则,热爱祖国,遵纪守法,品行端正;服从国家需要,积极为社会主义现代化建设服务; (2) 具有扎实的数学、物理、电子科学与技术基础知识,并掌握相应的实验方法和科研技能; (3) 掌握基本的研究方法和技能,具有从事教学、科学研究和工程应用等工作能力; (4)掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方法; (6)具有较高的外语水平; (7)具有一定的计算机操作能力,能熟练运用计算机进行科学计算、论文撰写、文 献检索; 二、研究方向 A.电磁波特征信息探测与传播技术; B.光通信与光电检测技术; C.信息对抗技术; D.太阳能电池与光伏技术。 三、学习年限 学习年限为三年,其中课程学习时间一年半,至少修满35学分;完成学位论文时间一年半。外单位委托培养研究生与本校全日制研究生相同。本校在职研究生学习年限为三年至四年,每年应完成1/3的教学工作量,其余时间进行学习。 四、培养方式与方法 硕士生的培养,采取以导师为主,导师与指导小组集体培养相结合的方式。培养采用系统理论学习、进行科学研究、参加学术活动和教学实践活动相结合的办法。既要使硕士生牢固掌握基础理论和专业知识,又要培养硕士生具有从事科学研究、工程应用、高校教学等工作的能力。

(完整)高等数理统计2011

南昌大学研究生2010~2011学年第 2 学期期末考试试卷 试卷编号: ( A )卷 课程名称: 高等数理统计 适用专业: 数学 姓名: 学号: 专业: 学院: 考试日期: 2011年6月19日 考试占用时间: 150分钟 考试形式(开卷或闭卷): 题号 一 二 三 四 五 六 七 八 九 十 总分 累分人 签名 题分 15 15 20 25 25 100 得分 考生注意事项:1、本试卷共 页,请查看试卷中是否有缺页或破损。如有立即举手报告以便更换。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、证明题: (15分) 得分 评阅人 设1(0,1):X N ,2(0,4):X N ,且1X 与2X 独立,求112=+Y X X 与212=-Y X X 的联合分布。

二、计算题:(15分) 得分 评阅人 设总体X 有密度函数201 ()0 <P X 。

三、综合题:(20分) 得分 评阅人 (1) 检查Poisson 布族的完备性; (2) 判断分布族{(1),0,1,2,;0}θθθθ=-=>L x p x 是否为指数族;

四、应用题:(25分) 得分 评阅人 设1,,L n X X 为独立同分布变量,01θ<<, 11Pr(1)2θ-=-=X , 11Pr(0)2==X , 1Pr(1)2θ ==X , (1) 求θ的1?θMLE 并问1 ?θ是否是无偏的; (2) 求θ的矩估计2 ?θ ; (3) 计算θ的无偏估计的方差的C-R 下界。

第六章 数理统计的基本知识课后习题参考答案

第六章 数理统计的基本知识 1 .10 2 21 1 () 210110(,,)i i x f x x e μσ=--∑=K ;2 2()12*10 1(),1x f x e x μσ-- -∞<<+∞=。 2.t 分布;9. 3.11,, 2.20100 4.解: 0 (0,1)0.3 i X N -~Q 10 1 22 ( )(10)0.3 i i X χ=∴~∑ {} {}1010222 2 11 1.441.44()(10)160.10.3 0.3i i i i X P X P P χ==??∴>=>=>=∑∑???? 5.解:4 (12,)5 X N : 可参考书中67P 页 (1){ } 121210.7372P X -<=Φ-=; (2){}125max(,,,)15P X X X

(1) ()1 c c c E X x c x dx c x dx θθθθθθθθ+∞ +∞ -+-=== -? ? 令 1c X θθ=-,得θ的估计量为$X X c θ =-,θ的估计值为$1 1 11n i i n i i x n x c n θ===-∑∑ (2)极大似然估计 (1)(1)(1)11()()()n n n L c x c x c x x θθθθθθθθθθ-+-+-+==L L 1 ln ()ln()(1)ln n i i L n c x θ θθθ==-+∑ 令1 ln ln ln 0n i i L n n c x θθ=?=+-=?∑ 得θ的估计值为$1 ln ln n i i n x n c θ ==-∑,θ的估计量为$1 ln ln n i i n X n c θ ==-∑ 3.(1) 矩估计 1214 33 X ++= = 22()122(1)3(1)32E X θθθθθ=?+?-+?-=- 令()E X X = 得θ的估计值为$5 6 θ = 极大似然估计 2256112233()()()()2(1)22L P X x P X x P X x θθθθθθθ=====?-?=- 令 ln 5101L θθθ?=-=?-,得θ的估计值为$56 θ= (2)矩估计量 1 1n i i X X n λ===∑ 极大似然估计 1 111211()()()...()... ! ! !...! i n x x x n n n n n e e L P X x P X x P X x e x x x x λ λ λλλλλ---∑ ===== = 令 ln ()0i x L n λθλ ?=-+=?∑,得λ的似然估计值为$i x n λ=∑,

概率论与数理统计专业硕士研究生培养方案

概率论与数理统计专业硕士研究生培养方案 一、培养目标 在学校的总体培养目标要求基础上,我们提出本学科培养目标的具体要求如下: 研究生必须认真学习掌握马列主义、毛泽东思想和邓小平建设有中国特色社会主义理论,热爱祖国,具有集体主义精神以及追求和献身于科学教育事业的敬业精神和科学道德。 攻读硕士学位的研究生(简称硕士生)必须在本学科内掌握坚实的基础理论和系统的专门知识;掌握本学科的现代统计方法和技能;掌握本学科的现代概率论理论。在所研究方向的范围内了解本学科发展的现状和趋势;掌握一门外国语;具有从事科学研究、大学教学或独立担负专门技术工作的能力。 二、研究方向:见附表一。 三、学习年限及时间分配 硕士研究生学习年限为2年,课程学习与论文写作交叉进行,论文工作时间一般在入学的第三个学期开始。对于要求提前毕业的硕士生需要考核其学分是否修满,是否已经在核心期刊发表至少1篇主攻方向的学术论文,并且是论文的第一或第二作者。 四、课程设置及学分要求:见附件二 硕士生所修课程总学分不少于26学分,其中学位课(包括公共课、专业必修课)不低于16学分。 五、文献阅读 根据概率论与数理统计专业对硕士研究生论文工作的需求,我们拟定在入学的第二学期至第三学期末指导硕士生进行文献阅读,其间每周定期安排指导教师与学生讨论所阅读的文献,文献阅读的形式是以学生讲解,指导教师提问的方式进行。阅读文献达到的标准是以能够掌握本人主攻方向的基础理论知识及了解该方向的前沿领域研究问题。指导教师可根据学生是否达到其主攻方向的文献阅读要求来决定是否给学生文献阅读的学分。考核通过,获得1个必修学分。 六、开题报告 概率论与数理统计专业硕士生在指导教师指导下确定选题,在第三学期初完成开题报告的写作,组织系内有关专家对报告进行论证,经修订后由指导教师审核同意。开题报告应包含如下内容:论题;论文的基本构思或大纲;论题的学术意义和现实意义;已阅读过的和准备阅读的资料;疑点和难点;解决的途经及方法,使用的工具等。考核通过,获得1个必修学分。 七、中期考核 在硕士研究生的论文工作期间必须对其进行一次中期考核,时间为入学第三学期末,考核的方式和内容是按照数学研究所的统一要求。凡不符合要求者,令其重做,并延期毕业论文答辩。

概率统计简明教程 第六章 数理统计的基础知识

第六章数理统计的基础知识 从本章开始,我们将讨论另一主题:数理统计.数理统计是研究统计工作的一般原理和方法的数学学科,它以概率论为基础,研究如何合理地获取数据资料,并根据试验和观察得到的数据,对随机现象的客观规律性作出合理的推断. 本章介绍数理统计的基本概念,包括总体与样本、经验分布函数、统 计量与抽样分布,并着重介绍三种常用的统计分布:2 分布、t分布和F 分布. §1 总体与样本 1.1 总体 在数理统计中,我们把所研究对象的全体称为总体,总体中的每个元素称为个体.例如,研究某班学生的身高时,该班全体学生构成总体,其中每个学生都是一个个体;又如,考察某兵工厂生产炮弹的射程,该厂生产的所有炮弹构成总体,其中每个炮弹就是一个个体. 在具体问题的讨论中,我们关心的往往是研究对象的某一数量指标(例如学生的身高),它是一个随机变量,因此,总体又是指刻画研究对象某一数量指标的随机变量X.当研究的指标不止一个时,可将其分成几个总体来研究.今后,凡是提到总体就是指一个随机变量.随机变量的分布函数以及分布律(离散型)或概率密度(连续型)也称为总体的分布函数以及分布律或概率密度,并统称为总体的分布. 总体中所包含的个体总数叫做总体容量.如果总体的容量是有限的,则称为有限总体;否则称为无限总体.在实际应用中,有时需要把容量很大的有限总体当做是无限总体来研究. 1.2随机样本 在数理统计中,总体X的分布通常是未知的,或者在形式上是已知 182

183 的但含有未知参数.那么为了获得总体的分布信息,从理论上讲,需要对总体X 中的所有个体进行观察测试,但这往往是做不到的.例如,由于测试炮弹的射程试验具有破坏性,一旦我们获得每个炮弹的射程数据,这批炮弹也就全部报废了.所以,我们不可能对所有个体逐一加以观察测试,而是从总体X 中随机抽取若干个个体进行观察测试.从总体中抽取若干个个体的过程叫做抽样,抽取的若干个个体称为样本,样本中所含个体的数量称为样本容量. 抽取样本是为了研究总体的性质,为了保证所抽取的样本在总体中具有代表性,抽样方法必须满足以下两个条件: (1)随机性 每次抽取时,总体中每个个体被抽到的可能性均等. (2)独立性 每次抽取是相互独立的,即每次抽取的结果既不影响其它各次抽取的结果,也不受其它各次抽取结果的影响. 这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本. 对于有限总体而言,有放回抽样可以得到简单随机样本,但有放回抽样使用起来不方便.在实际应用中,当总体容量N 很大而样本容量n 较小时(一般当10N n ≥时),可将不放回抽样近似当作有放回抽样来处理. 对于无限总体而言,抽取一个个体不会影响它的分布,因此,通常采取不放回抽样得到简单随机样本.以后我们所涉及到的抽样和样本都是指简单随机抽样和简单随机样本. 从总体X 中抽取一个个体,就是对总体X 进行一次随机试验.重复做n 次试验后,得到了总体的一组数据12(,,,)n x x x ,称为一个样本观测值.由于抽样的随机性和独立性,每个(1,2,,)i x i n = 可以看作是某个随机变量(1,2,,)i X i n = 的观测值,而(1,2,,)i X i n = 相互独立且与总体 X 具有相同的分布.习惯上称n 维随机变量12(,,,)n X X X 为来自总体X 的简单随机样本. 定义1.1 设总体X 的分布函数为()F x ,若随机变量12,,,n X X X 相互独立,且都与总体X 具有相同的分布函数,则称12,,,n X X X 是来自

数理统计答案第四章汪荣鑫

P168 2解:假设0 1234:H μμμμ=== 112 34:H μμμμ不全为零 1234454562024.52r n n n n n X ======= 经计算可得下列反差分析表: 查表得0.05(3,16) 3.24F = 0.0517.8837 0.4745(3,16)37.6887 F F = =< 故接受0H 即可认为四个干电池寿命无显着差异 3 解:假设0 123:H μμμ== 1123:H μμμ不全相等 12336140.9278r n n n X ===== 经计算可得下列方差分析表: 0.050.05(2,15) 3.68 4.373 3.68(2,15) F F F ==>= ∴拒绝0H 故可认为该地区三所小学五年级男生平均身高有显着差异。

4 解: 假设01234:H μμμμ=== 11234:H μμμμ不全相等 123445100.535r n n n n X ====== 0.05(3,16) 3.24F = 0.05(3,16) 3.24F F >= ∴拒绝0H 故可认为这几支伏特计之间有显着差异。 5 解:假设012345:H μμμμμ==== 112345:H μμμμμ不全相等 60 1234553 89.6r n n n n n X ======= 0.050.05(4,10) 3.4815.18(4,10)F F F ==>

∴拒绝0H 故可认为温度对得率有显着影响 2 151515 11(,( ))X X N n n μμσ--+ 由T 检验法知: ()T t n r = - 给定的置信概率为10.95α-= 0.025{()}0.95P T t n r <-= 故15μμ-的置信概率为的置信区间为 150.025150.025((,()E E X X t n r X X t n r ----+- 2.236E S = == 0.025(10) 2.2281t = 由上面的数据代入计算可得: 150.025150.0259084 2.2281 2.236 1.932210.0678E E X X t X X t --=--?=-+= 故15μμ-的置信区间为( , ) 2 343434 11(,( ))X X N n n μμσ--+ 由T 检验法知: ()X X T t n r = - 34μμ-的置信区间为: 340.025340.025((,()E E X X t n r X X t n r ----+-

智轩考研数学红宝书2010精华习题完全解答---概数第六章 数理统计的基本概念

第六章 数理统计的基本概念精华习题 一、填空题 1. 设)2,0(,,,2 4321N X X X X 是来自正态总体的样本,则统计量 243221)43( 1)2(1Y X X X X -+-= 服从______分布。. 2. 3456则 71 2((C D

3.设1234, , , X X X X 是取自总体()~0, 4X N 的简单随机样本,()2 122X a X X =-+()2 3434b X X - ()2 ~n c ,则 ()()()()2 4 C 1 2 24A n B n n D n ====或或 【解】选()C 。因为()2 ~X n c ,故, a b 不可能同时为零,但可以其中一个或全不为零。 12(((3

第六章 数理统计的基本概念精华习题完全解答 一、填空题 1.设)2,0(,,,2 4321N X X X X 是来自正态总体的样本,则统计量 243221)43( 1)2(1Y X X X X -+-= 服从______分布。. 2 3 45.设随机变量()~, X F n n ,则概率{}1P X <= __________。 【解】()(){}{}{}{}111~, ~, 111112X F n n F n n P X P Y P P X P X X X ìü T T<=<=<=>T<=íy?t 。

6. 设总体()2, 01 ~0, X x x X f x other <<ì=í? ,12, X X 来自X 的简单随机样本,12U X =,21V X =+, 则12U P V ìü £=í y?t _______。 【解】()12, ~X X ()1212124, 01, 01 , 0, x x x x f x x other <<<<ì=í? 2P < 7 1 2 (( A B C D

数理统计第四章作业答案

习题4作业答案4.2 解: 提出假设:

4.6 解:本题为双因素无重复实验方差分析提出如下假设:

查F 表得:F0.05(2,6)= 5.14, F0.05(3,6)=4.76 因此,FA> F0.05(2,6), FB> F0.05(3,6) 所以拒绝原假设H01,H02,认为使用不同的促进剂和不同分量的氧化锌,对定强有显著影响。 补充:具体计算过程仅供参考 4.9 为考虑合成纤维中对纤维弹性有影响的二个因素:收缩率A 和总拉伸倍数B 。现就A 和B 各取4种水平做实验,在每一组合水平下各作2次试验,试验结 和总拉伸倍数分别对纤维弹性有无显著影响?并问二者对纤维弹性有无显著交互作用(α=0.05)? 解:提出如下假设 H 01:收缩率对纤维弹性无显著影响; H 02:总拉伸倍数对纤维弹性无显著影响; H 03:收缩率和总拉伸倍数对纤维弹性无显著交互作用; 其中,由S ij?=∑x ijk l k=1,i =1,2,3,4,j =1,2,3,4,分别有 S 11?=∑x 11k 2k=1=144,S 21?=∑x 21k 2k=1=148,

S 12?=∑x 12k 2k=1=145,S 22?=∑x 22k 2k=1=150, S 13?=∑x 13k 2k=1=148,S 23?=∑x 23k 2k=1=155, S 14?=∑x 14k 2k=1=152,S 24?=∑x 24k 2k=1=148, S 31?=∑x 31k 2k=1=149,S 41?=∑x 41k 2k=1=148, S 32?=∑x 32k 2k=1=156,S 42?=∑x 42k 2k=1=145, S 33?=∑x 33k 2k=1=149,S 43?=∑x 43k 2k=1=141, S 34?=∑x 34k 2k=1=147,S 44?=∑x 44k 2k=1=138, 每行的和为 S 1??=∑∑x 1jk 2k=14j=1=589,S 2??=∑∑x 2jk 2 k=14j=1=601, S 3??=∑∑x 3jk 2k=14j=1=601,S 4??=∑∑x 4jk 2k=14j=1=572, 每列的和为 S ?1?=∑∑x i1k 2k=14i=1=589,S ?2?=∑∑x i2k 2 k=14i=1=596, S ?3?=∑∑x i3k 2k=14i=1=593,S ?4?=∑∑x i4k 2 k=14i=1=585, 则所有数据总和为S =∑∑∑x ijk 2k=14j=14i=1=2363, 数据平方总和为SS =∑∑∑x ijk 22k=14j=14i=1=174673, 故Q A =1 sl ∑S i??2r i=1?1 rsl S 2=1 4×2∑S i??24i=1?1 4×4×2S 2=70.59, Q B =1 rl ∑S ?j?2s j=1?1 rsl S 2=1 4×2∑S ?j?24j=1?1 4×4×2S 2=8.59, Q E =SS ?1 l ∑∑S ij?2s j=1r i=1=SS ?1 2∑∑S ij?24j=14i=1=21.5, Q T =SS ?1rsl S 2=174673?1 4×4×2×23632=180.22, Q I =Q T ?Q A ?Q B ?Q E =79.54, 对给定的水平α=0.05,查表得F 0.05(3,16)=3.24,F 0.05(9,16)=2.54,因为F A =17.56>3.24,F B =2.13<3.24,F I =6.60>2.54,故接受H 02,拒绝H 01和H 03,即认为总拉伸倍数对纤维弹性无显著影响,收缩率对纤维弹性有显著影响,且收缩率和总拉伸倍数对纤维弹性有显著交互作用。 4.11 九二零是一种植物生长调节剂,某微生物厂生产的九二零存在着产品效价低,成本高等问题,为解决这一问题,用正交安排试验,选取的因素及水平如下表: L 8(27)的第1,2,4,7列上,所得试验结果(效价:万单位)依次为: 2.05, 2.24, 2.44, 1.10, 1.50, 1.35, 1.26, 2.00.

第六章数理统计学的基本概念

第六章数理统计的基本概念 一、教学要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。 二、主要内容 1.总体与个体 我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体密度函数。当X服从 正态分布时,称总体X为正态总体。正态总体有以下三种类型: (1)未知,但已知; (2)未知,但已知; (3)和均未知。 2.简单随机样本 数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。n称为样本容量。()称为样本观测值。 如果样本()满足 (1)相互独立; (2) 服从相同的分布,即总体分布; 则称()为简单随机样本。简称样本。 设总体X的概率函数(密度函数)为,则样本()的联合概率函数(联合密度函数为)

3. 统计量 完全由样本确定的量,是样本的函数。即:设是来自总体X 的 一个样本,是一个n 元函数,如果 中不含任何总体的未知参数, 则称 为一个统计量,经过抽样后得到一组样本观测值 , 则称 为统计量观测值或统计量值。 4. 常用统计量 (1)样本均值: (2)样本方差: (3)样本标准差: 它们的观察值分别为: 这些观察值仍分别称为样本均值、样本方差和样本标准差。 (4)样本(k 阶)原点矩 1 1,1,2,n k k i i A X k n ===∑ (5)样本(k 阶)中心矩 1 1(),2,3,n k k i i B X X k n ==-=∑ 其中样本二阶中心矩21 1(),n k i i B X X n ==-∑又称为未修正样本方差。 (6)顺序统计量 将样本中的各个分量由小到大的重排成 (1)(2)()n X X X ≤≤≤ 则称(1)(2)(),,n X X X 为样本顺序统计量,()(1)n X X -为样本的极差。 (7)样本相关系数: 1 ()()()() n n i i i i i xy x y x x y y x x y y r S S =----= = ∑∑其中:,x y 分别为数据{,i i x y 的样本均值,,x y S S 分别为样本a 标准差。 5、直方图与箱线图 (1)直方图 先将所有采集的数据进行整理,得到顺序统计量,找出其中的最小值(1)x ,最大值()n x ,即所有的数据都落在区间(1)(),n x x ????上,现取区间(1)(),n x k x k ? ?-+?? (其

高等数理统计实验报告

《高等数理统计》实验报告 一、实验目的 不同分布的随机数生成原理及其算法实现 二、实验内容 1.针对均匀分布的随机数生成原理及算法实现 2.以指数分布为例的反函数方法的随机数生成 3.针对正态分布的随机数生成原理及算法实现 4.基于Box–Muller算法的随机数生成及算法实现 5.基于舍选抽样法算法的随机数生成及算法实现 三、实验过程 1.均匀分布随机数生成 方法一:迭代取中法 原理: 这里在迭代取中法中介绍平方取中法 , 其迭代式如下 : 其中,是迭代算子,而则是每次需要产生的随机数。 第一个式子表示的是将平方后右移位,并截右端的位。 而第二个式子则是将截尾后的数字再压缩倍,显然 :。 注: 迭代取中法有一个不良特性就是若初始随机数参数以及初始值选择不恰当,最后结果容易退化成0. 附结果验证: (1)当初始值为123456,s=2时,部分结果如下, 所有结果均不退化为0

(2)当初始值为12345,s=2时,部分结果如下:注:当迭代次数达到48次时,随机数则退化为0 (3)当初始值为12345,s=1时,部分结果如下:注:当迭代次数达到4次时,随机数则退化为0

方法二:乘同余法 = = 其中,是迭代算子,而则是每次需要产生的随机数,为参数; 注: 这里的参数选取是需要一定理论基础的,否则所产生的随机数的周期将较小,相关性会较大。 附图: 当迭代次数为300次时,p值为0.54: 当迭代次数为1000次时,p值几乎为1

方法三:混合同余法(又称线性同余法LCG) 混合同余法是加同余法和乘同余法的混合形式,其迭代式如下 =( = 其中,是迭代算子,而则是每次需要产生的随机数,为参数; 一般而言,高的是2的指数次幂(一般2^32或者2^64),因为这样取模操作截断最右的32或64位就可以了 在的条件下,参数按如下方式选取: ,取附近的数 为任意非负整数 注: 参数,,选取直接影响了伪随机数产生的质量 该随机数的生成方法在某一周期内成线性增长的趋势,但是在大多数场合,这种极富“规律”型的随机数是不适用的 使用场合:LCG不能用于随机数要求高的场合,例如不能用于Monte Carlo模拟,不能用于加密应用。不过有些场合LCG有很好的应用,例如内存很紧张的嵌入式中,电子游戏控制台用的小整数,使用高位可以胜 附结果验证: 当迭代次数为1000时,p值几乎为1

高等数理统计预备知识

预备知识 1.事件域 定义 设Ω为一基本事件空间,F 为Ω的某些子集所组成的集合类。如果F 满足: (1)Ω∈F ; (2)若A ∈F ,则对立事件A ∈F ; (3)若,=1,2, n A n ∈F ,则可列并 =1 n n A ∞ ∈F . 则F 是一个σ代数(或称σ域),称为事件域。F 中的元素称为事件。 2.可测空间 定义 在概率论中,二元组(),ΩF 称为概率可测空间,这里“可测”是指F 是一个事 件域,即F 中的元素都是有概率可言的事件。 3. 有限维乘积可测空间 定义 设(),,1i i i n Ω≤≤F 是n 个可测空间,像通常一样, (){}1=, ,:,1n i i i n ωωωΩ∈Ω≤≤ 称为1, ,n ΩΩ乘积空间,记为1=1 ==n i n i Ω?ΩΩ??Ω。对i i A ?Ω,1i n ≤≤,集合 (){}1A=,,:,1n i i A i n ωωω∈≤≤ 称为乘积空间Ω中的矩形集,记为1=1 A==A n i n i A A ???。特别地,当每个i i A ∈F 时, 1=1 A==A n i n i A A ?? ? 称为可测矩形。C 表示=1 =n i i Ω?Ω中的可测矩形全体,即 {}1=A :,i=1, ,n n i i A A ? ?∈C F , 则C 是一个半域,()=σC F (由C 生成的σ域,即包含C 的最小σ域)称为乘积σ域, 记为1=1==n i n i ?? ?F F F F ,又称(),ΩF 为可测空间()()11,, ,,n n ΩΩF F 的乘积可测空 间,记为 ()()()()11=1 ,=,=,,n i i n n i Ω?ΩΩ? ?ΩF F F F 4. 无限维乘积可测空间 定义 设 (){},,J αααΩ∈F 是一族可测空间,则 (){}=,J :,J αααωαωαΩ∈∈Ω∈

相关文档
相关文档 最新文档