文档库 最新最全的文档下载
当前位置:文档库 › 正态分布模型解题

正态分布模型解题

正态分布模型解题
正态分布模型解题

2.4.1正态分布

关于正态曲线性质的叙述:

①曲线关于直线x=μ对称,这个曲线在x 轴上方;

②曲线关于直线x=σ对称,这个曲线只有当x ∈(-3σ,3σ)时才在x 轴上方; ③曲线关于y 轴对称,因为曲线对应的正态密度函数是一个偶函数; ④曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低; ⑤曲线的对称轴由μ确定,曲线的形状由σ确定; ⑥σ越大,曲线越“矮胖”,σ越小,曲线越“瘦高”; 上述说法正确的是

一、 知识梳理

1.正态分布的重要性

正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。 2.正态曲线及其性质

正态分布函数:22

()21

()2x f x e μσπσ

--

=

,x ∈(-∞,+∞)其中实数(0)

μσσ>和为参数,我们称,()x μσ?的图像为正态分布密度曲线,简称正态曲线。

3.标准正态曲线

标准正态曲线N (0,1)是一种特殊的正态分布曲线,00()1()x x Φ-=-Φ,以及标准正态总体在任一区间(a ,b)内取值概率)()(a b P Φ-Φ=。 4.一般正态分布与标准正态分布的转化

由于一般的正态总体),(2σμN 其图像不一定关于y 轴对称,对于任一正态总体),(2σμN ,

其取值小于x 的概率)()(σ

μ

-Φ=x x F 。只要会用它求正态总体),(2σμN 在某

个特定区间的概率即可。

一般地,如果对于任何实数a b <,随机变量X 满足

,(

a

P a b x dx μσ?≤=?)

则称X 的分布为正态分布,记作2

N μσ(,)

,如果随机变量X 服从正态分布,则记为

2X

N μσ(,)

。 可以发现,正态曲线有以下特点:

(1) 曲线位于x 轴上方,与x 轴不相交; (2) 曲线是单峰的,它关于直线x μ=对称;

(3) 曲线在x μ=处达到峰值

1

2σπ

(4) 曲线与x 轴之间的面积为1;

(5) 当σ一定时,曲线随着μ德变化而沿x 轴平移;

(6) 当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散。 若2X

N μσ(,)

,则对于任何实数0,a >概率 ,(

a

P a a x dx μμσμμμ?+--≤+=?

对于固定的μ和a 而言,给面积随着σ的减少。这说明σ越小,X 落在区间

,]a a μμ-+(的概率越小,即X 集中在μ周围概率越大. 特别有

可以看到,正态总体几乎总取值于区间(33)X μσμσ-<≤+之内。而在此区间以外取值的概率只有0.0026,通常认为这种情况在一次试验中几乎不可能发生。

在实际应用中,通常认为服从于正态分布2

N μσ(,)的随机变量X 只取(3,3)μσμσ-+之间的值,简称之为3σ原则

三、 典型例题

例1.

在某次数学考试中,考生的成绩ξ服从一个正态分布,即(90,100)N ξ

(1) 试求考试成绩ξ位于区间(70,110)上的概率是多少?

(2) 若这次考试共有2000名考生,试估计考试成绩在(80,100)间的考生大

约有多少人?

变式训练.已知一次考试共有60名同学参加,考生的成绩(110,25),X N 据此估计,大

约应有57人的分数在下列哪个区间内?( )

.(90,110]A .(95,125B .(100,125]C .(105,115]D

()0.6826,(22)0.9544,(33)0.9774.

P X P X P X μσμσμσμσμσμσ-<≤+=-<≤+=-<≤+=

四、反馈测评

1. 给出下列三个正态总体的函数表达式,请找出其均值μ和标准差σ

(1)),(,21)(2

2+∞-∞∈=

-

x e

x f x π

(2)),(,221

)(8

)1(2

+∞-∞∈=

--

x e

x f x π

(3)2

2(1)2(),(,)2x f x e x π

-+=∈-∞+∞ 2.若随机变量(2,4)N ξ

-,则ξ在区间(4,2]-上的取值的概率等于ξ在下列哪个区间上取

值的概率( )

.(2,4]A .(0,2]B .(2,0]C - .(4,4]D -

3.若随机变量ξ服从正态分布(0,1)N ξ

,则ξ在区间(3,3]-上取值的概率等于( )

A.0.6826

B.0.9544

C.0.9974

D.0.3174

4.若一个正态总体落在区间(0.2,)+∞里的概率是0.5,那么相应的正态曲线f (x ) 在x= 时,达到最高点。

一、选择题

1.下列函数中,可以作为正态分布密度函数的是( )

(1)2

21.()2x A f x e π

--

=

(2)

222

1.()

2x B f x e

σπσ

--

=

()222

1

.()2x C f x e μσπσ

--

=

421.()2x D f x e π

π

-

=

2.函数4

2

1()2x

f x e ππ

-=,()x R ∈的奇偶性为( )

A.奇函数

B.偶函数

C.非奇非偶函数

D.无法判断

3.若随机变量满足正态分布2

N μσ(,),则关于正态曲线性质的叙述正确的是( ) A.σ越大,曲线越“矮胖”,σ越小,曲线越“瘦高”. B. σ越大,曲线越“瘦高”, σ越小,曲线越“矮胖” C. σ的大小,和曲线的“瘦高”,“矮胖”没有关系 D.曲线的“瘦高”,“矮胖”受到μ的影响 二、填空题 4.随机变量2X

N μσ(,)

,其密度函数f (x )的最大值是

5.工人制造机器零件,零件的尺寸服从分布X 4N (0,),则不属于(4,4)-这个尺寸范围的

零件约占总数的

9.设1~24X N ?

?- ???,,则X 落在(]

[)3.50.5---+,,

∞∞内的概率是( )

A.95.4%

B.99.7%

C.4.6% D.0.3%

10.正态分布2()N μσ,在下面几个区间内的取值概率依次为( ) ①(]33μσμσ-+,

②(]22μσμσ-+,

③(]μσμσ-+,

A.①68.3% ②95.4% ③99.7% B.①99.7% ②95.4% ③68.3%

C.①68.3% ②99.7% ③95.4% D.①95.4% ②68.3% ③99.7%

14.在某项测量中,测量结果ξ服从正态分布2(1)(0)N σσ>,.若ξ在(01),内取值的概率为0.4,则ξ在(02),内取值的概率为 0.8

(11)若随机变量X ~2(,)μσ,则()P X μ≤=________.

5)已知随机变量ξ服从正态分布),1(2σN ,若023.0)2(=>ξP ,则=≤≤-)22(ξP C

(A )0.477

(B )0.628

(C )0.954

(D )0.977

均值、方差、正态分布__学生用

§12.6 离散型随机变量的均值与方差、正态分布 1.离散型随机变量的均值与方差 若离散型随机变量X (1)均值 称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量X 的均值或数学期望,它反映了离散型随机变量取值的平均水平. (2)方差 称D (X )=∑n i =1 (x i -E (X ))2 p i 为随机变量X 的方差,它刻画了随机变量X 与其均值E (X )的平均偏离程度,其算术平方根D X 为随机变量X 的标准差. 2.均值与方差的性质 (1)E (aX +b )=aE (X )+b . (2)D (aX +b )=a 2 D (X ).(a ,b 为常数) 3.两点分布与二项分布的均值、方差 (1)若X 服从两点分布,则E (X )=__p __,D (X )=p (1-p ). (2)若X ~B (n ,p ),则E (X )=__np __,D (X )=np (1-p ). 4.正态分布 (1)正态曲线:函数φμ,σ(x )=1 2πσ e -x -μ2 2σ2 ,x ∈(-∞,+∞),其中μ和σ为参数(σ>0, μ∈R ).我们称函数φμ、σ(x )的图象为正态分布密度曲线,简称正态曲线. (2)正态曲线的性质: ①曲线位于x 轴上方,与x 轴不相交; ②曲线是单峰的,它关于直线x =μ对称; ③曲线在x =μ处达到峰值1 σ2π; ④曲线与x 轴之间的面积为__1__; ⑤当σ一定时,曲线的位置由μ确定,曲线随着__μ__的变化而沿x 轴平移,如图甲所示; ⑥当μ一定时,曲线的形状由σ确定,σ__越小__,曲线越“瘦高”,表示总体的分布越集中;σ__越大__,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.

高斯分布背景模型原理

高斯分布背景模型原理 背景差分法的关键是背景图像的描述模型即背景模型,它是背景差分法分割运动前景的基础。背景模型主要有单模态和多模态两种,前者在每个背景像素点上的颜色分布比较集中,可以用单分布概率模型来描述,后者的分布则比较分散,需要用多分布概率模型来共同描述。在许多应用场景,如水面的波纹、摇摆的树枝,飘扬的红旗、监视器屏幕等,像素点的值都呈现出多模态特性。最常用的描述场景背景点颜色分布的概率密度模型(概率密度分布)是高斯分布(正态分布)。 1 单高斯分布背景模型 单高斯分布背景模型适用于单模态背景情形, 它为每个图象点的颜色建立了用单个高斯分布表示的模型) ,(,t t x N σμ其中下标t 表示时间。设图象点的当前颜色度量为t X ,若(,,)ttt p N X T μσ ≤ (这里p T 为概率阈值) , 则该点被判定为前景点, 否则为背景点(这时又称t X 与) ,(,t t x N σμ相匹配)。 在常见的一维情形中, 以t σ表示均方差, 则常根据/t t d σ的取值 设置前景检测阈值:若/t t d T σ>,则该点被判定为前景点, 否则为背 景点。 单高斯分布背景模型的更新即指各图象点高斯分布参数的更新。引入表示更新快慢的常数——更新率α, 则该点高斯分布参数的更新可表示为 1(1)t t t d μαμα+=-?+? (1)

21(1)t t t d σασα+=-?+? (2) 单高斯背景模型能处理有微小变化与慢慢变化的简单场景,当较复杂场景背景变化很大或发生突变,或者背景像素值为多峰分布(如微小重复运动)时,背景像素值的变化较快,并不是由一个相对稳定的单峰分布渐渐过度到另一个单峰分布,这时单高斯背景模型就无能为力,不能准确地描述背景了。]1[ 2 混合高斯分布背景模型 与单高斯背景模型不同,混合高斯背景模型对每个像素点用多个高斯模型混合表示。设用来描述每个像素的高斯分布共K 个(K 通常取 3—5个),象素uv Z 的概率函数: ,,,1()(,,)K u v j u v u v j u v j u v j P Z N Z ωμ ==∑∑ 其中,j uv ω是第j 个高斯分布的权值, 背景建模和更新过程(仅针对单个像素): 1.初始化:第一个高斯分布用第一帧图像该点的像素值作为均值或前N 帧图像该点的像素值的平均值作为均值,并对该高斯分布的权值取较大值(比其它几个高斯分布大)。其余的高斯分布的均值均为0,权重相等,所有高斯函数的方差取相等的较大值。 2.权值归一化 3.选取背景

二项分布与正态分布

第七章假设检验 第一节二项分布 二项分布的数学形式·二项分布的性质 第二节统计检验的基本步骤 建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布 正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法 第四节中心极限定理 抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理 第五节总体均值和成数的单样本检验 σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验 一、填空 1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于()分布。 2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( ),它决定了否定域的大小。 3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(),原假设为真而被拒绝的概率越()。 4.二项分布的正态近似法,即以将B(x;n,p)视为()查表进行计算。 5.已知连续型随机变量X~N(0,1),若概率P{X ≥λ}=0.10,则常数λ=()。 6.已知连续型随机变量X~N(2,9),函数值 9772 .0 )2( = Φ ,则概率 }8 {< X P= ()。 二、单项选择 1.关于学生t分布,下面哪种说法不正确()。 A 要求随机样本 B 适用于任何形式的总体分布 C 可用于小样本 D 可用样本标准差S代替总体标准差σ 2.二项分布的数学期望为()。 A n(1-n)p B np(1- p) C np D n(1- p)。 3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为()。 A 大于0.5 B -0.5 C 1 D 0.5。

统计学各章计算题公式及解题方法

统计学各章计算题公式及解题方法 第四章数据的概括性度量 1.组距式数值型数据众数的计算:确定众数组后代入公式计算: 下限公式:;上限公式:,其中,L为众数所在组 下限,U为众数所在组上限,为众数所在组次数与前一组次数之差,为众数所在组次数与后一组次数之差,d为众数所在组组距 2.中位数位置的确定:未分组数据为;组距分组数据为 3.未分组数据中位数计算公式: 4.单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位 数所在的组—对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布) 5.组距式数列的中位数计算公式: 下限公式:;上限公式:,其中,为中位数 所在组的频数,为中位数所在组前一组的累积频数,为中位数所在组后一组的 累积频数 6.四分位数位置的确定: 未分组数据:;组距分组数据: 7.简单均值: 8.加权均值:,其中,为各组组 中值 9.几何均值(用于计算平均发展速度): 10.四分位差(用于衡量中位数的代表性): 11.异众比率(用于衡量众数的代表性):

统计学各章计算题公式及解题方法 12.极差:未分组数据 :;组距分组数据 : 13.平均差(离散程度):未分组数据:;组距分组数据: 14.总体方差:未分组数据:;分组数据: 15.总体标准差:未分组数据:;分组数据: 16.样本方差:未分组数据:;分组数据: 17.样本标准差:未分组数据:;分组数据: 18.标准分数: 19.离散系数: 第七章参数估计 1. 的估计值: σ已知

统计学各章计算题公式及解题方法 其中,查p448 ,查找时需查n-1的数值 3. 大样本总体比例的区间估计: 4. 总体方差 在置信水平下的置信区间为: 5. 估计总体均值的样本量:,其中,E 为估计误差 6. 重复抽样或无限总体抽样条件下的样本量: ,其中π为总体比例 第八章 假设检验 1. 总体均值的检验( 已知或 未知的大样本)[总体服从正态分布,不服从正态分布的 用正态分布近似] 已知 未知 值决策 ,拒绝 2. 总体均值检验( 未知,小样本,总体正态分布) 双侧检验 左侧检验

第7节 二项分布及正态分布(轻巧夺冠)

第7节 二项分布及正态分布 课标要求 1.了解条件概率和两个事件相互独立的概念.2.理解n 次独立重复试验的模型及 二项分布,并能解决一些实际问题.3.借助直观直方图认识正态分布曲线的特点及曲线所表示的几何意义. 【知识衍化体验】 知识梳理 1.条件概率 (1)对于任何两个事件A 和B ,在已知事件A 发生的条件下,事件B 发生的概率叫做________________,用符号来表示为________________,其公式为________________. (2)条件概率具有的性质: ①______________________________; ②如果B 和C 是两个互斥事件,则)|(A C B P =_______________. 2.事件的相互独立性 (1)对于事件A ,B ,若事件A 的发生与事件B 的发生互不影响,则称_______________. (2)若事件A 与B 相互独立,则)()|(A P A B P =___________. (3)若事件A 与B 相互独立,则______________,______________,______________也都相互独立. 3.独立重复试验与二项分布 (1)独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有____________种结果,即要么发生要么不发生,且任何一次试验中发生的概率都是一样的. (2)在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中A 发生的概率为p ,则)(k x P ==_______________,此时称随机变量X 服从_______________,记为_______________. 4.正态分布 (1)正态曲线:函数),(,21 )(222 )(,+∞-∞∈= --x e x x σμσ π?σμ,其中实数μ和σ为参数(0,>∈σμR ).我们称函数)(,x σμ?的图象为_______________,简称正态曲线. (2)正态曲线的特点: ①曲线位于x 轴 ,与x 轴不相交; ②曲线是单峰的,它关于直线 对称; ③曲线在 处达到峰值 σ π21 ; ④曲线与x 轴之间的面积为 ; ⑤当μ一定时,曲线的形状由σ确定,σ越小,曲线越“ ”,表示总体的分布越集中;

正态分布教案导学案

2.4.1正态分布 【教学目标】 1. 了解正态分布的意义,掌握正态分布曲线的主要性质及正态分布的简单应用。 2. 了解假设检验的基本思想,会用质量控制图对产品的质量进行检测,对生产过程进行控制。 【教学重难点】 教学重点:1.正态分布曲线的特点; 2.正态分布曲线所表示的意义. 教学难点:1.在实际中什么样的随机变量服从正态分布; 2.正态分布曲线所表示的意义. 【教学过程】 一、 设置情境,引入新课 这是一块高尔顿板,让一个小球从高尔顿板上方的通道口落下,小球在下落的过程中与层层小木块碰撞,最后掉入高尔顿板下方的某一球槽内。 问题1.在投放小球之前,你能知道这个小球落在哪个球槽中吗? 问题2.重复进行高尔顿板试验,随着试验次数的增加,掉入每个球槽中小球的个数代表什么? 问题3.为了更好的研究小球分布情况,对各个球槽进行编号,以球槽的编号为横坐标,以小球落入各个球槽的频率值为纵坐标,你能画出它的频率分布直方图吗? 问题4.随着试验次数的增加,这个频率直方图的形状会发生什么样的变化? 二、合作探究,得出概念 随着试验次数的增加,这个频率直方图的形状会越来越像一条钟形曲线 . 这条曲线可以近似下列函数的图像: 22 ()2,1(),(,),2x x e x μσμσ?πσ --= ∈-∞+∞ 其中实数(0)μσσ>和为参数,我们称,()x μσ?的图像为正态分布密度曲线,简称正态曲

线。 问题5.如果在高尔顿板的底部建立一个水平坐标轴,其刻度单位为球槽的宽度,X 表示一个随机变量,X 落在区间(,]a b 的概率为什么?其几何意义是什么? 一般地,如果对于任何实数a b <,随机变量X 满足 ,(

标准正态分布表

标准正态分布表 标准正态分布表怎么看 将未知量Z对应的列上的数与行所对应的数字结合查表定位 例如要查Z=1.96的标准正态分布表 首先在Z下面对应的数找到1.9 然后在Z右边的行中找到6 这两个数所对应的值为0.9750 即为所查的值 有谁知道,为什么标准正态分布表x的右边和下边都有值啊,难道一个x可以有两个值,看表是怎么看啊 那是一个精度问题,例如当x=0.12,那么应该先在x下方找到0.1,再在右边找到0.02,那么这两个同时对应的那个数就应该是你所要的! 标准正态分布的x值算出来介于两个之间,取哪一个。概论值如果介于两个间,取更大的还是更近的啊 精度要求不是很高的话,在正中取中间值,靠一边取更近的,四舍五入。 精度要求高的话用插值函数,比如在两点间作一次函数逼近。 为什么u0.025等于1.96?标准正态分布表查不到这个结果啊。u0.05是多少?u0.1是多少? 因为P{Z<1.96}=1-0.025=0.975 u0.05=1.645 因为P{Z<1.645}=1-0.05 u0.1类似 统计学中,标准正态分布表中Z值代表意义 Z值只是一个临界值,他是标准化的结果,本身没有意义,有意义的在于在标准正态分布模型中它代表的概率值。通过查表便可以知道。 标准正态分布 期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。 标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。 标准正态分布的密度函数为:

标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。

参数估计和假设检验习题解答

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,取0.05,α=26,n = 0.0250.9752 1.96z z z α===, 由检验统计量 1.25 1.96Z = ==<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。问,新工艺上浆率能否推广(α=0.05)? 解: 012112:, :,H H μμμμ≥< 3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)? 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n = 由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)? 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n = 由检验统计量0.9733Z = ==<1.65,接受H 0:p ≤0.05. 即, 以95%的把握认为p ≤0.05是成立的. 5.某产品的次品率为O.17,现对此产品进行新工艺试验,从中抽取4O0件检验,发现有次品56件,能否认为此项新工艺提高了产品的质量(α=0.05)? 解: 01:0.17, :0.17,H p H p ≥<采用非正态大样本统计检验法,拒绝域为Z z α<-,400,n = 0.950.05, 1.65z α=-=-,由检验统计量 400 1.5973i x np Z -= = =-∑>-1.65, 接受0:0.17H p ≥, 即, 以95%的把握认为此项新工艺没有显著地提高产品的质量. 6.从某种试验物中取出24个样品,测量其发热量,计算得x =11958,样本标准差s =323,问以5%的显著水平是否可认为发热量的期望值是12100(假定发热量是服从正态分布的)?

高三第一轮复习正态分布

概率 课时 正态分布 主干知识归纳 (1)正态曲线 函数φμ,σ(x )=1 2πσ e -(x -μ)22σ2,x ∈(-∞,+∞),① 其中μ,σ(σ>0)分别表示总体的 与 ,函数①的图象称为正态曲线. (2)正态曲线的性质 ①曲线在x 轴的上方,与x 轴不相交. ②曲线关于直线x =μ . ③曲线在x =μ时位于 . ④当x <μ时,曲线 ;当x >μ时,曲线 .并且当曲线向左、右两边无限延伸时,以x 轴为渐近线向它无限靠近. ⑤当μ一定时,曲线形状由σ确定.σ越大,曲线越“矮胖”,表示总体的分布越 ;σ越小,曲线越“瘦高”,表示总体的分布越 . (3)正态分布 一般地,如果对于任意实数a ,b (a μ+a ). 2.正态分布中要注意: (1)先弄清正态分布的均值μ和方差σ2分别是多少; (2)充分利用如下结论:若均值为μ,则由对称性可知P(X ≥μ)=0.5;P(X ≤μ)=0.5;P(X ≤μ+c)=P(X ≥μ-c)(c>0)等结论; (3)需要熟记P(μ-σ

正态分布和寿命问题的建模

误差问题的建模 ---正态分布的建立 正态分布模型最初是由高斯(Gauss )在研究误差理论时建立的。 对随机变量的高斯假定 设X 是可由物理手段测量的随机变量,μ是X 的稳定值(理想化的取值),则 εμ+=X , 并称με-=X 为测量误差. 对测量误差ε的统计建模 记误差ε的概率密度函数为)(εf ,求)(εf 的解析表示. 设对X 进行n 次独立观测,可得误差ε的样本 ,με-=i i x n i ,,2,1Λ=, 显然)()(με-=i i x f f 中含未知分布参数μ. 讨论未知分布参数μ应满足的条件. 由于n i εεε,,,2Λ的联合概率密度为 )() ; ,,,(1 21μμεεε-= ∏=n i i n x f L Λ. 根据最大似然法的思想,μ的值使L 最大,以最有利于样本n x x x ,,,21Λ的出现,故μ应满足 0=μ d dL , 进而 0) ()(log =--'-=∑μμμi i x f x f d L d ①

记)()()(εεελf f '=,则 ) () ()()(μμμλελ--'= -=i i i i x f x f x . 下面分析)(ελ的性质. 将未知常数μ的测量值的平均值用∑==n i i x n x 1 1替代,令 )()(),,,(1 1 21∑∑===-=n i i n i i n x x G ελλεεεΛ, 由①, 0),,,(21=n G εεεΛ. ② 又因为 01 1 =-=∑∑==x n x n i i n i i ε ,故n 个变量n εεε,,,21Λ的自由度为1-n ,令 )(121-+++-=n n εεεεΛ ③ 对②式微分,并注意③式的影响,得 0=?????+??=??i n n i i y G G G εεεε, 亦即 n i ελ ελ??=??,n i ,,2,1Λ=, 表明 c i i =??εελ) ((常数), 从而 b c +=εελ)((b 为常数), 进而 nb c G n i i n +=∑=1 21),,,(εεεεΛ, 由 01 =∑=n i i ε 可知0=b ,于是

考试成绩分布的数学模型

考试成绩分布的数学模型 吴潇辉 摘要:一门课程考完之后我们在分析成绩的时候会发现,一个班的成绩根据我们的经验往往是分布在[0,100]之间的任意一段(可设以10分为一段),并且考得特别低的很少,例如:0分、10分,考得特别高的也很少,例如:100分,但大多数人考的不是特别高也不是特别低,例如:70~90之间。 现在,我们要建立一个数学模型来研究分数的分布情况。我们主要通过运用概率论中随机变量的概率分布规律的讨论,运用软件对题目中的数据进行拟合的方法,并且把两种结果进行比较,最终得出学生成绩的分布服从三大随机变量概率分布中的正态分布。 关键词:数据拟合概率分布函数概率密度函数MATLAB MATHMATIC 一、问题的提出: 大学生学完一门课程,要进行考试,考试之后就有了成绩。通过这个成绩可以说明学生的学习情况也可以说明老师出题的合理性。有人说一个班级的老师成绩应付从正态分布可,那么,这种说法是否正确呢?例如下面的表格给出了某班某门课的考试成绩: 下面我们要解决的问题是: 1、通过上面的表格分析这个班的成绩是否服从正态分布。 2、结合表格中的成绩给出成绩服从正态分布的判别方法和标准,以说明成绩分

布的合理性。 二、模型假设: 1、次门课程出题的难易程度相对于学生的学习程度来说适中,也就是说这次成绩具有合理性,可以把它当作衡量其他出题是否合理的标准。 2、为了下面分析的方便我们姑且认为成绩的分布具有连续性。 三.符号说明 :y在某一段分数上的人数; : N班级总人数; :p在某一段分数上的人数所占的比例; (): p A试验结果A的概率; (): F x概率分布函数; (): p x概率密度函数; ,: σμ常数。 四、模型建立与求解: 从上面的表格中我们可以看出:成绩分布在70~90分之间的人数最多,在0~50分以及90~100分的人数很少,50~69分之间的人数也比较少。因此我们可以近似认为学生成绩与分布在某一段成绩的人数之间关系可近似用下面的草图来表示: 由于 y p N = 41 y =,也就是说对上面图中所有的纵坐标同除以41,因此应当不

例右侧正态分布均值的假设检验

Z 假设检验 例1 (Z 值右侧检验) 某种元件的寿命X (以h 计)服从正态分布N (μ,δ2 ), 已知δ2 =10000,μ未知,现在测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 取α=0.05,问是否有理由认为元件的平均寿命大于225h ? 解:按题意需检验 H 0:μ≤μ0=225 ,H 1 :μ>225 由题设得Z 0.05=1.65 , n=16,x =241.5, z 0.66 x = = = 得,Z 0.05=1.65 > z=0.66 即z 值没有落在拒绝域内,故接受H 0 。认为元件的平均寿命不大于225h.

例2(t值右侧检验)某种元件的寿命X(以h计)服从正态分布 N(μ,δ2 ), δ2 ,μ均未知,现在测得16只元件的寿命如下: 159280101212224379179264 222362168250149260485170 取α=0.05,问是否有理由认为元件的平均寿命大于225 h? 解:按题意需检验 H0:μ≤μ0=225 ,H1:μ>225 由题设得t0.05 (15)=1.75 , n=16, χ=241.5, 0.67 t=== 得,t0.05 (15)=1.75 > z=0.67 即z值没有落在拒绝域内,故接受H0。认为元件的平均寿命不大于225 h.

例3 某厂生产的某种型号的电池,其寿命(以h 计)长期以来服从方差δ2 =5000的正态分布,现有一批这种电池,从他的生产情况来看,寿命的波动性有所改变。现随机取26只电池,测出其寿命的样本方差S 2=9200。问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化(取α=0.02)? 解:本题要求在水平α=0.02下检验假设 H0: δ2 = 5000 , H0: δ2 ≠ 5000 现在n = 26 , 22/20.01(1)(25)44.314n αχχ-== , 221/20.99(25)(25)11.524αχχ-== . 即拒绝域为, 2 2 (1)44.314n S δ -≥ ,或 2 20 (1)11.524n S δ -≤ 由观察值S 2 = 9200 得 2 2 0(1)4644.314n S δ-=>, 所以拒绝H 0。认为这批电池寿命波动性较以往的有显著的变化。

正态分布模型解题

2.4.1正态分布 关于正态曲线性质的叙述: ①曲线关于直线x=μ对称,这个曲线在x 轴上方; ②曲线关于直线x=σ对称,这个曲线只有当x ∈(-3σ,3σ)时才在x 轴上方; ③曲线关于y 轴对称,因为曲线对应的正态密度函数是一个偶函数; ④曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低; ⑤曲线的对称轴由μ确定,曲线的形状由σ确定; ⑥σ越大,曲线越“矮胖”,σ越小,曲线越“瘦高”; 上述说法正确的是 一、 知识梳理 1.正态分布的重要性 正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。 2.正态曲线及其性质 正态分布函数:22 ()21 ()2x f x e μσπσ -- = ,x ∈(-∞,+∞)其中实数(0) μσσ>和为参数,我们称,()x μσ?的图像为正态分布密度曲线,简称正态曲线。 3.标准正态曲线 标准正态曲线N (0,1)是一种特殊的正态分布曲线,00()1()x x Φ-=-Φ,以及标准正态总体在任一区间(a ,b)内取值概率)()(a b P Φ-Φ=。 4.一般正态分布与标准正态分布的转化 由于一般的正态总体),(2σμN 其图像不一定关于y 轴对称,对于任一正态总体),(2σμN , 其取值小于x 的概率)()(σ μ -Φ=x x F 。只要会用它求正态总体),(2σμN 在某 个特定区间的概率即可。 一般地,如果对于任何实数a b <,随机变量X 满足 ,(

假设检验习题答案

1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。334.116/60800 820=-=t 。因为t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差 σ已知,当

统计学各章计算题公式及解题方法

x = ———- — = = 8. 6. 一组的累积频数 四分位数位置的确定: 下四分位数:Q A =苇一 上I 甲分位数:% = 3 山: 1) 未分组数据: ;组距分组数据: 7. 简单均值: JI r + r ■+ + [ _ r 〒叫T …T f : L x = ------------- n y Mf., _晒斤+叫&—+出血自叭'r i 加权均值: 各组组中值 ,其中, 统计学各章计算题公式及解题方法 第四章数据的概括性度量 组距式数值型数据众数的计算:确定众数组后代入公式计算: 单变量数列的中位数:先计算各组的累积次数(或累积频率)一根据位置公式确定中位 数所在的组一对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在 该组内均匀分布) 组距式数列的中位数计算公式: 位数所在组的频数, 1. 下限公式: ;上限公式: ,其中,L 为众数所 在组下限,U 为众数所在组上限, 卜I 为众数所在组次数与前一组次数之差, 阪为众数所 在组次数与后一组次数之差, d 为众数所在组组距 2. 中位数位置的确定:未分组数据为 n+ 1 ~T~ ;组距分组数据为 3. 未分组数据中位数计算公式: 4. 5. 下限公式: n 2 -几-1 二匕 ------ ---- X d * m n 2+^i+l = U - ;上限公式: ,其中, 为中 ,门为偶数

几何均值(用于计算平均发展速度) 四分位差(用于衡量中位数的代表性) 异众比率(用于衡量众数的代表性) 离散系数:叫-丘 第七章参数估计 的估计值: 置信水平 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 1. 2 (策一三)£ z i=l 2 f = 1 样本方差:未分组数据: 斥-1 ;分组数据: S A n -1 n - 1 总体标准差:未分组数据: 90% 0.1 0.05 1.654 95% 0.05 0.025 1.96 极差:未分组数据: ' - ;组距分组数据: R =最高组上限 -Kttfi 下限 平均差(离散程度) = --------------- :未分组数据:“ “ k Y 网 Tt ; .0= 1 M J = -------------------- d n £ (叼-M F 一2 _ ' = 1 £ (叫-心 z 上=】 N ;分组数据: a - N \ i = 1 a = N ;分组数据: 4 N 样本标准差:未分组数据: : ' ;组距分组数据: 总体方差:未分组数据: ;分组数据:

蒙特卡罗方法的基本思想与解题步骤

1 蒙特卡罗方法的基本思想与解题步骤 蒙特卡罗方法也称随机模拟法、随机抽样技术或统计试验法,其基本思想是:为了求解数学、物理、工程技术或生产管理等方面的问题,首先建立一个与求解有关的概率模型或随机过程,使它的参数等于所求问题的解,然后通过对模型或过程的观察或抽样试验来计算所求参数的统计特征,最后给出所求解的近似值。概率统计是蒙特卡罗方法的理论基础,其基本手段是随机抽样或随机变量抽样,对于那些难以进行的或条件不满足的试验而言,是一种极好的替代方法。 蒙特卡罗方法可以解决随机性问题和确定性问题,求解确定性问题的基本步骤如下:(1)建立一个与求解有关的概率模型,使求解为所构建模型的概率分布或数学期望;(2)对模型进行随机抽样观察,即产生随机变量;(3)用算术平均数作为所求解的近似平均值,给出所求解的统计估计值的方差或标准差,即解的精度。 2 伪随机数的产生 利用蒙特卡罗方法以模拟一个实际问题,需要用到各种随机变量,因此随机数的产生非常重要。在计算机上的产生随机数的方法有三类:(1)把已有的随机数表输入机器;(2)用物理方法产生真正的随机数;(3)用数学方法产生伪随机数。利用数学方法产生随机数具有占有内存小,产生速度快,便于重复,不受计算机条件限制等优点,因而被大量使用。因利用数学方法产生的随机数是根据确定的递推公式计算的,存在周期现象,不满足真正随机数的要求,这种随机数称为伪随机数。在实际应用中,只要伪随机数能通过一系列统计检验,我们还是可以把它当做“真正”的随机数来应用。 产生随机数的数学方法,最常应用的有: 同余法。其中,剩同余法和混合同余法能够产生周期长且统计性质优的数值序列,因而应用也最广。 平方取中法。当位数较少时,产生的伪随机数领导于零的较多,位数越来越多时,偏于零的就会越来越少。 易位指令加法。方法简便,速度较快,其所产生的随机数随机性一般较好,但周期不定,且通常很短;随着初选值的不同,所产生的随机数序列长度也有很大差异。 3 随机数的检验 随机数的统计检验,就是根据(0,1)上均匀总体简单子样式的性质来研究所产生的随机数序列的相应性质,进行比较鉴别,视其差异显著与否,决定取舍。如果所产生的伪随机数经过各类检验,其差异均不显著,我们即接受其为均匀总体随机数的子样。

高考数学解题技巧大揭秘 专题19 概率、随机变量及其分布列

专题十九 概率、随机变量及其分布列 1.某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示. (1)确定x ,y 的值,并求顾客一次购物的结算时间X 的分布列与数学期望; (2)若某顾客到达收银台时前面恰有2位顾客需结算,且各顾客的结算相互独立,求该顾客结算前的等候时间不超过分钟的概率.(注:将频率视为概率) 答案:解 (1)由已知得25+y +10=55,x +30=45,所以x =15,y =20.该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,将频率视为概率得 P (X =1)= 15100=320,P (X ==30100=310,P (X =2)=25100=14,P (X ==20100=15,P (X =3)=10100 =110 . X 的分布列为 X 的数学期望为 E (X)=1×3 20+×310+2×14+×15+3×110 =. (2)记A 为事件“该顾客结算前的等候时间不超过分钟”,X i (i =1,2)为该顾客前面第i 位顾客的结算时间,则 P (A)=P (X 1=1且X 2=1)+P (X 1=1且X 2=+P (X 1=且X 2=1). 由于各顾客的结算相互独立,且X 1,X 2的分布列都与X 的分布列相同,所以 P (A)=P (X 1=1)×P (X 2=1)+P (X 1=1)×P (X 2=+P (X 1=×P (X 2=1)= 320×320+320×310

+3 10 × 3 20 = 9 80 . 故该顾客结算前的等候时间不超过分钟的概率为 9 80 . 结合事件的互斥性、对立性、独立性以及古典概型,主要以解答题的方式考查离散型随 机变量分布列、期望和方差的求解及其实际应用. 本部分复习要从整体上,知识的相关关系上进行.离散型随机变量问题的核心是概率计算,而概率计算又以事件的独立性、互斥性、对立性为核心,在解题中要充分分析事件之间的关系. 必备知识 互斥事件有一个发生的概率 若A、B是互斥事件,则P(A+B)=P(A)+P(B),P(A)+P(A)=1. 相互独立事件与n次独立重复试验 (1)若A1,A2,…,A n是相互独立事件,则P(A1·A2·…·A n)=P(A1)·P(A2)·…·P(A n). (2)如果在一次试验中事件A发生的概率为p,事件A不发生的概率为1-p,那么在n 次独立重复试验中事件A发生k次的概率为: P n(k)=C k n p k(1-p)n-k. 离散型随机变量的分布列、期望与方差 (1)主干知识:随机变量的可能取值,分布列,期望,方差,二项分布,超几何分布,正态分布. (2)基本公式:①E(ξ)=x1p1+x2p2+…+x n p n+…; ②D(ξ)=(x1-E(ξ))2p1+(x2-E(ξ))2p2+…+(x n-E(ξ))2p n+…; ③E(aξ+b)=aE(ξ)+b,D(aξ+b)=a2D(ξ); ④二项分布:ξ~B(n,p),则P(ξ=k)=C k n p k(1-p)n-k,E(ξ)=np,D(ξ)=np(1-p). 正态分布 (1)若X服从参数为μ和σ2的正态分布,则可表示为X~N(μ,σ2). (2)N(μ,σ2)的分布密度曲线关于直线x=μ对称,该曲线与x轴所围成的图形的面积为1. (3)当X~N(μ,σ2)时,=P(μ-σ<X≤μ+σ),=P(μ-2σ<X≤μ+2σ),=P(μ-3σ<X≤μ+3σ). 以上三个概率值具有重要的应用,要熟记,不可混用.

单个正态总体的假设检验复习过程

单个正态总体的假设 检验

学号:20115034036 学年论文(本科) 学院数学与信息科学学院 专业信息与计算科学 年级 2011级 姓名姚瑞娟 论文题目单个正态总体的检验假设 指导教师韩英波职称副教授 成绩 2014年3月10日

目录 摘要 (1) 关键词 (1) Abstrac (1) Keywords (1) 前言 (1) 1 假设检验的基本步骤 (2) 1.1 建立假设 (2) 1.2 建立假设选择检验统计量,给出拒绝域形式 (3) 2 单个正态总体均值的检验 (3) 2.1 δ已知时的μ检验 (5) 2.2 δ未知时的t检验 (7) 3 单个正态总体方差的检验 (9) 参考文献 (10)

单个正态总体的假设检验 学生姓名:姚瑞娟学号:20115034036 数学与信息科学学院信息与计算科学专业 指导老师:韩英波职称:副教授 摘要:本文介绍了假设检验的基本步骤,如何建立假设检验,判断假设是否正确.此外,从2δ已知和2δ未知详细的讲述了单个正态总体μ的检验,还有单个正态总体方差的检验,及与它们相关的应用举例. 关键词:正态分布;假设检验;均值;方差;拒绝域;接受域;原假设; Hypothesis test of one normal population Abstract:It introduces the basic steps of hypothesis test in this paper, and how to build hypothesis and correct judgment test. In addition, it detailed introduces the single hypothesis test from variance is known and unknown. There is a single of normal population variance test and the related application. Keywords: normal distribution;price value;hypothesis test;variance; rejected region; receptive regions;the original hypothesis 前言 假设检验是由K.Pearson于20世纪初提出的,之后由费希尔进行了细化,并最终由奈曼和E.Pearson提出了较完整的假设检验理论.统计推断的一个重要内容就是假设检验.然而,正态分布正态分布是最重要的一种概率分布,正态分布概念是由德国的数学家和天文学家Moiré于1733年受次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大他使正态分布同时有了”高斯分布”的名称,后世之所以多将

03概率统计四大解题策略(理科原卷版)

1 03 概率统计四大解题策略 一.【学习目标】 1.会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间的相关关系; 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程; 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用; 4.了解回归的基本思想、方法及简单应用. 二.【知识要点】 1.相关关系的分类 从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称之为 ;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为 . 2.线性相关 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫 . 3.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的__ 最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则?????b ^=∑n i =1 (x i -x -)(y i -y -)∑n i =1 (x i -x -)2=∑n i =1x i y i -nx -y -∑n i =1x 2i -nx -2,a ^=y - -bx -.其中b ^是回归方程的 ____ ,a ^是在y 轴上的截距. 4.样本相关系数 r =∑n i =1 (x i -x -)(y i -y -)∑n i =1 (x i -x -)2 ∑n i =1 (y i -y -)2 ,用来衡量两个变量间的线性相关关系. (1)当r>0时,表示两个变量 ; (2)当r<0时,表示两个变量 ; (3)r 的绝对值越接近1,表明两个变量的线性相关性 ____ ;r 的绝对值越接近于0,表示两个变量之间几乎不存在相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 5.线性回归模型

相关文档