文档库 最新最全的文档下载
当前位置:文档库 › 北航2014级硕士研究生应用数理统计答案(B卷)

北航2014级硕士研究生应用数理统计答案(B卷)

北航2014级硕士研究生应用数理统计答案(B卷)
北航2014级硕士研究生应用数理统计答案(B卷)

2014-2015 学年 第一学期期末试卷答案

学号 姓名 成绩 考试日期: 2015年1月13日

考试科目:《应用数理统计》(B 层)

一、填空题(本题共16分,每小题4分)

1.设122,,n x x x ,是来自正态总体2(,)N μσ的简单样本,则c =

n m

m

- 时,统计量2

22112

2211

()()m

k

k k n k

k k m x

x c

x

x η-=-=+-=-∑∑服从F -分布。

2. 设12,,n x x x ,是来自正态总体2

(0,)N σ的简单样本,用2

2

21

1?()n

i i nx x n σ

===∑估计2σ,则均方误差2222?()E σσ

σ- 42σ 。 3.设总体X 的密度函数为22

,[0,]

(;)0,

[0,]x x p x x θθθθ?∈?=????,其中0θ>,12,,,n x x x 是

来自总体X 简单样本,则2()q θθ=的矩估计?q

= 2

94

x 或2

1

2n i i x n =∑ 。 4.在双因素方差分析中,总离差平方和T S 的分解式为

T A B A B e S S S S S ?=+++

其中2

111

()p

q

r

e ijk ij i j k S x x ?====-∑∑∑,11r

ij ijk k x x r ?==∑,

则e S 的自由度是 (1)p q r - 或n pq -,其中n pqr = 。

二、(本题12分)设总体X 的密度函数为111,(0,1)

(;)0,(0,1)x x f x x θ

θθ-?∈?=????

,其中0θ>,

12,,,n x x x 是来自总体X 的简单样本。

(1)求θ的极大似然估计?θ;(2)求θ的一致最小方差无偏估计;(3)问θ的一致最小方差无偏估计是否为有效估计?证

明你的结论。

解(1)似然函数为

(1)()1

1

{01}121

1

()()

(,,,)n n

i x x n n

i L x I x x x θ

θθ-<≤<==

对数似然函数为

(1)(){01}121

1

ln ()ln (1)ln ln (,,,)n n

i x x n i L n x I x x x θθθ

<≤<==-+-+∑

求导,有

2

1

ln ()1

ln n

i

i L n x θθθθ

=?=--?∑

令ln ()0L θθ?=?,可得θ的极大似然估计为1

1?ln n

i i x n θ==-∑。 (2)因为

(1)()1

1

12{01}121

1

(,,,;)()

(,,,)n n

n i x x n n

i f x x x x I x x x θ

θθ-<≤<==

(1)(){01}121

1

1

(,,,)exp{(1)ln }n n

x x n i n

i I x x x x θθ

<≤<==-∑

令1

()n

c θθ

=

,(1)(){01}12()(,,,)n x x n h x I x x x <≤<= ,1

()1w θθ

=

-,1

ln n

i i T x ==∑,由于()

w θ的值域(0,)+∞有内点,由定理2.2.4知1

ln n

i i T x ==∑是完全充分统计量。而

1

1

1

1

(ln )(ln )i E x x x dx θθθ

-=

=-?

所以

1

1

(ln )(ln )n

n

i i i i E x E x n θ====-∑∑

因而11?ln n i i x n θ==-∑既是完全充分统计量1

ln n i i T x ==∑的函数,又是θ的无偏估计,由定理2.2.5知11?ln n

i

i x n θ==-∑是θ一致最小方差无偏估计。 (3)由于1

1?()(ln )Var Var x n

θ=,而 22

111(ln )(ln )((ln ))Var x E x E x =-11

1

2

220

1

(ln )x x dx θθθθ

-=

-=?

所以21?()Var n

θ

θ=。 又因为当(0,1)x ∈时,

2223

ln (;)12

ln f x x θθθθ?=+?,所以 222

ln (;)1()()f x I E θθθθ

?=-=? 从而22()?()()

Var n nI θθθθ'==

,即信息不等式等号成立,故11?ln n

i i x n θ==-∑是θ的有效估计。

三、(本题12分)设n x x x ,,,21 是来自正态总体20(,)N μσ的简单样本,

其中2

0σ是已知常数,μ是未知参数。考虑假设检验问题

0010::H H μμμμ=<

(1)求显著性水平α(01)α<<下的似然比检验;(2)求犯第二类错误的概率。

解:(1)当0μμ≤时,μ的极大似然估计为0?min{,}x μ

μ=似然比统计量为 01212120sup{(,,,;)}(,,,)(,,,;)n n n p x x x x x x p x x x μμ

μλμ≤=

0201,1exp{},2x x x μμ>?

?

?≤=??

??

令x U =

,则

0122

01,(,,,)1exp{},2

n x x x x U x μλμ>??

=?≤?? 即

122

1,0(,,,)1exp{},02

n U x x x U U λ>??

=?≤?? 由于12(,,,)n x x x λ 的最小值是1,所以当0H 成立()x λ远离1时拒绝0H ,即()x c λ≥拒绝0H ,只有在0U <时才能获得,因而有

001{()}{}P x c P U c μμλα≥=≤=

又由于0H 成立时,U 服从(0,1)N ,因此11c u u αα-==-

。故似然比检验的统计量可取为

x U =

,拒绝域为121{(,,,):}n x W x x x U u α-=

≤- 。

(2)二类错误的概率为

11{}x P U z P u μαμα-->-=>-

11(u αΦ-=---

,0μμ<

四、(本题10分)考虑某四因子二水平试验,除考察因子D C B A ,,,外,还需考察交互作用B A ?,A C ?。今选用表)2(78L ,表头设计及试验数据如表所示,所考虑指标是越小越好。试用极差分析方法指出因子的主次顺序和较优工艺条件。

五、(本题10分)随机向量),,(321x x x 的相关系数矩阵

1

1

1R ρρρ

ρρρ

?? ?= ? ??

?

(1)根据主成分75%的选取标准,若只选取一个主成分,求ρ满足的条件。

解:(1)求特征根

21||1(1)(12)1

I R λρρ

λρλρλρλρρρλ----=---=-+-----

令||0I R λ-=,可得112λρ=+,21λρ=-,11λρ=-。 若只选取一个主成分,只要1123120.83

λρλλλ+=≥++,即0.7ρ≥。

(2)求解齐次线性方程组

1232202u u u ρρρρρρρρ

ρ--???? ???--= ??? ???--?

???

可获得对应于特征值112λρ=+

的单位特征向量为α'=,则第一主

成分为1123y x x x =+。

《应用概率统计》复习题及答案

工程硕士《应用概率统计》复习题 考试要求:开一页;题目类型:简答题和大题;考试时间:100分钟。 1. 已知 0.5,)( 0.4,)( 0.3,)(===B A P B P A P 求)(B A P ?。 解:因为 0.7,0.3-1)(-1(A)===A P P 又因为, ,-- A B A B A A B A AB ?== 所以 0.2,0.5-7.0)( -(A))(A ===B A P P B P 故 0.9.0.2-0.40.7P(AB)-P(B)(A))(A =+=+=?P B P 2.设随机变量)1(,9 5 )1(),,4(~),,2(~≥=≥Y P X P p b Y p b X 求并且。 解: . 8165 31-1-10)(Y -11)(Y ),3 1,4(~,31,94-1-1-10)(X -1)1(,9 5)1(),,2(~422 ====≥=====≥=≥)(故从而解得)所以() (而且P P b Y p p p P X P X P p b X 3.随机变量X 与Y 相互独立,下表中给出了X 与Y 的联合分布的部分数值,请将表中其

4.设随机变量Y 服从参数2 1=λ的指数分布,求关于x 的方程0322 =-++Y Yx x 没有实根的概率。 解:因为当时没有实根时,即0128Y -Y 03)-4(2Y -Y 2 2 <+<=?,故所求的概率为}6Y P{20}128Y -P{Y 2 <<=<+,而Y 的概率密度 ?? ???≤>=0,00 ,21f(y)21-y y e y ,从而36221 -621-1dy 21f(y)dy 6}Y {2e e e P y ===<

《应用数理统计》期末考试-2011

《应用数理统计》期末考试试题 (2011-11-26上午8:30—10:30) 学院: 学号: 姓名: 注意:所有题目答案均做在答题纸上,该试卷最后随答题纸一同上交,否则成绩无效。 1、(20分)设总体X 服从正态分布(0,1)N ,12,X X 为来自总体X 的简单样本,设112212; Y X X Y X X =+=-。 (1)求二维随机变量12(,)Y Y 的联合密度()21,y y f ; (2)分别求12,Y Y 的边缘密度函数()()2121,y f y f Y Y ; (3)12,Y Y 是否独立?说明根据。 (4)叙述2χ分布的构造性定义。能否通过取适当的常数c ,使得2212()c Y Y +服从2χ分布?若可以,求出c ,并写出所服从的2χ分布的自由度。 2、(20分)设12,,,n X X X 是来自正态总体() 2~0,X N σ的简单样本,记 22221 21111??();1n n i i i i X X X n n σσ===-=-∑∑,其中11n i i X X n ==∑, (1)证明:21?σ是2 σ的渐近有效估计量; (2)证明:22?σ是2 σ的有效估计量; (3)试分别以21?σ,22?σ为基础构造2 σ的两种1α-置信区间。你认为你得到的哪个估计区间会更好一些?为什么? 3、(20分)(1)简述假设检验的一般步骤; (2)某厂生产一批产品,质量检查规定:若次品率0.05p ≤,则这批产品可以出厂,否则不能出厂。现从这批产品中抽查400件产品,发现有30件是次品,问:在显著性水平0.05α=下,这批产品能否出厂?若取显著性水平0.02α=,会得出什么结论?α是越小越好吗?对你的答案说明理由。 要求:将此问题转化成统计问题,利用所学知识给出合理的、令人信服的推断,推断过程的每一步要给出理由或公式。分位点定义如下: 若随机变量W ,对任意的()1,0∈α,有()α=≤x W P ,称x 为W 的α分位点,记作αx 。

《应用概率统计》张国权编课后答案详解习题一解答

习 题 一 解 答 1. 设A、B、C表示三个随机事件,试将下列事件用A、B、C及其运算符号表示出来: (1) A发生,B、C不发生; (2) A、B不都发生,C发生; (3) A、B中至少有一个事件发生,但C不发生; (4) 三个事件中至少有两个事件发生; (5) 三个事件中最多有两个事件发生; (6) 三个事件中只有一个事件发生. 解:(1)C B A (2)C AB (3)()C B A ? (4)BC A C AB ABC ?? (5)ABC (6)C B A C B A C B A ?? ――――――――――――――――――――――――――――――――――――――― 2. 袋中有15只白球 5 只黑球,从中有放回地抽取四次,每次一只.设Ai 表示“第i 次取到白球”(i =1,2,3,4 ),B表示“至少有 3 次取到白球”. 试用文字叙述下列事件: (1) 41 ==i i A A , (2) A ,(3) B , (4) 32A A . 解:(1)至少有一次取得白球 (2)没有一次取得白球 (3)最多有2次取得白球 (4)第2次和第3次至少有一次取得白球 ――――――――――――――――――――――――――――――――――――――― 3. 设A、B为随机事件,说明以下式子中A、B之间的关系. (1) A B=A (2)AB=A 解:(1)A B ? (2)A B ? ――――――――――――――――――――――――――――――――――――――― 4. 设A表示粮食产量不超过500公斤,B表示产量为200-400公斤 ,C表示产量低于300公斤,D表示产量为250-500公斤,用区间表示下列事 件: (1) AB , (2) BC ,(3) C B ,(4)C D B )( ,(5)C B A . 解:(1)[]450,200; (2)[]300,200 (3)[]450,0 (4)[]300,200 (5)[]200,0 ――――――――――――――――――――――――――――――――――――――― 5. 在图书馆中任选一本书,设事件A表示“数学书”,B表示“中文版”, C表示“ 1970 年后出版”.问: (1) ABC表示什么事件? (2) 在什么条件下,有ABC=A成立? (3) C ?B表示什么意思? (4) 如果A =B,说明什么问题? 解:(1)选了一本1970年或以前出版的中文版数学书 (2)图书馆的数学书都是1970年后出版的中文书 (3)表示1970年或以前出版的书都是中文版的书 (4)说明所有的非数学书都是中文版的,而且所有的中文版的书都不是数学书 ――――――――――――――――――――――――――――――――――――――― 6. 互斥事件与对立事件有什么区别?试比较下列事件间的关系. (1) X < 20 与X ≥ 20 ; (2) X > 20与X < 18 ;

应用数理统计吴翊李永乐第三章假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显著影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显著性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测 得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分布, 试在显著水平下确定这批元件是否合格。 解:

{}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从一 批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比, X 较μ大20(2/cm kg )。设总体方差不变,问在01.0=α下能否认为这批钢索质量显著提 高 解: (1)提出假设0100::μμμμ>=H H , (2)构造统计量5.13 /4020 /u 00 == -= n X σμ (3)否定域{}α->=1u u V (4)给定显著性水平01.0=α时,临界值33.21=-αu (5) α-<1u u ,在否定域之外,故接受原假设,认为这批钢索质量没有显著提高。 某批矿砂的五个样品中镍含量经测定为(%): 设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为

应用数理统计试题库

一 填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本, 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时,CY 服从2χ分布。 2 设统计量)(~n t X ,则~2X F(1,n) , ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本,当常数C = 1/2(n-1) 时, ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。对于固定的0x , 则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为?λ = 。 6.设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的 置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7.设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑??? ? ??=8221, 10μ 令Y =X Y Y ???? ??=???? ??202121,则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8.某试验的极差分析结果如下表(设指标越大越好): 表2 极差分析数据表

最新北航数理统计大作业-多元线性回归

北航数理统计大作业-多元线性回归

应用数理统计多元线性回归分析 (第一次作业) 学院: 姓名: 学号: 2013年12月

交通运输业产值的多元线性回归分析 摘要:本文基于《中国统计年鉴》(2012年版)统计数据,寻找影响交通运输业发展的因素,包括工农业发展水平、能源生产水平、进出口贸易交流以及居民消费水平等,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,最后可以利用有效的最优回归模型对将来进行预测。 关键字:多元线性回归,逐步回归,交通运输产值,工业产值,进出口总额1,引言 交通运输业指国民经济中专门从事运送货物和旅客的社会生产部门,包括铁路、公路、水运、航空等运输部门。它是国民经济的重要组成部分,是保证人们在政治、经济、文化、军事等方面联系交往的手段,也是衔接生产和消费的一个重要环节。交通运输业在现代社会的各个方面起着十分重要的作用,因此研究交通运输业发展水平与各个影响因素间的关系显得十分重要,建立有效的数学相关模型对于预测交通运输业的发展,制定相关政策方案提供依据。根据经验交通运输业的发展受到工农业发展、能源生产、进出口贸易以及居民消费水平等众因素的影响,故建立一个完整精确的数学模型在理论上基本无法实现,并且在实际运用中也没有必要,一种简单有效的方式就是寻找主要影响因素,分析其与指标变量的相关性,建立多元线性回归模型就是一种有效的方式。 变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009-2010年度上学期研究生公共课 《应用数理统计》期末考试试题 (每题25分,共计100分) (请将答案写在答题纸上) 1设X 服从),0(θ上的均匀分布,其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本, (1)求θ的矩估计量1?θ和最大似然估计量2 ?θ; (2)讨论1?θ、2?θ的无偏性,1?θ、2?θ是否为θ的无偏估计量?若不是,求使得i c ?i i c θ为θ的无偏估计量,; 1,2i =(3)讨论1?θ、2 ?θ的相合性; (4)比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, (1).在显著性水平0.10α=下,能否认为2212σσ=? (2).求12μμ?的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知,样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

(1) 求2211 (n i i X )μσ=?∑的分布; (2)若0μ=,求212212()() X X X X +?的分布; (3)方差的置信度为12σα?的置信区间的长度记为L ,求()E L ; (4)1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位:粒)与温度x (单位:)的关系, 得到资料如下: C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算:26.43x =,ln 3.612y =,,, 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑(1)求Y 对x 的曲线回归方程; x b e a y ???=(2)求的无偏估计; 2σ2?σ (3)对回归方程的显著性进行检验(05.0=α); (4)求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据: 0.02282z =,()()0.050.057,8 3.50,8,7 3.73F F ==,()0.0515 1.7531t =,,,,0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =,0.05(1,5) 6.61F =, 0.05(1,7) 5.59F =

北航数理统计第二次大作业-数据分析模板

数理统计第二次大作业材料行业股票的聚类分析与判别分析 2015年12月26日

材料行业股票的聚类分析与判别分析摘要

1 引言 2 数据采集及标准化处理 2.1 数据采集 本文选取的数据来自大智慧软件的股票基本资料分析数据,从材料行业的股票中选取了30支股票2015年1月至9月的7项财务指标作为分类的自变量,分别是每股收益(单位:元)、净资产收益率(单位:%)、每股经营现金流(单位:元)、主营业务收入同比增长率(单位:%)、净利润同比增长率(单位:%)、流通股本(单位:万股)、每股净资产(单位:元)。各变量的符号说明见表2.1,整理后的数据如表2.2。 表2.1 各变量的符号说明 自变量符号 每股收益(单位:元)X1 净资产收益率(单位:%)X2 每股经营现金流(单位:元)X3 主营业务收入同比增长率(单位:%)X4 净利润同比增长率(单位:%)X5 流通股本(单位:万股)X6 每股净资产(单位:元)X7 表2.2 30支股票的财务指标 股票代码X1 X2 X3 X4 X5 X6 X7 武钢股份600005-0.0990-2.81-0.0237-35.21-200.231009377.98 3.4444宝钢股份6000190.1400 1.980.9351-14.90-55.011642427.88 6.9197山东钢铁600022-0.11650.060.0938-20.5421.76643629.58 1.8734北方稀土6001110.0830 3.640.652218.33-24.02221920.48 2.2856

杭钢股份600126-0.4900-13.190.4184-36.59-8191.0283893.88 3.4497抚顺特钢6003990.219310.080.1703-14.26714.18112962.28 1.4667盛和资源6003920.0247 1.84-0.2141-5.96-19.3739150.00 1.2796宁夏建材6004490.04000.510.3795-22.15-92.3447818.108.7321宝钛股份600456-0.2090-2.53-0.3313-14.81-6070.2043026.578.1497山东药玻6005290.4404 5.26 1.2013 6.5016.7825738.018.5230国睿科技6005620.410011.53-0.2949 3.3018.9416817.86 3.6765海螺水泥600585 1.15169.05 1.1960-13.06-25.33399970.2612.9100华建集团6006290.224012.75-0.57877.90-6.4034799.98 1.8421福耀玻璃6006600.790014.250.9015 3.6017.27200298.63 6.2419宁波富邦600768-0.2200-35.02-0.5129 3.1217.8813374.720.5188马钢股份600808-0.3344-11.710.3939-21.85-689.22596775.12 2.6854亚泰集团6008810.02000.600.1400-23.63-68.16189473.21 4.5127博闻科技6008830.503516.71-0.1010-10.992612.8023608.80 3.0126新疆众和6008880.0523 1.04-0.910662.64162.0464122.59 5.0385西部黄金6010690.0969 3.940.115115.5125.5712600.00 2.4965中国铝业601600-0.0700-2.920.2066-9.0882.79958052.19 2.3811明泰铝业6016770.2688 4.66-1.09040.8227.8640770.247.4850金隅股份6019920.1989 3.390.3310-10.05-39.01311140.26 6.7772松发股份6032680.35007.00-0.3195-4.43-9.622200.00 6.0244方大集团0000550.0950 5.66-0.480939.2920.6742017.94 1.6961铜陵有色0006300.0200 1.220.6132 3.23-30.74956045.21 1.5443鞍钢股份000898-0.1230-1.870.7067-27.32-196.21614893.17 6.4932中钢国际0009280.572714.45-0.4048-14.33410.2441286.57 4.2449中材科技0020800.684610.27 1.219547.69282.1740000.00 6.8936中南重工0024450.1100 4.300.340518.8445.0950155.00 2.7030 2.2 数据的标准化处理 由于不同的变量之间存在着较大的数量级的差别,因此要对数据变量进行标准化处理。本文采用Z得分值法标准化的方法进行标准化,用x的值减去x的均值再除以样本的方差。也就是把个案转换为样本均值为0、标准差为1的样本。如果不同变量的变量值数值相差太大,会导致计算个案间距离时,由于绝对值较小的数值权数较小,个案距离的大小几乎由大数值决定,标准化过程可以解决此类问题,使不同变量的数值具有同等的重要性。经Z标准化输出结果见表 2.2。 表2.2 经Z标准化后的数据 ZX1ZX2ZX3ZX4ZX5ZX6ZX7

北航应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β 的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

北航数理统计期末考试题

材料学院研究生会 学术部 2011年12月 2007-2008学年第一学期期末试卷 一、(6分,A 班不做)设x 1,x 2,…,x n 是来自正态总体2(,)N μσ的样本,令 )x x T -= , 试证明T 服从t -分布t (2) 二、(6分,B 班不做)统计量F-F(n,m)分布,证明 111(,)F F n m αααα-的(0<<1)的分位点x 是。 三、(8分)设总体X 的密度函数为 其中1α>-,是位置参数。x 1,x 2,…,x n 是来自总体X 的简单样本,试求参数α的矩估计和极大似然估计。 四、(12分)设总体X 的密度函数为 1x exp x (;) 0 , p x μμσσσ??-? -≥??? =????? ,其它, 其中,0,μμσσ-∞<<+∞>已知,是未知参数。x 1,x 2,…,x n 是来自总体X 的简单样本。 (1)试求参数σ的一致最小方差无偏估计σ∧ ; (2)σ∧ 是否为σ的有效估计?证明你的结论。

五、(6分,A 班不做)设x 1,x 2,…,x n 是来自正态总体211(,)N μσ的简单样本,y 1,y 2,…,y n 是来自正态总体222(,)N μσ的简单样本,且两样本相互独立,其中221122,,,μσμσ是未知参数,2212σσ≠。为检验假设012112:, :,H H μμμμ=≠可令12, 1,2,..., , ,i i i z x y i n μμμ=-==-则上述假设检验问题等价于0111:0, :0,H H μμ=≠这样双样本检验问题就变为单检验问题。基于变换后样本z 1,z 2,…,z n ,在显著性水平α下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6分,B 班不做)设x 1,x 2,…,x n 是来自正态总体20(,)N μσ的简单样本,0μ已知,2σ未知,试求假设检验问题 22220010:, :H H σσσσ≥<的水平为α 的UMPT 。 七、(6分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方面? 八、(6分)设方差分析模型为 总离差平方和 试求A E(S ),并根据直观分析给出检验假设012:...0P H ααα====的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A 、B 、C 、D 外,还需考察A B ?,B C ?。今选用表78(2)L ,表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

应用概率统计期末复习题及答案

第七章课后习题答案 7.2 设总体X ~ N(12,4), X^XzJII’X n 为简单随机样本,求样本均值与总体均值之 差的绝对 值大于1的概率. X 解:由于 X ~ N(12,4),故 X 一 ~ N(0,1) /V n 1 ( 2 0.8686 1) 0.2628 10 7.3 设总体X ?N(0,0.09),从中抽取n 10的简单随机样本,求P X : 1.44 i 1 X i 0 X i 0 X i ~N(0,°.09),故亠-X0r~N(0,1) X 所以 ~ N(0,1),故U n P{ X 1} 1 P{ X 1} 解: 由于X ~ N (0,0.09),所以 10 所以 X i 2 2 是)?(10) 所以 10 10 X : 1.44 P i 1 i 1 X i 2 (倉 1.44 P 0.09 2 16 0.1 7.4 设总体 X ~ N( , 2), X 1,X 2,|||,X n 为简单随机样本 2 ,X 为样本均值,S 为样 本方差,问U n X 2 服从什么分布? 解: (X_)2 2 ( n )2 X __ /V n ,由于 X ~ N( , 2), 2 ~ 2(1)。 1 —n

7.6 设总体X ~ N( , 2), Y?N( , 2)且相互独立,从X,Y中分别抽取 m 10, n215的简单随机样本,它们的样本方差分别为S2,M,求P(S2 4S ; 0)。 解: S2 P(S24S2 0) P(S24S;) P 12 4 由于X ~ N( , 2), Y~ N( , 2)且相互独立S2 所以S12~ F(10 1,15 1),又由于F°oi(9,14) 4.03 S2 即P F 4 0.01

应用数理统计课后习题参考答案

习题五 1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g) 日期重旦量 1 5500 5800 5740 5710 2 5440 5680 5240 5600 4 5400 5410 5430 5400 9 5640 5700 5660 5700 10 5610 5700 5610 5400 试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05) 解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5. 2 假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5 检验的问题:H。:i 2 L 5, H i : i不全相等. 计算结果: 注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为 查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所 以拒绝H。,认为不同日期生产的钢锭的平均重量有显著差异 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 解 根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 . 2 假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .

日产量 操作工 查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。,认为在四种不同催化剂下平均得率无显著差异 3 试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另 一个是温度 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 ) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用 设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12. 2 假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j , ),i 1,2,3, j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应; 检验的问题:(1) H i 。: i 全部等于零,H i — i 不全等于零; (2) H 20 : j 全部等于零,H 21: j 不全等于零; 计算结果: 查表F 0.95(2,6) 5.143 ,局.95(3,6) 4.757 ,显然计算值F A , F B 分别大于查表值, 或p = 0.0005 , 0.0009均显著小于0.05,所以拒绝H i°,H 20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用 . 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量: 检验的问题:H 0: 1 计算结果: H i : i 不全相等

应用概率统计期末复习题及答案

第七章课后习题答案 7.2 设总体12~(12,4),,,,n X N X X X L 为简单随机样本,求样本均值与总体均值之 差的绝对值大于1的概率. 解:由于~(12,4)X N , ~(0,1)X N {1}1{1}1P X P X P μμ?->=--≤=-≤ 112(11(20.86861)0.262822P ??=-≤=-Φ-=-?-=?????? 7.3 设总体~(0,0.09),X N 从中抽取10n =的简单随机样本,求1021 1.44i i P X =?? >???? ∑. 解:由于~(0,0.09),X N 所以~(0,0.09),i X N 故 ~(0,1)0.3 i i X X N σ --= 所以 10 2 21 ( )~(10)0.3 i i X χ=∑ 所以{}1010222 11 1.441.44()160.10.3 0.09i i i i X P X P P χ==????>=>=>=????????∑∑ 7.4 设总体2 ~(,),X N μσ12,,,n X X X L 为简单随机样本, X 为样本均值,2 S 为样 本方差,问2 X U n μσ?? -= ??? 服从什么分布? 解: 2 2 2 X X X U n μσ????-=== ???,由于2 ~(,)X N μσ, ~(0,1)N ,故2 2 ~(1)X U χ??=。

7.6 设总体2 ~(,),X N μσ2 ~(,)Y N μσ且相互独立,从,X Y 中分别抽取1210,15n n ==的简单随机样本,它们的样本方差分别为22 12,S S ,求2212(40)P S S ->。 解: 22 22211 2 1 2 22(40)(4)4S P S S P S S P S ?? ->=>=> ??? 由于2 ~(,),X N μσ2 ~(,)Y N μσ且相互独立 所以2 122 ~(101,151)S F S --,又由于0.01(9,14) 4.03F = 即()40.01P F >=

应用数理统计习题答案 西安交大 施雨

应用数理统计答案 学号: 姓名: 班级:

目录 第一章数理统计的基本概念 (2) 第二章参数估计 (14) 第三章假设检验 (24) 第四章方差分析与正交试验设计 (29) 第五章回归分析 (32) 第六章统计决策与贝叶斯推断 (35) 对应书目:《应用数理统计》施雨著西安交通大学出版社

第一章 数理统计的基本概念 1.1 解:∵ 2 (,)X N μσ ∴ 2 (,)n X N σμ ∴ (0,1)N 分布 ∴(1)0.95P X P μ-<=<= 又∵ 查表可得0.025 1.96u = ∴ 2 2 1.96n σ= 1.2 解:(1) ∵ (0.0015)X Exp ∴ 每个元件至800个小时没有失效的概率为: 800 0.00150 1.2 (800)1(800) 10.0015x P X P X e dx e -->==-<=-=? ∴ 6个元件都没失效的概率为: 1.267.2 ()P e e --== (2) ∵ (0.0015)X Exp ∴ 每个元件至3000个小时失效的概率为: 3000 0.00150 4.5 (3000)0.00151x P X e dx e --<===-? ∴ 6个元件没失效的概率为: 4.56 (1)P e -=- 1.4 解:

i n i n x n x e x x x P n i i 1 2 2 )(ln 2121)2(),.....,(1 22 =-- ∏∑ = =πσμσ 1.5证: 2 1 1 2 2)(na a x n x a x n i n i i i +-=-∑∑== ∑∑∑===-+-=+-+-=n i i n i i n i i a x n x x na a x n x x x x 1 2 2 2 2 11) ()(222 a) 证: ) (1111 1+=+++=∑n n i i n x x n x ) (1 1 )(1 1 11n n n n n x x n x x x n n -++=++=++

北航2014级硕士研究生应用数理统计答案(B卷)

2014-2015 学年 第一学期期末试卷答案 学号 姓名 成绩 考试日期: 2015年1月13日 考试科目:《应用数理统计》(B 层) 一、填空题(本题共16分,每小题4分) 1.设122,,n x x x ,是来自正态总体2(,)N μσ的简单样本,则c = n m m - 时,统计量2 22112 2211 ()()m k k k n k k k m x x c x x η-=-=+-=-∑∑服从F -分布。 2. 设12,,n x x x ,是来自正态总体2 (0,)N σ的简单样本,用2 2 21 1?()n i i nx x n σ ===∑估计2σ,则均方误差2222?()E σσ σ- 42σ 。 3.设总体X 的密度函数为22 ,[0,] (;)0, [0,]x x p x x θθθθ?∈?=????,其中0θ>,12,,,n x x x 是 来自总体X 简单样本,则2()q θθ=的矩估计?q = 2 94 x 或2 1 2n i i x n =∑ 。 4.在双因素方差分析中,总离差平方和T S 的分解式为 T A B A B e S S S S S ?=+++ 其中2 111 ()p q r e ijk ij i j k S x x ?====-∑∑∑,11r ij ijk k x x r ?==∑, 则e S 的自由度是 (1)p q r - 或n pq -,其中n pqr = 。

二、(本题12分)设总体X 的密度函数为111,(0,1) (;)0,(0,1)x x f x x θ θθ-?∈?=???? ,其中0θ>, 12,,,n x x x 是来自总体X 的简单样本。 (1)求θ的极大似然估计?θ;(2)求θ的一致最小方差无偏估计;(3)问θ的一致最小方差无偏估计是否为有效估计?证 明你的结论。 解(1)似然函数为 (1)()1 1 {01}121 1 ()() (,,,)n n i x x n n i L x I x x x θ θθ-<≤<== ∏ 对数似然函数为 (1)(){01}121 1 ln ()ln (1)ln ln (,,,)n n i x x n i L n x I x x x θθθ <≤<==-+-+∑ 求导,有 2 1 ln ()1 ln n i i L n x θθθθ =?=--?∑ 令ln ()0L θθ?=?,可得θ的极大似然估计为1 1?ln n i i x n θ==-∑。 (2)因为 (1)()1 1 12{01}121 1 (,,,;)() (,,,)n n n i x x n n i f x x x x I x x x θ θθ-<≤<== ∏ (1)(){01}121 1 1 (,,,)exp{(1)ln }n n x x n i n i I x x x x θθ <≤<==-∑ 令1 ()n c θθ = ,(1)(){01}12()(,,,)n x x n h x I x x x <≤<= ,1 ()1w θθ = -,1 ln n i i T x ==∑,由于() w θ的值域(0,)+∞有内点,由定理2.2.4知1 ln n i i T x ==∑是完全充分统计量。而 1 1 1 1 (ln )(ln )i E x x x dx θθθ -= =-? 所以 1 1 (ln )(ln )n n i i i i E x E x n θ====-∑∑

应用数理统计课后习题 清华大学出版社 杨虎 钟波第三章作业参考答案

第 三 章 作 业 参 考 答 案 2、解:计算矩估计:2 1)1(1 ++= +?= ? αααα dx x x EX , 令 X EX =++= 2 1αα ,解得 1 2-1?1-=X X α ; 计算极大似然估计:α α αα α)()1()1()()(1 1 1 ∏∏∏ ===+=+= = n i i n n i i n i i x x x f L )ln()1ln()(ln 1 ∏=++=?n i i x n L ααα0 )ln(1 )(ln 1 =++= ??? ∏=n i i x n L αα α 解得 ) ) ln(1(?1 2∏=+-=n i i x n α ; 将样本观测值代入,得到估计值分别为0.3077?1=α ,0.2112?2=α。 6、 解:(1)由例3.2.3可知,μ的极大似然估计分别为 X =μ ?, 05.0)(1)(=-Φ-=>μA A X P )645.1(95.0)(Φ==-Φ?μA 645 .1+=?μA ,由46页上极大似然估计的不变性可知645.1??+=μA ; (2)由例3.2.3可知,2 σμ,的极大似然估计分别为 ∑=-= =n i i X X n X 1 2 2 ) (1 ??σ μ,, 05.0)( 1)(=-Φ-=>σ μ A A X P )645.1(95.0)( Φ==-Φ?σ μ A σ μ645.1+=?A ,由46页上极大似然估计的不变性可知σμ?645.1??+=A 。 8、解:计算2 2 2 2222)()()(σσ μC n S CE X E CS X E -+ =-=-,由题意则有 2 2 2 2 μσ σ μ=-+ C n ,解得n C 1= 。

北航数理统计回归分析大作业

数理统计(课程大作业1) 逐步回归分析 学院:机械工程学院 专业:材料加工工程 日期:2014年12月7日

摘要:本文介绍多元线性回归分析方法以及逐步回归法,然后结合实际,以我国1995-2012年的财政收入为因变量,选取了8个可能的影响因素,选用逐步回归法对各影响因素进行了筛选分析,最终确定了其“最优”回归方程。 关键字:多元线性回归 逐步回归法 财政收入 SPSS 1 引言 自然界中任何事物都是普遍联系的,客观事物之间往往都存在着某种程度的关联关系。为了研究变量之间的相关关系,人们常用回归分析的方法,而回归分析是数理统计中一种常用方法。数理统计作为一种实用有效的工具,广泛应用于国民经济的各个方面,在解决实际问题中发挥了巨大的作用,是一种理论联系实践、指导实践的科学方法。 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。 本文将以回归分析为方法,运用数理统计工具探求财政收入与各种统计指标之间的关系,总结主要影响因素,并对其作用、前景进行分析和展望。 2 多元线性回归 2.1 多元线性回归简介 在实际问题中,某一因素的变化往往受到许多因素的影响,多元回归分析的任务就是要找出这些因素之间的某种联系。由于许多非线性的情形都可以通过变换转化为线性回归来处理,因此,一般的实际问题都是基于多元线性回归问题进行处理的。对多元线性回归模型简要介绍如下: 如果随机变量y 与m )2(≥m 个普通变量m x x x 21,有关,且满足关系式: εββββ++++=m m x x x y 22110 2,0σεε==D E (2.1) 其中,2210,,,σββββm 是与m x x x 21,无关的未知参数,ε是不可观测的随机变量,),0(~2N I N σε。

工程数学 应用概率统计习题九答案

习题9答案 9.1 假定某厂生产一种钢索,其断裂强度5(10)X Pa 服从正态分布2(,40),N μ从中抽取容量为9的样本,测得断裂强度值为 793, 782, 795, 802, 797, 775, 768, 798, 809 据此样本值能否认为这批钢索的平均断裂强度为580010Pa ??(0.05α=) 解:00:800H μμ== 10:H μμ≠ 选取检验统计量~(0,1)Z N =, 对于0.05α=,得0H 的拒绝域2 1.96W z z α? ?=>=???? 计算得7918000.675 1.96403 z -==< 所以接受0H ,拒绝1H .即可以认为平均断裂强度为580010Pa ?. 9.3 某地区从1975年新生的女孩中随机抽取20个,测量体重,算得这20个女孩的平均体重为3160g ,样本标准差为300g ,而根据1975年以前的统计资料知,新生女孩的平均体重为3140g ,问1975年的新生女孩与以前的新生女孩比较,平均体重有无显著性的差异?假定新生女孩体重服从正态分布,给出0.05α=. 解:00:3140H μμ== 10:H μμ≠ 选取检验统计量~(1)T t n =-, 对于0.05α=,得0H 的拒绝域2 (19) 2.0930W T t α? ?=>=???? 计算得 0.298 2.0930T ===<

故接受0H ,拒绝1H .即体重无明显差异. 9.5 现要求一种元件的使用寿命不得低于1000h ,今从一批这种元件中随机的抽取25件,测定寿命,算得寿命的平均值为950h ,已知该种元件的寿命2~(,),X N μσ已知100σ=,试在检验水平0.05α=的条件下,确定这批元件是否合格? 解:00:1000H μμ≥= 10:H μμ< 选取检验统计量~(0,1)Z N =, 对于0.05α=,得0H 的拒绝域{}1.645W Z z α=<-=- 计算得 9501000 2.5 1.6451005 Z -==-<- 所以拒绝0H ,接受1H . 即认为这批元件不合格. 9.8 某厂生产的铜丝,要求其拉断力的方差不超过216()kg ,今从某日生产的铜丝中随机的抽取9根,测得其拉断力为(单位:kg ) 289 , 286 , 285 , 284 , 286 , 285 , 286 , 298 , 292 设拉断力总体服从正态分布,问该日生产的铜丝的拉断力的方差是否合乎标准?(0.05α=). 解: 2200:16H σσ≤= 2210:H σσ> 选取检验统计量2 2220(1)~(1)n S n χχσ-=- 对于0.05α=,得0H 的拒绝域{} 22(8)15.507W αχχ=>= 计算得 2 220(1)820.3610.1815.50716 n S χσ-?==≈< 所以接受0H , 拒绝1H ,即认为是合乎标准的。

相关文档
相关文档 最新文档