文档库 最新最全的文档下载
当前位置:文档库 › 2018年数理统计大作业题目和答案--0348

2018年数理统计大作业题目和答案--0348

2018年数理统计大作业题目和答案--0348
2018年数理统计大作业题目和答案--0348

2018年数理统计大作业题目和答案--0348

1、设总体X 服从正态分布),(2

σμN ,其中μ已知,2

σ

未知,n

X X

X ,,,2

1

为其样本,2≥n ,则下列说法中正

确的是( )。

(A )∑=-n

i i

X

n 1

2

2

)

(μσ是统计量 (B )∑=n

i i

X

n 1

22

σ是统计量

(C )∑=--n

i i

X

n 1

2

2

)

(1μσ是统计量 (D )∑=n

i i

X n 1

是统计量

2、设两独立随机变量)1,0(~N X ,)

9(~2

χY ,则Y

X 3服从

( )。

)(A )

1,0(N

)(B )

3(t

)(C )

9(t

)(D )

9,1(F

3、设两独立随机变量)1,0(~N X ,2

~(16)

Y χ,则Y

从( )。

)(A )1,0(N

)(B (4)

t

)(C (16)

t

)(D (1,4)

F

4、设n

X X

,,1

是来自总体X 的样本,且μ=EX ,则下

列是μ的无偏估计的是( ).

)

(A ∑-=-1

1

1

1

n i i

X n )(B ∑=-n

i i X n 1

11

)(C ∑=n

i i

X n 2

1

)(D ∑-=1

1

1n i i

X n

5、设4

3

2

1

,,,X X X X 是总体2

(0,)N σ的样本,2

σ未知,则下列随机变量是统计量的是( ).

() (1) D t n-

10、设

1,,

n

X X

???为来自正态总体2

(,)

Nμσ的一个样本,μ,2σ未知。则2σ的置信度为1α-的区间估计的枢轴量为()。

(A)

()2

1

2

n

i

i

σ

=

-

(B)

()2

1

2

n

i

i

σ

=

-

(C) ()

=

-

n

i

i

X

X

1

2

2

1

σ

(D)

()2

1

2

n

i

i

X X

σ

=

-∑

11、在假设检验中,下列说法正确的是()。

(A) 如果原假设是正确的,但作出的决策是接受备择假设,则犯了第一类错误;

(B) 如果备择假设是正确的,但作出的决策是拒绝备择假设,则犯了第一类错误;

(C) 第一类错误和第二类错误同时都要犯;

(D) 如果原假设是错误的,但作出的决策是接受备择假设,则犯了第二类错误。

12、对总体2

~(,)

X Nμσ的均值μ和作区间估计,得到置信度为95%的置信区

间,意义是指这个区间()。

(A)平均含总体95%的值(B)平

均含样本95%的值

(C)有95%的机会含样本的值 (D)有95%的机会的机会含μ的值

13、设?θ是未知参数θ的一个估计量,若?E θθ≠,则?θ是θ的( )。

(A)极大似然估计 (B) 有偏估计 (C)相合估计 (D) 矩法估计

14、设总体X 的数学期望为1

2

,,,,n

X X X μ为来自X 的样本,则下列结论中 正确的是( ).

(A )1X 是μ的无偏估计量. (B )1

X 是μ的极大似然估计量.

(C )1X 是μ的相合(一致)估计量. (D )1

X

不是μ的估计量.

15、设总体2

~(,)X N μσ,2

σ未知,12,,,n

X X X 为样本,

2

S 为修正样本方差,则检验问题:0

:H

μμ=,1

:H

μμ≠(0

μ已知)的检验统计量为( ). (A )

)01n X S

μ--(B )

)

01n X μσ

-- (C ))

n X μσ

-(D ))

0n X S

μ-.

16、设总体X 服从参数为λ的泊松分布()P λ,

n

X X X ,,,21 是来自总体X 的简单随机样本,则

=

X D .

17、设3

2

1

,,X X X 为来自正态总体),(~2

σμN X 的样本,

3

21cX bX aX ++为

μ

的一个无偏估计,则

=

++c b a _____。

18、设),(~2

σμN X ,而1.70,1.75,1.70,1.65,1.75

是从总体X 中抽取的样本,则μ的矩估计值为 。

19、

设总体

X

服从正态分布),(2

σμN ,μ未知。

n

X X X ,,,

21 为来自总体的样本,则对假设20

2

σσ=:H ;

2

21σσ≠:H 进行假设检验时,通常采用的统计量是

____________,它服从____________分布,自由度为____________。 20、设总体)4,1(~N X ,1

2

10

, ,

, X X X 为来自该总体的样

本,

10

1

110i

i X X ==∑,则()D X =______.

21、我们通常所说的样本称为简单随机样本,它具有的特点是 . 22

、已知

0.9(8,20)2

F =,则

0.1(20,8)F =

23、设]1,[~a U X ,n

X X ,,1

是从总体X 中抽取的样本,求a 的矩估计为 . 24、检验问题:()()

0:H

F x F x =,()()

0:H

F x F x ≠(()0

F x 含

有l 个未知参数)的皮尔逊2

χ检验拒绝域为 .

25、设621,,,X X X 为来自正态总体)1,0(N 的简单随机样本,设

26542321)()(X X X X X X Y +++++=

若使随机变量CY 服从2χ分布,则常数=C

26、设由来自总体2

(,

0.9)N μ的容量为9的简单随机

样本其样本均值为5x =,则μ的置信度为0.95的置信区间是 (0.975

1.96

μ=).

27、若线性模型为

()20,,n

Y X E Cov I βεεεεσ=+?

?==?,则最小二乘

估计量为 .

28、若样本观察值1

,,m

x x 的频数分别为1

,,m

n n ,则样本平均值为 .

29、若样本观察值1

,,m

x x 的频数分别为1

,,m

n n ,则样本方差为 .

30、设f (t )为总体X 的特征函数,()1,,n

X X 为总体X 的样本,则样本均值X 的特征函数为 .

31、设X 服从自由度为n 的2

χ-分布,则其数学期望和方差分别是 .

32、设()2

i i X n χ,i=1,…,k ,且相互独立。则1

k

i

i X

=∑服从分布 .

33、设总体X 服从均匀分布[0,]U θ,从中获得容量为n 的样本1

,,n

X X ,其观测值为1

,,n

x x ,则θ的最大似然估计量为 .

34、根据样本量的大小可把假设检验分为 .

35、设样本1

,,n

X X 来自正态总体()2

,N μσ,μ未知,样本的无偏方差为2S ,则检验问题2

22

20

1

:,:H H σσσσ≤>的检验统计量为 .

36、对试验(或观察)结果的数据作分析的一种

常用的统计方法称为 .

37、设1

2

17

,,,X X X 是总体(,4)N μ的样本,2

S 是样本方差,若2

()0.01P S a >=,则a =____________.(2

0.99

(16)32.0χ=)

38、设总体X 的密度函数为

()36(),0;0,

.x

x x p x θθθ

?-<

X 1,X 2,…,X n 为总体X 的一个样本,则θ的矩估计

量为___________.

39、设总体X 的概率密度为

(),01,1,

12,0,.

x p x x θθ<

=-≤

其他,其

中θ是未知参数(0<θ<1),X 1,X 2,…,X n 为来自总体X 的简单随机样本,则θ的矩估计量为___________.

40、设总体X 的分布函数为

F (x ,β)=

11,1,0,

1.x x x β?->???≤?

其中未知参数β>1,设X 1,X 2,…,X n 为来自总体X

的样本,则β的最大似然估计量___________. 41、设测量零件的长度产生的误差X 服从正态分布2

(,)N μσ,今随机地测量16个零件,得16

1

8i

i X ==∑,

16

21

34

i

i X

==∑. 在置信度0.95下,μ的置信区间为

___________.

0.950.975((15) 1.7531,(15) 2.1315)

t t ==

42、设由来自总体2(,

0.9)

N μ的容量为9的简单随机样本其样本均值为5x =,则μ的置信度为0.95的置信区间是 (0.975

1.96

μ=).

43、设总体X 服从两点分布B (1,p ),其中p

是未知参数,1

5

,

,X X 是来自总体的简单随机样本。

指出{}()

2

12551,max ,15,2,i X

X X i X p X X +≤≤+-之中哪些是统计

量,哪些不是统计量,为什么?

44、设总体X 服从参数为(N ,p )的二项分布,其中(N ,p )为未知参数,1

2

,,

,n

X X X 为来自总体

X 的一个样本,求(N ,p )的矩法估计。 45、设1

2

,,

,n

X X X 是取自正态总体()2

,N μσ的一个样

本,试问

()22

111n

i

i S X X n ==--∑是2

σ的相合估计吗?

46、设连续型总体X 的概率密度为

()()

2

2,0

,00, 0x

x e x p x x θθθθ-??>=>??≤?

, 1

2

,,

,n

X X X 来自总体X 的一个

样本,求未知参数θ的极大似然估计量?θ,并讨论

?θ的无偏性。

47、随机地从一批钉子中抽取16枚,测得其长度(以厘米计)为 2.14 2.10 2.13 2.15 2.13 2.12 2.13 2.10 2.15 2.12 2.14 2.10

2.13 2.11 2.14 2.11设钉长服从正态分布。 若已知σ=0.01(厘米),试求总体均值μ的0.9的置信区间。(0.95

1.65

u

=)

48、甲、乙两台机床分别加工某种轴,轴的直径分别服从正态分布()21

1

,N μσ与()2

2

2

,N μσ,为比较两台

机床的加工精度有无显著差异。从各自加工的轴中分别抽取若干根轴测其直径,结果如下: 总体 样本容量

直径

X (机床甲) Y (机床

)

8 7 20.5 19.8 19.7 20.4 20.1

20.0 19.0 19.9

20.7 19.8 19.5 20.8 20.4

19.6 20.2

试问在α=0.05水平上可否认为两台机床加工精度一致?(()()0.975

0.975

6,7 5.12,7,6 5.70.F F ==)

49、为了检验某药物是否会改变人的血压,挑选10名试验者,测量他们服药前后的血压,如下表所列: 编号 1

2

3

4

5

6

7

8 9

10

服药

1312131312141111214

前血压4 2 2 0 8 0 8 2

7

5 2

服药后血压14

13

13

5

12

6

13

4

13

8

12

4

1

2

6

13

2

14

4

假设服药后与服药前血压差值服从正态分布,取检验水平为0.05,从这些资料中是否能得出该药物会改变血压的结论?

50、为了研究患慢性支气管炎与吸烟量的关系,调查了272个人,结果如下表:

吸烟量(支/

日)

求和

0—9 10—19 20—

患者数

非患者数

求和22

22

44

98

89

187

25

16

41

145

127

272

试问患慢性支气管炎是否与吸烟量相互独立(显著水平α=0.05)?

51、设某商店100天销售电视机的情况有如下统计资料:

日售出台数 2 3 4 5 6 合计 天数

20 30 10 25 15

100

求样本容量n ,样本均值和样本方差。

52、设总体服从泊松分布P (λ),1

,,n

X X 是一样本:

(1)写出1

,,n

X X 的概率分布; (2)计算2

,n

EX DX ES 和;

(3)设总体容量为10的一组样本观察值为(1,2,4,3,3,4,5,6,4,8)试计算样本均值, 样本方差和次序统计量的观察值。

53、设17

,,X X 为总体X 服从()0,0.25N 的一个样本,

求7

21

4i

i P X =??

> ???

∑.(()20.975

716.0128χ=)

54、设总体X 具有分布律

X

1

2 3

P k θ

2

2θ(1-θ) (1-θ) 2

其中θ(0<θ<1)为未知参数。已知取得了样本值x 1=1,x 2=2,x 3=1,试求θ的最大似然估计值。 55、求均匀分布],[2

1

θθU 中参数2

1

,θθ的极大似然估计.

56、为比较两个学校同一年级学生数学课程的成绩,随机地抽取学校A 的9个学生,得分数的平均值为31

.81=A

x ,方差为76

.602=A

s

;随机地抽取学

校B 的15个学生,得分数的平均值为61

.78=B

x

,方差为24

.482

=B

s

。设样本均来自正态总体且方差相

等,参数均未知,两样本独立。求均值差B

A

μμ

-的

置信水平为0.95的置信区间。(()0.975

227.266t =) 57、设A ,B 二化验员独立地对某种聚合物的含氯量用相同的方法各作了10次测定,其测量值的修正方差分别为22

0.5419,0.6065

A B s s ==,设2

A

σ和2B

σ分别

为所测量的数据总体(设为正态总体)的方差,

求方差比2

2/A B

σ

σ的0.95的置信区间。

58、某种标准类型电池的容量(以安-时计)的标准差66.1=σ,随机地取10只新类型的电池测得它们的容量如下

146,141,135,142,140,143,138,137,142,

136

设样本来自正态总体),(2

σμN ,2

,σμ均未知,问标准

差是否有变动,即需检验假设(取05.0=α):

2

2122066.1:,66.1:≠=σσH H 。

59、某地调查了3000名失业人员,按性别文化程度分类如下:

文化程度 性别

大专以上 中专技校 高中 初中及以下

合计

男 女 40 138 620 1043 20 72

442 625

1841 1159

合计

60 210

1062 1668

3000 试在α=0.05水平上检验失业人员的性别与文化程度是否有关。(()2

0.95

37.815χ=)

60、设总体X 具有贝努里分布b (1,p ),p ∈Θ=(0,1),1

,

,n

X X 是一样本,试求p 的无偏估计的

方差下界。

1、(D );

2、 )(C ;

3、)(C ;

4、)(A ;

5、(B );

6、() ;C

7、( C ) ;

8、(B );

9、() D ;10 (C) ;11、(A);12、 (D);13、 (B) ;14、(A );15、(D ). 16、/n λ,17、1,18、1.71,19、2

2

(1)n S σ

-,2

χ,1n -,20、

2/5,21、独立性,代表性; 22、1/2;23、21X -;24、

()()2

2

11?1?r i i i i

n np n l np αχ-=??-??>--??????

∑;

25、1/3;

26、(4.412,

5.588)

;27、

()1

?X X X Y

β-''=。28、

1

1m j j j x n x n ==∑;

29、

2

2

n 1

1()m j i j s n x x n ==-∑;30、

n

t f n ???? ???????

31、n,2n; 32、

2

1k i i n χ=?? ???

∑;33、()

n X ;34、大样本检

验与小样本检验;35、()22

20

1n S χσ-=;

36、方差分析法;37、8;38、?2X θ=;39、32

X -;40、

1

?ln n

i

i n

X

β==∑;41、(0.2535,1.2535-);42、(4.412,5.588).

43、解:{}()2

1

2

5

1

,max ,15,i

X X X i X X +≤≤-都是统计量,5

2X p

+不是统计量,因p 是未知参数。

44、解:因为()()()22

2

,1EX Np EX DX EX Np p Np ==+=-+,只

需以2

1

1,n

i

i X X n

=∑分别代2

,EX EX 解方程组得2

2

2

??,1n n S X N

p X S X

==--。

45、解:由于 ()2

2

1n S σ

- 服从自由度为n-1的2

χ

-

分布,故

()

()()4

4

2

2

2

2

2,2111ES DS n n n σσσ==?-=--,

从而根据车贝晓夫不等式有

()()

2

4

2

2

2

2

2001n DS P S n σ

σεεε

→∞

≤-≥≤=???→-,所以()22

1

11n

i i S

X X n ==--∑是2

σ的相合估计。

46、解:似然函数为

()()2

21

2

1

1

221

1

,ln ln ln ,

2n

i i i n

n

x x i

i

n

n

i

i i i n

i i x

x

x L e

e

L n x θ

θ

θθθθ

θ

θ

=--====∑

==

=-+-

∏∑∏

∏()2

12

ln 2n

i

i x

d L n

d θθθθ

==-+∑,令()ln 0d L d θθ

=,得21

?2n

i

i X

n

θ==∑.由于

()2

222

2221

2200

11?222222n

x x i

i EX

x

x

x E EX x e dx e d n

θ

θ

θ

θθθθ

θ

θ

--

======Γ=∑??

因此θ的极大似然估计量?θ是θ的无偏估计量。 47、解:()2

21

0.01, 2.14 2.10 2.11 2.125

16

x σ

==

+++=,置信度

0.9,即α=0.1,查正态分布数值表,知

()()1/21.650.95

u α-Φ=Φ=, 即

()1.6510.90

P U α≤=-=,从而

1/20.95 1.65

u u α-==,1/2 1.650.00416

n

α-=

=,所以总体均值μ

的0.9的置信区间为

[][]1/21/2, 2.1250.004,2.1250.004 2.121,2.129x x n n αα--??=-+=?

???

.

48、解:首先建立假设:

22220

1

2

1

12:,:H H σσσσ=≠

在n=8,m=7, α=0.05时,

()()

()0.0250.9750.97511

7,60.195,7,6 5.70.6,7 5.12

F F F =

=

==

故拒绝域为{}0.195, 5.70F or F <>, 现由样本求得21

s =0.2164,22

s =0.2729,从而F=0.793,未落入拒绝域,因而在α=0.05水平上可认为两台机床加工精度一致。

49、解:以X 记服药后与服药前血压的差值,则X 服从()2,N μσ,其中2

,μσ均未知,这些资料中可以得出X 的一个样本观察值:6 8 3 -4 6 -2 6 -1 7 2

待检验的假设为 01

:0,:0H H μμ=≠ 这是一个方差未知时,对正态总体的均值作检验的问题,因此用t 检验法当()0

1/2

1/X T t n S n

αμ--=≤-时,

接受原假设,反之,拒绝原假设。依次计算有

()()()()2

2

2

116872 3.1,6 3.12 3.117.6556101

x s =++++==-++-=-, 3.10 2.3228

17.6556/10

t -=

=,

由于()()1/2

0.97519 2.2622t

n t α--==,

T 的观察值的绝对值2.3228 2.2622t =>. 所以拒绝原假设,即认为服药前后人的血压有显著变化。

50、解:令X=1表示被调查者患慢性气管炎,X=2表示被调查者不患慢性气管炎,Y 表示被调查者每日的吸烟支数。

原假设0

H :X 与Y 相互独立。 根据所给数据,有

()

2

2

2

2

23

..211

..2

2

4414518714541145229825/2722722724414518714541145272272272

441271871274112722891627227227244127187127272272ij i j i j i j

n n n n n n n χ==?????????--- ? ? ?

-???????==+++????????

????--- ? ? ?????++??∑∑

2

1.223,41127272

??

?=?对于α=0.05,由自由度(r-1)(s-1)=(2-1)(3-1)=2,查2

χ-分布表()20.95

2 5.991χ=. 因为2

χ=1.223<5.991,所以接受0

H ,即认为患慢性气管炎与吸烟量无关。

51、解:样本容量为n=100

样本均值,样本方差,样本修正方差分别为

()()2222

22222033061522031

3.85,1001 3.85 1.9275,100

100100 1.9275 1.94696930619995.

9n n x s s s ??????=

==-===?=++++++

52、解 (1)因为(),0,1,2,

,0,

!

i

x

i

i i i P X x e x x λλλ-==

=>所以1

,

,n

X X 的概

率分布为

()()1

1

1

1

,1,2,

,,0,1,2,.

!

!n

i

i

i x x n

n

n i i i i i n

i i i i i P X x i n P X x e

e x x x λ

λ

λ

λ

=--===∑======

=∏∏

(2)因为EX DX λ==,所以

2

11,,.n DX n n EX EX DX ES DX n n n n

λλλ--===

=== (3)

10222

222211114011104,4 3.6, 4.

10109

n n i n i i n i i i x x s x x x s s n n =======-=-===∑∑∑

将样本观察值依照从小到大的顺序排列即得顺序统计量()()

1

10,

,x x 的观察值如下:(1,2,3,3,4,

4,4,5,6,8)。

53、解: 因每个i

X 与总体X 有相同分布,故

20.5

i i

X X -=服从()0,1N ,则

2

7

7

211

040.5i i i i X X ==-??= ???∑∑服从自由度

n=7的2

χ-分布。因为

77722211144161416i i i i i i P X P X P X ===??????

>=>=-≤ ? ? ???????

∑∑∑,查表可知

()20.975

716.0128χ

=, 故

72140.025.i i P X =??

>= ???

54、解:似然函数}

1{}2{}1{}{)(3213

1

======∏=X P X P X P x X

P θL i i i

)

1(2)1(25

22θθθθθθ-=?-?=

ln L (θ )=ln2+5ln θ+ln(1-θ) 求导 011

65)(ln =--=θθd θL d 得到唯一解为6

5?=θ 55、解:先写出似然函数

??

?

??≤≤≤??????-=其他若,0,1),(2

)()1(112

21θθθθθθn n X X L

似然函数不连续,不能用似然方程求解的方法,只有回到极大似然估计的原始定义,由似然函数,注意到最大值只能发生在

2

)(11

θθ≤≤≤n X X

时;而欲),;(2

1

θθX L 最大,只有使1

2

θθ

-最小,即使2

?θ尽

可能小,1

?θ尽可能大,只能取1

?θ=)

1(X ,2

?θ=)

(n X .

56、解:根据两个正态总体均值差的区间估计的标准结论,均值差B

A

μμ-的置信水平为0.95的置

信区间为

()??

?? ?

?+±=???? ??-++±-)22(151917.2)2(11975.021975.021t s n n t n n s x x w w B A

???

? ???+?±=???? ??+±=0739.2151

91266.77.2)22(151917.2975.0t s w

()()

05.9,65.335.67.2-=±=

57、解:n=m=10, 1-α=0.95,α=0.05,

()()()()

1/20.975/21/21

1,19,9 4.03,1,10.2418

1,1F n m F F n m F m n ααα----==--=

=--,

从而

(

)()22221/2/211

0.541910.54191,,1,11,10.60654.030.60650.241[0.2223.601]8A A B B S S S F n m S F n m αα-????==????----????,故方差比22/A B

σ

σ的0.95的置信区间为[0.222,

3.601]。

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计大作业1——逐步回归法分析 终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响 年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

应用数理统计大作业1——逐步回归法分析终

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统(Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (5) 3.1确定自变量和因变量 (5) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (8) 4.1输入/移去的变量 (8) 4.2模型汇总 (9) 4.3方差分析 (9) 4.4回归系数 (10) 4.5已排除的变量 (11) 4.6残差统计量 (11) 4.7残差分布直方图和观测量累计概率P-P图 (12) 5、异常情况说明 (13) 5.1异方差检验 (13) 5.2残差的独立性检验 (14) 5.3多重共线性检验 (15) 6、结论 (15) 参考文献 (17)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。 表1-1三因子多水平实验方案

应用数理统计作业题及参考答案(第二章)(2)

第二章 参数估计(续) P68 2.13 设总体X 服从几何分布:{}()1 1k P X k p p -==-,12k = ,,,01p <<,证明 样本均值1 1 n i i X X n == ∑是()E X 的相合、无偏和有效估计量。 证明: 总体X 服从几何分布, ∴()1= E X p ,()2 1-= p D X p . 1 () ()1 11 11 11==????===??== ? ????? ∑ ∑ n n i i i i E X E X E X n E X n n n p p . ∴样本均值11n i i X X n == ∑ 是()E X 的无偏估计量。 2 () 2222 1 11 1111==--???? ===??= ? ?????∑ ∑n n i i i i p p D X D X D X n n n n p np . ()()()()11 11 ln ln 1ln 1ln 1-??=-=+--??;X f X p p p p X p . () 111ln 111111f X p X X p p p p p ?--= - =+?--;. () () 2 11 2 2 2 ln 11 1f X p X p p p ?-=- + ?-;. ()()()()21112 2 2 22ln 11 1111f X p X X I p E E E p p p p p ???? ?? ?--=-=--+=+???????--?????? ? ?? ? ; () ()() ()12 2 2 2 2 211 11 111111111??-= + -= + ?-=+? ?---?? p E X p p p p p p p p ()()() () 2 2 2 111 1 111-+= + = = ---p p p p p p p p p .

北航数理统计回归分析大作业

应用数理统计第一次大作业 学号: 姓名: 班级: 2013年12月

国家财政收入的多元线性回归模型 摘 要 本文以多元线性回归为出发点,选取我国自1990至2008年连续19年的财政收入为因变量,初步选取了7个影响因素,并利用统计软件PASW Statistics 17.0对各影响因素进行了筛选,最终确定了能反映财政收入与各因素之间关系的“最优”回归方程: 46?578.4790.1990.733y x x =++ 从而得出了结论,最后我们用2009年的数据进行了验证,得出的结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。 关键词:多元线性回归,逐步回归法,财政收入,SPSS 0符号说明 变 量 符号 财政收入 Y 工 业 X 1 农 业 X 2 受灾面积 X 3 建 筑 业 X 4 人 口 X 5 商品销售额 X 6

进出口总额X7

1 引言 中国作为世界第一大发展中国家,要实现中华民族的伟大复兴,必须把发展放在第一位。近年来,随着国家经济水平的飞速进步,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。 国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建筑业,批发和零售贸易餐饮业,人口总数等。文中主要应用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。 2解决问题的方法和计算结果 2.1 样本数据的选取与整理 本文在进行统计时,查阅《中国统计年鉴2010》中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上

应用数理统计大作业1——逐步回归法分析终

应用数理统计大作业1——逐步回归法分析终 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析 摘要 篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。 正文 一、问题描述 随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。 倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。 因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。 二、数据描述 抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:

2018年数理统计大作业题目和答案--0348

2018年数理统计大作业题目和答案--0348

1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ 未知,n X X X ,,,2 1 为其样本,2≥n ,则下列说法中正 确的是( )。 (A )∑=-n i i X n 1 2 2 ) (μσ是统计量 (B )∑=n i i X n 1 22 σ是统计量 (C )∑=--n i i X n 1 2 2 ) (1μσ是统计量 (D )∑=n i i X n 1 2μ 是统计量 2、设两独立随机变量)1,0(~N X ,) 9(~2 χY ,则Y X 3服从 ( )。 )(A ) 1,0(N )(B ) 3(t )(C ) 9(t )(D ) 9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16) Y χ,则Y 服 从( )。 )(A )1,0(N )(B (4) t )(C (16) t )(D (1,4) F 4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下 列是μ的无偏估计的是( ). ) (A ∑-=-1 1 1 1 n i i X n )(B ∑=-n i i X n 1 11 )(C ∑=n i i X n 2 1 )(D ∑-=1 1 1n i i X n 5、设4 3 2 1 ,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是( ).

() (1) D t n- 10、设 1,, n X X ???为来自正态总体2 (,) Nμσ的一个样本,μ,2σ未知。则2σ的置信度为1α-的区间估计的枢轴量为()。 (A) ()2 1 2 n i i Xμ σ = - ∑ (B) ()2 1 2 n i i Xμ σ = - ∑ (C) () ∑ = - n i i X X 1 2 2 1 σ (D) ()2 1 2 n i i X X σ = -∑ 11、在假设检验中,下列说法正确的是()。 (A) 如果原假设是正确的,但作出的决策是接受备择假设,则犯了第一类错误; (B) 如果备择假设是正确的,但作出的决策是拒绝备择假设,则犯了第一类错误; (C) 第一类错误和第二类错误同时都要犯; (D) 如果原假设是错误的,但作出的决策是接受备择假设,则犯了第二类错误。 12、对总体2 ~(,) X Nμσ的均值μ和作区间估计,得到置信度为95%的置信区 间,意义是指这个区间()。 (A)平均含总体95%的值(B)平 均含样本95%的值

最新北航数理统计大作业-多元线性回归

北航数理统计大作业-多元线性回归

应用数理统计多元线性回归分析 (第一次作业) 学院: 姓名: 学号: 2013年12月

交通运输业产值的多元线性回归分析 摘要:本文基于《中国统计年鉴》(2012年版)统计数据,寻找影响交通运输业发展的因素,包括工农业发展水平、能源生产水平、进出口贸易交流以及居民消费水平等,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,最后可以利用有效的最优回归模型对将来进行预测。 关键字:多元线性回归,逐步回归,交通运输产值,工业产值,进出口总额1,引言 交通运输业指国民经济中专门从事运送货物和旅客的社会生产部门,包括铁路、公路、水运、航空等运输部门。它是国民经济的重要组成部分,是保证人们在政治、经济、文化、军事等方面联系交往的手段,也是衔接生产和消费的一个重要环节。交通运输业在现代社会的各个方面起着十分重要的作用,因此研究交通运输业发展水平与各个影响因素间的关系显得十分重要,建立有效的数学相关模型对于预测交通运输业的发展,制定相关政策方案提供依据。根据经验交通运输业的发展受到工农业发展、能源生产、进出口贸易以及居民消费水平等众因素的影响,故建立一个完整精确的数学模型在理论上基本无法实现,并且在实际运用中也没有必要,一种简单有效的方式就是寻找主要影响因素,分析其与指标变量的相关性,建立多元线性回归模型就是一种有效的方式。 变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为

应用数理统计吴翊李永乐第三章假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显着影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显着性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显着性影响。 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测 得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分布, 试在显着水平下确定这批元件是否合格。 解: {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从一

最新数理统计大作业

数理统计学大作业 学院航空航天工程学部专业飞行器设计 班级航宇二班 学号142103130228 姓名张立 指导教师姜永 负责教师 沈阳航空航天大学 2014年12月

目录 (2) 前言 (2) 一、采集样本数据整理及SPSS统计软件的实现 (3) 1.1、数据的收集方法及说明 (3) 1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4) 1.3、画出直方图和折线图 (5) 1.4、经验分布函数和图形 (6) 1.5、各种概率分布 (7) 二、给出总体分布的参数估计 (12) 2.1、矩估计法 (12) 2.2、最大似然估计 (12) 2.3、参数区间估计 (13) 三、参数的假设检验 (16) 3.1. 样本统计数据的t检验 (16) 3.2样本统计数据的2χ检验 (17) 四、非参数假设检验( 2 χ拟合优度检验) (18) 4.1、2χ拟合优度检验 (18) 五、结论 (20) 参考文献 (21)

数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。 由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.

重大数理统计大作业

研究生“数理统计”课程课外作业 姓名:学号: 学院:光电工程学院专业:测控技术与仪器 类别:上课时间: 成绩: 城镇居民家庭食品总支出与肉类食品支出关系研究分析

摘要: 近些年,我国经济高速增长,居民的家庭收入大幅提高,同时居民的生活水平和质量也有了很大的提高,以前只有在过节或者有贵客时才能在餐桌上见到的各种食品现在已经平常化日常化。 肉类做为日常家庭食品的一个重要组成部分,也快速的增长着.上世纪80年代以来,城市居民家庭人均肉类消费增长了1倍。从表面看来家庭食品支出越高肉类消费越多。但是我们将城镇居民按家庭收入分成5等份,发现收入最低的吃肉最少,随着收入的增加,肉类消费数量同步增加,收入越高吃肉越多。但是也有部分高收入家庭的肉类消费量开始下降。因为这部分群体对于健康饮食的关注远远高于其他人群。所以从总体上看来,家庭食品总支出与肉类食品支出之间存在着一定的相互关联。在此文中我们以回归分析方法分析检验了家庭肉类食品消费支出与家庭食品总支出是否存在线性相关关系。 关键词:家庭肉类食品支出与食品总支出,回归分析方法 正文 随着我国经济的快速发展,居民的生活水平也有了显著的提高。同时城市居民家庭在食品方面的开支始终占据着很大的份额,其中肉类的开支也有着显著的提高。故提出在我国居民生活水平日益提高的情况下肉类食品的消费水平是否与家庭总的食品消费水平存在线性相关性? 数据描述: 表一:家庭食品支出与各种肉类支出分布 家庭食品支出与肉类支出关系(元/月) 品名 按人平月可支配收入比例分组 最低收入 户低收入户 中等收入 户高收入户 最高收入 户 猪肉187.44 233.16 248.88 269.4 236.04 牛肉9.36 18.84 26.76 24.48 28.44

应用数理统计课后习题参考答案

习题五 1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g) 日期重旦量 1 5500 5800 5740 5710 2 5440 5680 5240 5600 4 5400 5410 5430 5400 9 5640 5700 5660 5700 10 5610 5700 5610 5400 试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05) 解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5. 2 假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5 检验的问题:H。:i 2 L 5, H i : i不全相等. 计算结果: 注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为 查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所 以拒绝H。,认为不同日期生产的钢锭的平均重量有显著差异 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 解 根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 . 2 假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .

日产量 操作工 查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。,认为在四种不同催化剂下平均得率无显著差异 3 试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另 一个是温度 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 ) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用 设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12. 2 假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j , ),i 1,2,3, j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应; 检验的问题:(1) H i 。: i 全部等于零,H i — i 不全等于零; (2) H 20 : j 全部等于零,H 21: j 不全等于零; 计算结果: 查表F 0.95(2,6) 5.143 ,局.95(3,6) 4.757 ,显然计算值F A , F B 分别大于查表值, 或p = 0.0005 , 0.0009均显著小于0.05,所以拒绝H i°,H 20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用 . 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量: 检验的问题:H 0: 1 计算结果: H i : i 不全相等

北航应用数理统计大作业多元线性回归

多元线性回归分析 摘要:本文查找2011年《中国统计年鉴》,取我国31个省市自治区直辖市2010年的数据,利用SPSS软件对影响居民消费的因素进行讨论构造线性回归模型。并对模型的回归显著性、拟合度、正态分布等分别进行检验,最终得到最优线性回归模型,寻找影响居民消费的各个因素。 关键字:回归分析;线性;相关系数;正态分布 1. 引言 变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为回归分析。 回归分析是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程,这一数学表达式通常称为经验公式。一方面,研究者可以利用概率统计知识,对这个经验公式的有效性进行判定;另一方面,研究者可以利用经验公式,根据自变量的取值预测因变量的取值。如果是多个因素作为自变量的时候,还可以通过因素分析,找出哪些自变量对因变量的影响是显著的,哪些是不显著的。 回归分析目前在生物统计、医学统计、经济分析、数据挖掘中得到了广泛的应用。通过对训练数据进行回归分析得出经验公式,利用经验公式就可以在已知自变量的情况下预测因变量的取值。实际问题的控制中往往是根据预测结果来进行的,如在商品流通领域,通常用回归分析商品价和与商品需求之间的关系,以便对商品的价格和需求量进行控制。 本文查找2011年《中国统计年鉴》,取我国31个省市自治区直辖市2010年的数据,利用SPSS软件对影响居民消费的因素进行讨论构造多元线性线性回归模型。以探求影响居民消费水平的各个因素,得到最优线性回归模型。随后,我们对模型的回归显著性、拟合度、正态分布等分别进行检验,以考察线性回归模型的可信度。 本文将分为5章进行论述。在第2章,我们介绍多元线性回归模型的概念。第3章,我们进行模型的建立与数据的收集和整理。我们在第4章对数据进行处理,得出多元线性回归模型,并对其进行检验。在第5章,我们进行总结。2.预备知识 2.1 回归分析 回归分析研究的主要对象是客观事物变量间的统计关系,它是建立在对客观事物进行大量试验和观察的基础上,用来寻找隐藏在那些看上去是不确定的现象中的统计规律性的统计方法。回归分析方法是通过建立统计模型研究变量间相互关系的密切程度、结构状态及进行模型预测的一种有效的工具。

数理统计大作业知识分享

数理统计大作业

数理统计学大作业 学院航空航天工程学部专业飞行器设计 班级航宇二班 学号142103130228 姓名张立 指导教师姜永 负责教师 沈阳航空航天大学 2014年12月 目录

目录 (2) 前言 (3) 一、采集样本数据整理及SPSS统计软件的实现 (5) 1.1、数据的收集方法及说明 (5) 1.2、数据整理:给出频数、频率分布表及偏度和峰度 (5) 1.3、画出直方图和折线图 (7) 1.4、经验分布函数和图形 (8) 1.5、各种概率分布 (8) 二、给出总体分布的参数估计 (13) 2.1、矩估计法 (13) 2.2、最大似然估计 (14) 2.3、参数区间估计 (15) 三、参数的假设检验 (18) 3.1. 样本统计数据的t检验 (18) 3.2样本统计数据的2χ检验 (19) 四、非参数假设检验( 2 χ拟合优度检验) (20) 4.1、2χ拟合优度检验 (20) 五、结论 (22) 参考文献 (23) 前言 数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、

社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。 由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.

北航-数理统计大作业

对中国各地财政收入情况的聚类分析和判 别分析 应用数理统计第二次大作业 学院名称 学号 学生姓名 摘要 我国幅员辽阔,由于人才、地理位置、自然资源等条件的不同,各地区的财政收入类型各自呈现出不一样的发展趋势,通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。本文以中国各地财政收入情况为研究对象,从《中国统计年鉴》中选取2011年期间中国各地财政收入情况为因

变量,选取国内增值税、营业税、企业所得税、个人所得税、城市维护建设税、土地增值税、契税、专项收入、行政事业性收费收入、国有资本经营收入和国有资源(资产)有偿使用收入11个可能影响中国各地财政收入的因素为自变量,利用统计软件SPSS,对27个地区的财政收入进行了聚类分析,并对另外4个地区的财政收入进行了判别分析,并最终确定了中国各地区根据财政收入类型的分类情况。 关键词:聚类分析,判别分析,SPSS,中国各地财政收入类型 1、引言 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。 本文利用统计软件SPSS,根据各地区的财政收入情况,对北京、天津、河北等27个地区进行聚类分析,并对青海、重庆、四川、贵州4个省市进行判别分析,判断属于聚类分析结果中的哪种财政收入类型。 1.1 聚类分析 聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。本文采用的是系统聚类分析,它又称集群分析,是聚类分析中应用最广的一种方法,其基本思想是:首先将每个聚类对象看作一类,然后根据对象间的相似程度,将相似程度最高的两类进行合并,并计算合并后的类与其他类之间的距离,再选择相近者进行合并,每合并一次减少一类,直至所有的对象都并为一类为止。 系统聚类分为Q型聚类和R型聚类两种:Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就

应用数理统计试题

山东科技大学2016—2017学年第一学期硕士研究生 《应用统计》考试试卷 2017.06 班级 姓名 学号 一、填空题(每空3分,共36分) 1.当样本观测值12345(,,,,)(1,4,6,4,3)x x x x x =--时,对应次序统计量的观测值为 ;秩统计量的观测值为 . 2.设128,,,(0,4)X X X iid N L ,8118i i X X ==∑,则4814i i i i E X X ==?? ????=?? ????????? ∑∑ ; 821()i i E X X =??-=????∑ ;421()i i E X X =??-=???? ∑ . 3.设129,,,(1,1)X X X iid N L ,则() 9 2 11 1i i Y X == -∑服从 分布; () ()4 8 2 2 21 5 11i i i i Y X X ===--∑∑服从 分布;( 311Y X =-服从 分布. 4.设总体2(,)X N μσ:,样本1,n X X L ,2 σ已知, X 样本均值,2 S 为样本方差, 若 )~(0,1)X N μσ-,则μ的一个双侧1α-置信区间为 ;μ的一个单侧 1α-置信上限为 。 5.在样本量41n =、水平数5a =的单因子方差分析模型中,若总离差平方和200SS =,误 差平方和120e SS =,则因素平方和A SS = ;F 检验统计量的值= . 二、计算与证明(1、4小题每题20分,2、3小题每题12分,共64分) 1.设总体的分布密度函数为1 ,02()20,x f x θθ?≤≤? =???其他 ,1,n X X L 是从中抽取的样本,

应用数理统计作业

<应用数理统计>实验习题二 1.某切割机在正常工作时,切割每段金属棒的平均长度为10.5cm.今从一批产品中随机地抽取15段,测得其长度(单位:cm)如下 10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7 设金属棒长度服从正态分布,且标准差没有变化,(04.02=σ), 试问(1)该机工作是否正常(05.0=α)? (2)上题中假定切割的长度服从正态分布,问该机切割的金属棒的平均长度有无显著变化(05.0=α)? (3)如果只假定切割的长度服从正态分布,问该机切割的金属棒长度的标准差有无显著变化(05.0=α)? >> clear all >> x=[10.4,10.6,10.1,10.4,10.5,10.3,10.3,10.2,10.9,10.6,10.8,10.5,10.7,10.2,10.7]; >> [h,p,ci,u]=ztest(x,10.5,0.2,0.05,1) h = p = 0.6507

10.3951 Inf u = -0.3873 一>> [h,p,ci,u]=ztest(x,10.5,0.2,0.05,0) h = p = 0.6985 ci = 10.3788 10.5812

-0.3873 二[h,sig]=ztest(x,10.5,0.2,0.05,0) h = sig = 0.6985 三 x=[10.4,10.6,10.1,10.4,10.5,10.3,10.3,10.2,10.9,10.6,10.8,10.5,10.7,1 0.2,10.7]; >> [p,sig]=xtest(x,0.2,0.05,0) p = 1 sig =

2018年数理统计大作业题目和答案--0348

1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ未知,n X X X ,,,21Λ为其样本, 2≥n ,则下列说法中正确的是( ) 。 (A ) ∑=-n i i X n 12 2 )(μσ是统计量 (B ) ∑=n i i X n 1 22 σ是统计量 (C ) ∑=--n i i X n 1 2 2 )(1μσ是统计量 (D ) ∑=n i i X n 1 2 μ 是统计量 2、设两独立随机变量)1,0(~N X ,)9(~2 χY ,则 Y X 3服从( )。 )(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16)Y χ )。 )(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F 4、设n X X ,,1Λ是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ). ) (A ∑ -=-1 1 1 1n i i X n )(B ∑=-n i i X n 111 )(C ∑=n i i X n 21 )(D ∑-=1 1 1n i i X n 5、设4321,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是 ( ). (A )3/X σ; (B ) 4 1 4 i i X =∑; (C )σ-1X ; (D ) 4 221 /i i X σ=∑ 6、设总体),(~2 σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则 下列正确的是( ). 2() ~(,)A X N μσ 2() ~(,)B nX N μσ 222 1 1 () ()~()n i i C X n μχσ=-∑ ) () ~()X D t n S μ- 7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ???是来自总体的简单随机样本,则下列随机变量不是统计量为( ) ( A ) . 12X X + ( B ) {}max ,15i X i ≤≤

相关文档
相关文档 最新文档