第六章课后习题解答
1. 设矩阵A 为
231158011223-?? ?= ? ?-??
A ,
求广义逆矩阵r --
A ,A .
解:用矩阵初等变换来求广义逆-A .
231110012230015801010231110012230010000211--???? ? ?→- ? ? ? ?---????, 1223001108112030157102015710200002110000211---???? ? ?→---→-- ? ? ? ?----????, 412032311108111025801015721112230000--??????
??? ?
=-=-= ??? ? ??? ?---??????PAQ E B .
取11000100000
00-?? ? ?= ?
???B ,则14
1
002
032030101
021020000002110
00000---????
-?? ?
?- ? ? ?
==-=
? ? ?
?-- ?
???????
A Q
B P E .
再用最大秩分解来求r -
A :
用初等行变换化A 为行标准形矩阵A
2311108115801015712230070--???? ? ?
=→=- ? ? ? ?-????
A A ,
则231081158015712??-??
?== ? ?-?
? ???
A BD 为A 的一个最大秩分解.
用初等行变换求B 的单边逆.由231001020358010011021200100211-????
? ?
→- ? ? ? ?--????
得
1203102L --??= ?-??
B . 容易看出11001000
0R -??
? ?
= ? ???
D ,于是 11
10203012031
020********
00
00r R L ----????
? ?--??
? ?
=== ?
? ?
-?? ? ?????
A D
B .
2. 设n n
?∈A C
,证明:总有广义逆矩阵-
A 存在.
证:若m n ?=A 0,此时任给n m
?∈X C
,都有0X0=0,故-=X A .
若m n ?≠A 0,设()0rank r =>A ,则存在m 阶可逆矩阵P 与n 阶可逆矩阵Q 使得
r
??
???
E 0A =P Q 0
0. 设11--??
???
r E X G =Q P Y Z ,其中()
()()(),,r m r n r r n r m r ?--?-?-∈∈∈X C
Y C Z C 为任意矩阵。则 11 r r
r r r r r r r E 0E X E 0AGA =P QQ P P Q 00Y Z 00E 0E X E 0=P Q
00Y Z 00E X E 0=P Q
0000E 0 =P Q
00 =A
--?????? ? ?
???????
??????
???????????????
?????????
???
故-
G =A .
3. 设m n
?∈A C
,证明(){1}T T
-∈A A .
证:因为{1}{,}T T
T
T
m n
?=?∈A G A GA =A G C ,而()()T T T T --=A A A AA A ,
故(){1}T
T
-∈A A .
4. 设,m m
n n ??∈∈P C
Q C 均为可逆矩阵,且有=B PAQ ,证明:11{1}---∈Q A P B .
证:因为1
1
1
1
()--
---
--
B Q A P B =PAQQ A P PAQ =PAA AQ =PAQ =B ,所以
11{1}---∈Q A P B .
5. 证明:m n ?0的自反广义逆矩阵仅为n m ?0. 证:n m
??∈G C
,有m n m n m n ???0G0=0,可见G 为 m n ?0的广义逆矩阵.要使G 是m n ?0
的自反广义逆矩阵,还需m n ?=G0G G 成立,但m n n m ??=G0G 0,所以n m ?=G 0.
6. 设,,m n
n r r m ???∈∈∈A C Y C Z C ,且r ZAY =E ,则r -=A YZ 是A 的自反广义逆
矩阵.
证:()()()r YZ A YZ =Y ZAY Z =YE Z =YZ
7. 设矩阵为10
2215,011131?? ? ?
= ?
- ?-??
A 求M-P 广义逆矩阵+A .
解:容易验证()3rank =A ,为列满秩矩阵,所以1
()H
H
+
-=A A A A .
1
21201651121501135111011251111131131H ??
???? ? ? ?
?== ? ? ?- ?
?-- ?????-??
A A ,所以
1
165111201()511
101131113125118536292776111111111
11111
201366549231
41 011311444422
21122251129494117
1251144
4422
2
1122H H -+-????
? ?== ? ? ? ?--??
??
????---- ?
?? ? ?
? =-
=-
? ? ?-- ? ?? ? --- ?
???A A A A ?
?
??
?
?
??
8. 设{1}m n
?∈∈A C
,D,G A 试证明:{1,2}∈GAD A .
证:由{1}∈D,G A 得,==ADA A AGA A ,故有
()()A GAD A =AGA DA =ADA =A ,
()()()()GAD A GAD =G ADA GAD =G AGA D =GAD .
所以{1,2}∈GAD A .
9. 设2
H
==A A A ,试证明:+
A =A .
证:由条件2H ==A A A 可得
22=AAA =A A =A A ,()H H H ==AA A A AA .
由以上两式易见矩阵A 与它本身满足M-P 广义逆定义的四个方程,所以+A =A .
10. 设H =A A ,证明:
22222222()(),,()()+++++++++=====A A AA A A,A A A A A A A A AA .
证:(1)利用已知H =A A 和教材P203定理4(1)中结论有
22()()()()H H +++++++====A AA A A A A A .
(2) 由H =A A 和+
A 的性质有()()()H
H
H
H H
+
+++
+
====AA AA A A A A A A .
(3) 利用(2)的结论++=AA A A 有22+++++====A A A AA AA A AAA A A . (4) 由(1), (2)中结论得2222()()+++++++
====A A A A AAA A AA AA AA ,同理可得22()++
=A A AA .
11. 若A 的最大秩分解为=A BC ,证明:+++
=A C B . 证:m n
r
??∈A C ,由已知=A BC 为A 的最大秩分解,可得
11()()H H H H +--=A C CC B B B . 由于B 是列满秩矩阵,则r B =BE 为B 的最大秩分解,
于是1
()H
H
+
-=B B B B ,同理,由C 是行满秩矩阵得1
()H
H +
-=C C CC ,所以+++
=A C B .
12. 证明:()++
=A A .
证:易知A 与+
A 满足M-P 广义逆定义的四个方程,故有()++
=A A .
13. 试证明:
()(),()(),()()()(),()()()().
H H H H H H H H H H H H H ++++++++++++++=====A A A A AA A A A A A AA A =A AA A AA AA AA AA AA 证:略,见教材P203定理4. 14. 设m m
?∈U C
与n n
?∈V C 均是酉矩阵,证明:()H H
+
+
UAV =VA U .
证:利用U,V 为酉矩阵和+
A 的运算性质,容易验证H
UAV 和H
+
VA U
满足M-P 广义逆定义的四个方程:
(1) H
H
H
H H +
+UAV VA U UAV
=UAA AV =UAV ; (2) H
H
H
H H +
+
+++VA U UAV VA U
=VA AA U =VA U ;
(3) ()()()+H ++++UAV
VA U =UAA U =U AA U =UAA U =UAV VA U H
H H H H H H H H ;
(4) 类似(3)可得()H
H
H
H
H
+
+
VA U UAV =VA U UAV . 所以()H H
+
+
UAV =VA U .
15. 若A 是正规矩阵,证明:⑴++=A A AA ;⑵()()n n
+
+=A A . 证:设A 为m 阶正规矩阵,则存在酉矩阵U ,使得
1
H m λλ????=?
????
?U AU , 1
H m λλ??
??=?
????
?
A U U . 由14题结论知1
1H H m m λλλλ+
+++??
??
?
??
?==????
?????
??
?
A U U U U
,其中10,
00.
i i i i λλλλ+≠?=?=?,
1,i m =.
(1) 1111H H H
m m m m λλλλλλλλ+
++
++????
??
???
???==?
?????
?????????
???A A U U U U U U , 1
111
H H H m m m m λλλλλλλλ+++++????
??
?
?????==?????
?
???????
??
??
?
AA U U U U U U . 所以+
+
=A A AA .
(2) 111
()n H H H m m m λλλλλλ+
+??????
??
??
?????= ????
???
??????????
?
????
A U
U U U U U
111111()()()n
n n H H H n n m m m H H H n n n n
λλλλλλλλλλλλ++
+++++++++????????
??
? ???????=== ? ???????
? ?????????????
????
????????????=?
?????????????????
=U U U U U U U U U U U U
A 16. 若()()H H
==ABA =A,BA BA,AGA =A,AG AG ,则+
BAG =A .
证:由已知条件验证BAG 满足M-P 广义逆定义的四个方程: (1) ()()A BAG A =ABA GA =AGA =A ;
(2) ()()()BAG A BAG =B AGA BAG =BABAG =BAG ; (3) ()()H
H
ABAG =AG =AG =ABAG ; (4) ()()H
H
BAGA =BA =BA =BAGA . 所以+
BAG =A .
17. 试证明:()+
+
+
?=?A B A B . 证:根据Kronecker 乘积的性质有:
()()()()()++++???=?=?A B A B A B AA A BB B A B ; ()()()()()++++++++++???=?=?A B A B A B A AA B BB A B ;
[()()][()()]()() ()()()()
H H H H ++++++++++
??=?=?=?=??A B A B AA BB AA BB AA BB A B A B ;
同理[()()]()()H
+
+
+
+
??=??A B A B A B A B . 所以()+
++
?=?A B A B .
18. 试用各种方法求+
A :
⑴120024?? ?= ? ???A , ⑵121012-??= ?-??A , ⑶0101i i ??
?
= ? ?
??
A ,
⑷120002240?? ?
= ? ???
A , ⑸1
00111002
11??
?- ?
= ? ?-??
A . 解:(1) 奇异值分解法:
125010102000002042410020H ????
?? ? ?
== ? ? ?
?? ? ?????
AA , 由()2350
100
25010
020
H
λλλλλλ---==-=--E AA 得H AA 的特征值1225,0λλ==.
而对应于125λ=
的单位特征向量为10,T
α=,故()11α=U .
1111201021252500,204242502525H H
r +-?? ???=?=??=
? ? ? ????
? ???
A A U U . (2) 最大秩分解法:显然A 是行满秩矩阵,
1012164210124512H ??
--???? ?=-= ? ? ?--???? ?-??AA ,易得()1
5414614H -??= ???
AA .
所以()1
1054541121624614141238H H -+????
?? ? ?==-?= ? ? ??? ? ?-????
A A AA .
(3) 极限算法:
010*******H i i i i i i ??
-???? ?== ? ? ?--???? ???
A A ,22
2222H i i
δδδ??
++=?
?-+??
A A E . 容易算得22
1
2222
21
()(1)(3)2H
i i δδδδδ-??+-+=??+++??
A A E ,于是
22
1
22220022
222201021
lim()lim 01(1)(3)221
(2)11333lim 12(1)(3)1(1)23
33H
H
i i i i
i i i i i i δδδδδδδδδδδδδδ+
-→→→-??+-??=+=?? ?-+++??????-- ?
??-++-== ? ?++-++ ???- ?
??A A A E A (4) 谱分解法:
()31021
2051002040
0210200,
020*******
10010
200(4)250,0
4
H H λλλλλλλ??????
??? ?== ??? ? ??? ????
???
---=--=--=-A A E A A
故H
A A 的特征值为1234,25,0λλλ===.于是12311
,,0425
λλλ---=
==. 设 123()()()(25),P λλλλλλλ=--=-213()()()(4),P λλλλλλλ=--=-
312()()()(4)(25)P λλλλλλλ=--=--.
可求得 1122()4(425)84,()25(254)525P P λλ=-=-=-=,
1323()(25),()(4)H H H H H H =-=-P A A A A E A A P A A A A E A A .
于是
33
1
202525(25)(4)112404842552525251002
H H H H
H +?? ? ???-- ?=?+?=?? ?-??
? ? ??
?
A A E A A A A E A A A A . (5) 最大秩分解法:容易得到A 的一个满秩分解表达式
100
11001001121?? ?
??
?== ? ?-?? ???
A BC , 11
1062201111,,(),()022*******T T T T ---????????==== ? ? ? ?-????
????CC B B CC B B .
于是 1122221()()131181311T T T T
+---?? ?==-- ? ?--??
A C CC
B B B . 19. 证明:方程组H H =A Ax A b 是相容的,其中,m n
m ?∈∈A C
b C .
证:方程H H
=A Ax A b 相容的充要条件是()()H
H
H
rank rank =A A A b A A ,显然
()()H H H rank rank ≥A A A b A A ,同时有
()(())()()H H H H H rank rank rank rank =≤=A A A b A A b A A A ,
所以()()H
H
H
rank rank =A A A b A A ,方程H H
=A Ax A b 相容.
20. 已知
120024?? ?= ? ???A ,102?? ?= ? ???
b .
求方程组=Ax b 的通解及最小范数解.
解:显然()()2rank rank ==A b A ,方程组是相容的. 容易得到A 的一个最大秩分
解为()10122??
?
== ? ???
A BD ,而
()()1
111
2()10201
020
552T T -+-???? ?
??
?=== ? ?
???
?
????
?B B B B , ()1
1
1115()122225T T -+-?? ???????=== ? ? ? ? ???????
???
D D DD .
所以 11
20
1252525022
455052525+++
???? ? ???=== ? ?
??? ? ? ? ???
??
A D
B . 方程组的通解为
1221212()121211200
102525252500024012
400224252525
2514
215555221255
55u u u u u u +
+
??
=+- ?
??
??
????????
? ? ???
?? ? ? ?=+-
? ? ?
? ? ? ? ? ?????
? ? ? ?
???????????
?????- ? ? ??=+= ? ? ? ? ? ??- ? ?
?????x A b E A A 12124255. , R 2155u u u u ?????-? ?
?++∈?
? ?? ? ?- ? ? ????
?? 最小范数解为1
2[
]55
T +
=A b . 21. 验证下列方程组是不相容的,并用+A 求它的最佳逼近解.
⑴ 0021110100111111????
? ?
? ?= ? ? ? ?????
x ; ⑵ 020********
23102114611i i i i i i +-???? ? ?
----= ? ? ? ?-????
x . 解:(1) 显然3()()2rank rank =≠=A b A ,故方程组不相容. 将矩阵A 通过初等行变换变为A
021
101100
01001000111000????
? ?
?
?
=→= ?
?
? ?????
A A 可得A 的最大秩分解02101100100111?? ?
?? ?== ? ??? ???
A BC . 111
21206101,,(),()2
160112110
1T T T T --??-?????? ?==== ? ? ? ?-????
????
B B C
C B B CC . 所以
11()()10161010101102
1220111101012615126152282
42T T T T
+--=????
-????
? ?= ??? ? ?-????
?
????--??
?=-- ?
?-??
A C CC
B B B 最佳逼近解为
0261514112615142211824216+
--?????? ??? ?==--= ??? ? ??? ?-??????
x A b . (2)
22. 已知
102,(0,1,0)204T
T
??== ?
??
A b , 求方程组=Ax b 的最小二乘解和最佳逼近解.
解:因2()()1rank rank =≠=A b A ,故方程组不相容.易得A 的一个最大秩分解为
()10122?? ?
== ? ???
A BC ,
所以()111102111()()102220455
25T T T T +--????
==??
= ? ?????A C CC B B B ,最佳逼近解为
001020112040250+
??
???? ?=== ? ? ?????
???
x A b .
方程组的最小二乘解为
12212()1
2120
010252500001240
242525u u u u ++??
=+- ?
??
?????? ? ???
???? ? ?=+-
? ? ? ? ? ? ??????? ? ?
??????
?
x A b E A A
1
1212242425555. , R 21215555u u u u u u ??????-- ? ? ???==+∈ ? ? ? ? ? ? ???-- ? ? ???????
23. 设A 是对称矩阵,+=M A ,证明:2
2()+
=M A . 证:略,见第10题. 24. 设m m
?∈A C 和n n
?∈B C
均可逆,证明:
⑴ 若m n
?∈D C 是左可逆的,则ADB 是左可逆的. ⑵ 若m n
?∈D C
是右可逆的,则ADB 是右可逆的.
证:(1) 若D 左可逆,则存在1n m L -?∈D C ,使得1
L n -=D D E ,由于,A B 均可逆,故111()L n ---=B D A ADB E .所以ADB 是左可逆的,且 1111()L L ----=ADB B D A .
(2) 类似(1)可证得1111
()R R ----=ADB B D A .
25. 求1100000??= ???A 和2100000??
?= ?
?
??
A 的1+A 和2+
A . 解:(1) 1A 的最大秩分解为()1110
00??== ???
A BC , 所以
()111110()()0111000000T T T T +--???? ? ?
==???= ? ? ? ?????
A C CC
B B B .
(2) 因为21T =A A ,所以()()
211
100000T
T
++
+??=== ???
A A A . 26. 已知一组数据:(-3,9),(-2,6),(0,2),(1,1),求数据拟合的最佳二次抛物线,并计
算误差.
解:本题实际上是要求参数i β,使函数2
012y x x βββ=++最佳拟合数据点
(-3,9),(-2,6), (0,2),(1,1). 也即求方程组
0121399124610021111ββββ-??????
? ?- ?
? ?
=== ? ? ? ?
? ???????
A b
的最佳逼近解.
因系数矩阵A 是列满秩的,求得1
5421151()21492090152010T ---?? ?=- ? ?-??A A ,故最佳逼近解 195421151111261()21492032014/329015201094011/31T T β+-??
--?????? ? ??? ?
?===---=- ??? ? ? ??? ?
- ???????
??
A b A A A b . 于是数据拟合的最佳二次抛物线为2
41233
y x x =-+. 误差为
222139902124604/3010020
1/311110b β-???????? ? ? ?- ? ? ? ?-=--== ? ? ? ? ? ? ? ?????????
A
一、填空题: 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立,则样本均值向量x服从的分布 为_x~N(μ,Σ/n)_。 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A
和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ 0p H =ΣI : /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI : /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S
行程问题典型例题及答案详解 行程问题是小学奥数中的重点和难点,也是西安小升初考试中的热点题型,纵观近几年试题,基本行程问题、相遇追及、多次相遇、火车、流水、钟表、平均速度、发车间隔、环形跑道、猎狗追兔等题型比比皆是,以下是一些上述类型经典例题(附答案详解)的汇总整理,有疑问可以直接联系我。 例1:一辆汽车往返于甲乙两地,去时用了4个小时,回来时速度提高了1/7,问:回来用了多少时间? 分析与解答:在行程问题中,路程一定,时间与速度成反比,也就是说速度越快,时间越短。设汽车去时的速度为v千米/时,全程为s千米,则:去时,有s÷v=s/v=4,则 回来时的时间为:,即回来时用了3.5小时。评注:利用路程、时间、速度的关系解题,其中任一项固定,另外两项都有一定的比例关系(正比或反比)。 例2:A、B两城相距240千米,一辆汽车计划用6小时从A城开到B城,汽车行驶了一半路程,因故障在中途停留了30分钟,如果按原计划到达B城,汽车在后半段路程时速度应加快多少? 分析:对于求速度的题,首先一定是考虑用相应的路程和时间相除得到。 解答:后半段路程长:240÷2=120(千米),后半段用时为:6÷2-0.5=2.5(小时),后半段行驶速度应为:120÷2.5=48(千米/时),原计划速度为:240÷6=40(千米/时),汽车在后半段加快了:48-40=8(千米/时)。 答:汽车在后半段路程时速度加快8千米/时。 例3:两码头相距231千米,轮船顺水行驶这段路程需要11小时,逆水每小时少行10千米,问行驶这段路程逆水比顺水需要多用几小时? 分析:求时间的问题,先找相应的路程和速度。 解答:轮船顺水速度为231÷11=21(千米/时),轮船逆水速度为21-10=11(千米/时),逆水比顺水多需要的时间为:21-11=10(小时) 答:行驶这段路程逆水比顺水需要多用10小时。
计量经济学题库 一、单项选择题(每小题1分) 1.计量经济学是下列哪门学科的分支学科(C)。 A.统计学 B.数学 C.经济学 D.数理统计学 2.计量经济学成为一门独立学科的标志是(B)。 A.1930年世界计量经济学会成立B.1933年《计量经济学》会刊出版 C.1969年诺贝尔经济学奖设立 D.1926年计量经济学(Economics)一词构造出来 3.外生变量和滞后变量统称为(D)。 A.控制变量 B.解释变量 C.被解释变量 D.前定变量4.横截面数据是指(A)。 A.同一时点上不同统计单位相同统计指标组成的数据B.同一时点上相同统计单位相同统计指标组成的数据 C.同一时点上相同统计单位不同统计指标组成的数据D.同一时点上不同统计单位不同统计指标组成的数据 5.同一统计指标,同一统计单位按时间顺序记录形成的数据列是(C)。 A.时期数据 B.混合数据 C.时间序列数据 D.横截面数据6.在计量经济模型中,由模型系统内部因素决定,表现为具有一定的概率分布的随机变量,其数值受模型中其他变量影响的变量是( A )。 A.内生变量 B.外生变量 C.滞后变量 D.前定变量7.描述微观主体经济活动中的变量关系的计量经济模型是( A )。 A.微观计量经济模型 B.宏观计量经济模型 C.理论计量经济模型 D.应用计量经济模型 8.经济计量模型的被解释变量一定是( C )。 A.控制变量 B.政策变量 C.内生变量 D.外生变量9.下面属于横截面数据的是( D )。 A.1991-2003年各年某地区20个乡镇企业的平均工业产值 B.1991-2003年各年某地区20个乡镇企业各镇的工业产值 C.某年某地区20个乡镇工业产值的合计数 D.某年某地区20个乡镇各镇的工业产值 10.经济计量分析工作的基本步骤是( A )。 A.设定理论模型→收集样本资料→估计模型参数→检验模型B.设定模型→估计参数→检验模型→应用
聚类分析和判别分析练习题 一、选择题 1.需要在聚类分析中保序的聚类分析是( )。 A.两步聚类 B.有序聚类 C.系统聚类 D.k-均值聚类 2.在系统聚类中2R 是( )。 A.组内离差平方和除以组间离差平方和 B.组间离差平方和除以组内离差平方和 C.组间离差平方和除以总离差平方和 D.组间均方除以总均方。 3.系统聚类的单调性是指( )。 A.每步并类的距离是单调增的 B.每步并类的距离是单调减的 C.聚类的类数越来越少 D.系统聚类2R 会越来越小 4.以下的系统聚类方法中,哪种系统聚类直接利用了组内的离差平方和。( ) A.最长距离法 B.组间平均连接法 C.组内平均连接法 D.WARD 法 5.以下系统聚类方法中所用的相似性的度量,哪种最不稳健( )。 A.2 1()p ik jk k x x =-∑ B. 1p ik jk k ik jk x x x x =-+∑ C. 21p k =∑ D. 1()()i j i j -'x -x Σx -x 6. 以下系统聚类方法中所用的相似性的度量,哪种考虑了变量间的相关性( )。A.2 1()p ik jk k x x =-∑ B. 1 p ik jk k ik jk x x x x =-+∑ C. 21 p k =∑ D. 1()()i j i j -'x -x Σx -x 7.以下统计量,可以用来刻画分为几类的合理性统计量为( )? A.可决系数或判定系数2R B. G G W P P -
C.()/(1) /() G G W P G P n G -- - D.() G W P W - 8.以下关于聚类分析的陈述,哪些是正确的() A.进行聚类分析的统计数据有关于类的变量 B.进行聚类分析的变量应该进行标准化处理 C.不同的类间距离会产生不同的递推公式 D.递推公式有利于运算速度的提高。D(3)的信息需要D(2)提供。 9.判别分析和聚类分析所要求统计数据的不同是() A.判别分析没有刻画类的变量,聚类分析有该变量 B.聚类分析没有刻画类的变量,判别分析有该变量 C.分析的变量在不同的样品上要有差异 D.要选择与研究目的有关的变量 10.距离判别法所用的距离是() A.马氏距离 B. 欧氏距离 C.绝对值距离 D. 欧氏平方距离 11.在一些条件同时满足的场合,距离判别和贝叶斯判别等价,是以下哪些条件。 () A.正态分布假定 B.等协方差矩阵假定 C.均值相等假定 D.先验概率相等假定 12.常用逐步判别分析选择不了的标准是() A.Λ统计量越小变量的判别贡献更大 B.Λ统计量越大变量的判别贡献更大 C.判定系数越小变量的判别贡献更大 D.判定系数越大变量的判别贡献更大 二、填空题 1、聚类分析是建立一种分类方法,它将一批样本或变量按照它们在性质上的_______________进行科学的分类。 2.Q型聚类法是按_________进行聚类,R型聚类法是按_______进行聚类。 3.Q型聚类相似程度指标常见是、、,而R型聚类相似程度指标通常采用_____________ 、。 4.在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量纲或数量级的影响,达到数据间
行程问题(一) 专题简析: 行程应用题是专门讲物体运动的速度、时间、路程三者关系的应用题。行程问题的主要数量关系是:路程=速度×时间。知道三个量中的两个量,就能求出第三个量。 例1 甲、乙两车同时从东、西两地相向开出,甲车每小时行56千米,乙车每小时行48千米。两车在距中点32千米处相遇,东、西两地相距多少千米 分析与解答从图中可以看出,两车相遇时,甲车比乙车多行了32×2=64(千米)。两车同时出发,为什么甲车会比乙车多行64千米呢因为甲车每小时比乙车多行56-48=8(千米)。64里包含8个8,所以此时两车各行了8小时,东、西两地的路程只要用(56+48)×8就能得出。 32×2÷(56-48)=8(小时) (56+48)×8=832(千米) 答:东、西两地相距832千米。 练习一 》 1,小玲每分钟行100米,小平每分钟行80米,两人同时从学校和少年宫出发,相向而行,并在离中点120米处相遇。学校到少年宫有多少米 2,一辆汽车和一辆摩托车同时从甲、乙两地相对开出,汽车每小时行40千米,摩托车每小时行65千米,当摩托车行到两地中点处时,与汽车还相距75千米。甲、乙两地相距多少千米
例2 快车和慢车同时从甲、乙两地相向开出,快车每小时行40千米,经过3小时,快车已驶过中点25千米,这时快车与慢车还相距7千米。慢车每小时行多少千米 分析与解答快车3小时行驶40×3=120(千米),这时快车已驶过中点25千米,说明甲、乙两地间路程的一半是120-25=95(千米)。此时,慢车行了95-25-7=63(千米),因此慢车每小时行63÷3=21(千米)。 [ (40×3-25×2-7)÷3=21(千米) 答:慢车每小时行21千米。 练习二 1,兄弟二人同时从学校和家中出发,相向而行。哥哥每分钟行120米,5分钟后哥哥已超过中点50米,这时兄弟二人还相距30米。弟弟每分钟行多少米 2,汽车从甲地开往乙地,每小时行32千米。4小时后,剩下的路比全程的一半少8千米,如果改用每小时56千米的速度行驶,再行几小时到达乙地 & 例3 甲、乙二人上午8时同时从东村骑车到西村去,甲每小时比乙快6千米。中午12时甲到西村后立即返回东村,在距西村15千米处遇到乙。求东、西两村相距多少千米 分析与解答二人相遇时,甲比乙多行15×2=30(千米),说明二人已行30÷6=5(小时),上午8时至中午12时是4小时,所以甲的速度是15÷(5-4)=15(千米/小时)。 因此,东西两村的距离是15×(5-1)=60(千米)
第五章经典单方程计量经济学模型:专门问题 一、内容提要 本章主要讨论了经典单方程回归模型的几个专门题。 第一个专题是虚拟解释变量问题。虚拟变量将经济现象中的一些定性因素引入到可以进行定量分析的回归模型,拓展了回归模型的功能。本专题的重点是如何引入不同类型的虚拟变量来解决相关的定性因素影响的分析问题,主要介绍了引入虚拟变量的加法方式、乘法方式以及二者的组合方式。在引入虚拟变量时有两点需要注意,一是明确虚拟变量的对比基准,二是避免出现“虚拟变量陷阱”。 第二个专题是滞后变量问题。滞后变量包括滞后解释变量与滞后被解释变量,根据模型中所包含滞后变量的类别又可将模型划分为自回归分布滞后模型与分布滞后模型、自回归模型等三类。本专题重点阐述了产生滞后效应的原因、分布滞后模型估计时遇到的主要困难、分布滞后模型的修正估计方法以及自回归模型的估计方法。如对分布滞后模型可采用经验加权法、Almon多项式法、Koyck方法来减少滞项的数目以使估计变得更为可行。而对自回归模型,则根据作为解释变量的滞后被解释变量与模型随机扰动项的相关性的不同,采用工具变量法或OLS法进行估计。由于滞后变量的引入,回归模型可将静态分析动态化,因此,可通过模型参数来分析解释变量对被解释变量影响的短期乘数和长期乘数。 第三个专题是模型设定偏误问题。主要讨论当放宽“模型的设定是正确的”这一基本假定后所产生的问题及如何解决这些问题。模型设定偏误的类型包括解释变量选取偏误与模型函数形式选取取偏误两种类型,前者又可分为漏选相关变量与多选无关变量两种情况。在漏选相关变量的情况下,OLS估计量在小样本下有偏,在大样本下非一致;当多选了无关变量时,OLS估计量是无偏且一致的,但却是无效的;而当函数形式选取有问题时,OLS估计量的偏误是全方位的,不仅有偏、非一致、无效率,而且参数的经济含义也发生了改变。在模型设定的检验方面,检验是否含有无关变量,可用传统的t检验与F检验进行;检验是否遗漏了相关变量或函数模型选取有错误,则通常用一般性设定偏误检验(RESET检验)进行。本专题最后介绍了一个关于选取线性模型还是双对数线性模型的一个实用方法。 第四个专题是关于建模一般方法论的问题。重点讨论了传统建模理论的缺陷以及为避免这种缺陷而由Hendry提出的“从一般到简单”的建模理论。传统建模方法对变量选取的
《应用多元统计分析》 ——报告 班级: 学号: 姓名:
聚类分析的案例分析 摘要 本文主要用SPSS软件对实验数据运用系统聚类法和K均值聚类法进行聚类分析,从而实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的 气体浓度的情况,从而判断出这几个地区的污染程度。 经过聚类分析可以得到,样本6这一地区的气体浓度值最高,污染程度是最严重的,样本3和样本4气体浓度较高,污染程度也比较严重,因此要给予及时的控制和改善。 关键词:SPSS软件聚类分析学生成绩
一、数学模型 聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的相 似性。可以根据这些相似性把相似程度较高的归为一类,从而对其总体进行分析和总结,判断其之间的差距。 系统聚类法的基本思想是在这几个样本之间定义其之间的距离,在多个变量之间定义其相似系数,距离或者相似系数代表着样本或者变量之间的相似程度。根据相似程度的不同大小,将样本进行归类,将关系较为密切的归为一类,关系较为疏远的后归为一类,用不同的方法将所有的样本都聚到合适的类中,这里我们用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。 K 均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。 二、数据来源 《应用多元统计分析》第一版164 页第6 题 我国山区有一某大型化工厂,在该厂区的邻近地区中挑选其中最具有代表性的 8 个大气取样点,在固定的时间点每日 4 次抽取6 种大气样本,测定其中包含的8 个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及 大气污染气体进行分类。 三、建立数学模型 一、运行过程
第五章 聚类分析 判别分析和聚类分析有何区别 答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n 个样本,对每个样本测得p 项指标(变量)的数据,已知每个样本属于k 个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。 试述系统聚类的基本思想。 答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 对样品和变量进行聚类分析时, 所构造的统计量分别是什么简要说明为什么这样构造 答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n 个样本看作p 维空间的n 个点。点之间的距离即可代表样品间的相似度。常用的距离为 (一)闵可夫斯基距离:1/1 ()() p q q ij ik jk k d q X X ==-∑ q 取不同值,分为 (1)绝对距离(1q =) 1 (1)p ij ik jk k d X X ==-∑ (2)欧氏距离(2q =) 21/2 1 (2)() p ij ik jk k d X X ==-∑ (3)切比雪夫距离(q =∞) 1()max ij ik jk k p d X X ≤≤∞=- (二)马氏距离 (三)兰氏距离 对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。 将变量看作p 维空间的向量,一般用 2 1()()()ij i j i j d M -'=--X X ΣX X 11()p ik jk ij k ik jk X X d L p X X =-=+∑
第十讲:行程问题分类例析 主讲:何老师 行程问题有相遇问题,追及问题,顺流、逆流问题,上坡、下坡问题等.在运动形式上分直线运动及曲线运用(如环形跑道). 相遇问题是相向而行.相遇距离为两运动物体的距离和.追及问题是同向而行,分慢的在快的前面或慢的先行若干时间,快的再追及,追及距离慢快S S S +=.顺逆流、顺风逆风、上下坡应注意运动方向,去时顺流, 回时则为逆流. 一、相遇问题 例1:两地间的路程为360km ,甲车从A 地出发开往B 地,每小时行72km ;甲车出发25分钟后,乙车从B 地出发开往A 地,每小时行使48km ,两车相遇后,各自按原来速度继续行使,那么相遇以后,两车相距100km 时,甲车从出发开始共行驶了多少小时? 分析:利用相遇问题的关系式(相遇距离为两运动物体的距离和)建立方程. 解答:设 甲车共 行使了 xh ,则乙车行使了h x )(60 25-.(如图1) 依题意,有72x+48)(60 25-x =360+100,
解得x=4. 因此,甲车共行使了4h. 说明:本题两车相向而行,相遇后继续行使100km ,仍属相遇问题中的距离,望读者仔细体会. 例2:一架战斗机的贮油量最多够它在空中飞行 4.6h,飞机出航时顺风飞行,在静风中的速度是575km/h,风速25 km/h,这架飞机最多能飞出多少千米就应返回? 分析:列方程求解行程问题中的顺风逆风问题. 顺风中的速度=静风中速度+风速 逆风中的速度=静风中速度-风速 解答:解法一:设这架飞机最远飞出xkm 就应返回. 依题意,有6425 57525575.=-++x x 解得:x=1320. 答:这架飞机最远飞出1320km 就应返回. 解法二: 设飞机顺风飞行时间为th. 依题意,有(575+25)t=(575-25)(4.6-t), 解得:t=2.2.
5.2酿酒葡萄的等级划分 5.2.1葡萄酒的质量分类 由问题1中我们得知,第二组评酒员的的评价结果更为可信,所以我们通过第二组评酒员对于酒的评分做出处理。我们通过excel计算出每位评酒员对每支酒的总分,然后计算出每支酒的10个分数的平均值,作为总的对于这支酒的等级评价。 通过国际酿酒工会对于葡萄酒的分级,以百分制标准评级,总共评出了六个级别(见表5)。 在问题2的计算中,我们求出了各支酒的分数,考虑到所有分数在区间[61.6,81.5]波动,以原等级表分级,结果将会很模糊,不能分得比较清晰。为此我们需要进一步细化等级。为此我们重新细化出5个等级,为了方便计算,我们还对等级进行降序数字等级(见表6)。 通过对数据的预处理,我们得到了一个新的关于葡萄酒的分级表格(见表7):
考虑到葡萄酒的质量与酿酒葡萄间有比较之间的关系,我们将保留葡萄酒质量对于酿酒葡萄的影响,先单纯从酿酒葡萄的理化指标对酿酒葡萄进行分类,然后在通过葡萄酒质量对酿酒葡萄质量的优劣进一步进行划分。 5.2.2建立模型 在通过酿酒葡萄的理化指标对酿酒葡萄分类的过程,我们用到了聚类分析方法中的ward 最小方差法,又叫做离差平方和法。 聚类分析是研究分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合。为了将样品进行分类,就需要研究样品之间关系。这里的最小方差法的基本思想就是将一个样品看作P 维空间的一个点,并在空间的定义距离,距离较近的点归为一类;距离较远的点归为不同的类。面对现在的问题,我们不知道元素的分类,连要分成几类都不知道。现在我们将用SAS 系统里面的stepdisc 和cluster 过程完成判别分析和聚类分析,最终确定元素对象的分类问题。 建立数据阵,具体数学表示为: 1111...............m n nm X X X X X ????=?????? (5.2.1) 式中,行向量1(,...,)i i im X x x =表示第i 个样品; 列向量1(,...,)'j j nj X x x =’,表示第j 项指标。(i=1,2,…,n;j=1,2,…m) 接下来我们将要对数据进行变化,以便于我们比较和消除纲量。在此我们用了使用最广范的方法,ward 最小方差法。其中用到了类间距离来进行比较,定义为: 2||||/(1/1/)kl k l k l D X X n n =-+ (5.2.2) Ward 方法并类时总是使得并类导致的类内离差平方和增量最小。 系统聚类数的确定。在聚类分析中,系统聚类最终得到的一个聚类树,如何确定类的个数,这是一个十分困难但又必须解决的问题;因为分类本身就没有一定标准,人们可以从不同的角度给出不同的分类。在实际应用中常使用下面几种方法确定类的个数。由适当的阀值确定,此处阀值为kl D 。
行程问题(一) 【知识分析】 相遇是行程问题的基本类型,在相遇问题中可以这样求全程:速度和×时间=路程,今天,我们学校这类问题。 【例题解读】 例1客车和货车同时分别从两地相向而行,货车每小时行85千米,客车每小时行90千米,两车相遇时距全程中点8千米, 两地相距多少千米? 【分析】根据题意,两车相遇时货车行了全程的一半-8千米,客车行了全程的一半+8千米,也就是说客车比货车多行了8×2=16千米,客车每小时比货车多行90-85=5千米。那么我们先求客车和货车两车经过多少小时在途中相遇,然后再求出总路程。 (1)两车经过几小时相遇?8×2÷(90-85)=3.2小时 (2)两地相距多少千米?(90+85)×3.2=560(千米) 例2小明和小丽两个分别从两地同时相向而行,8小时可以相遇,如果两人每小时多少行1.5千米,那么10小时相遇,两地 相距多少千米? 【分析】两人每小时多少行1.5千米,那么10小时相遇,如果以这样的速度行8小时,这时两个人要比原来少行1.5×2×8=24(千米)这24千米两人还需行10-8=2(小时),那么减速后的速度和是24÷2=12(千米)容易求出两地的距离 1.5×2×8÷(10-8)×=120千米 【经典题型练习】
1、客车和货车分别从两地同时相向而行,2.5小时相遇,如果两车 每小时都比原来多行10千米,则2小时就相遇,求两地的距离? 2、在一圆形的跑道上,甲从a点,乙从b点同时反方向而行,8 分钟后两人相遇,再过6分钟甲到b点,又过10分钟两人再次相遇,则甲环形一周需多少分钟?
【知识分析】 两车从两地同时出发相向而行,第一次相遇合起来走一个全程,第二次相遇走了几个全程呢?今天,我们学习这类问题 【例题解读】 例 a、b两车同时从甲乙两地相对开出,第一次在离甲地95千米处相遇,相遇后两车继续以原速行驶,分别到达对方站点后立即返回,在离乙地55千米处第二次相遇,求甲乙两地之间的距离是多少千米? 【分析】a、b两车从出发到第一次相遇合走了一个全程,当两年合走了一个全程时,a车行了95千米 从出发到第二次相遇,两车一共行了三个全程,a车应该行了95×3=285(千米)通过观察,可以知道a车行了一个全程还多55千米,用285千米减去55千米就是甲乙两地相距的距离 95×3—55=230千米 【经典题型练习】 1、甲乙两车同时从ab两地相对开出,第一次在离a地75千米相 遇,相遇后两辆车继续前进,到达目的地后立即返回,第二次相遇在离b地45千米处,求a、b两地的距离 2、客车和货车同时从甲、乙两站相对开出,第一次相遇在距乙站 80千米的地方,相遇后两车仍以原速前进,在到达对方站点后立即沿原路返回,两车又在距乙站82千米处第二次相遇,甲乙两站相距多少千米?
计量经济学(第四版)习题参考答案 潘省初
第一章 绪论 试列出计量经济分析的主要步骤。 一般说来,计量经济分析按照以下步骤进行: (1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 计量经济模型中为何要包括扰动项? 为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。 什么是时间序列和横截面数据? 试举例说明二者的区别。 时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。 横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。 估计量和估计值有何区别? 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如Y 就是一个估计量,1 n i i Y Y n == ∑。现有一样本,共4个数,100,104,96,130,则 根据这个样本的数据运用均值估计量得出的均值估计值为 5.1074 130 96104100=+++。 第二章 计量经济分析的统计学基础 略,参考教材。
请用例中的数据求北京男生平均身高的99%置信区间 N S S x = = 4 5= 用 =,N-1=15个自由度查表得005.0t =,故99%置信限为 x S t X 005.0± =174±×=174± 也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在至厘米之间。 25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体? 原假设 120:0=μH 备择假设 120:1≠μH 检验统计量 () 10/2510/25 X X μσ-Z == == 查表96.1025.0=Z 因为Z= 5 >96.1025.0=Z ,故拒绝原假设, 即 此样本不是取自一个均值为120元、标准差为10元的正态总体。 某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500元,在下一个月份中,取出16个这种食品店的一个样本,其月平均销售额为2600元,销售额的标准差为480元。试问能否得出结论,从上次调查以来,平均月销售额已经发生了变化? 原假设 : 2500:0=μH 备择假设 : 2500:1≠μH ()100/1200.83?480/16 X X t μσ-= === 查表得 131.2)116(025.0=-t 因为t = < 131.2=c t , 故接受原假 设,即从上次调查以来,平均月销售额没有发生变化。
各地区各行业工资水平的分析(2009年数据) 小组成员:张艺伟、赵月、陈媛、邹莉、朱海龙、曾磊、胡瑛、候银萍 1.研究背景及意义 1.1 研究背景 工资水平是指一定区域和一定时间内劳动者平均收入的高低程度。生产决定分配,只有经济发展才能提供更多的可分配的社会产品,因此一个地区的工资水平在一定程度上反映了其经济发展的水平。 1.2 研究意义 1. 通过多元统计分析方法,探究一个地区的工资水平与其经济发展水平之间的内在联系。 2. 将平均工资水平划分为3类,分析哪些地区、哪些行业的工资水平较高,可以为大学生就业提供宏观上的方向指引。 2.数据来源与描述 2.1 数据来源——《中国劳动统计年鉴─2010》 (URL:https://www.wendangku.net/doc/be17367877.html,/Navi/YearBook.aspx?id=N2011010069&floor=1###) 主编单位:国家统计局人口和就业统计司,人力资源和社会保障部规划财务司 出版社:中国统计出版社 简介:《中国劳动统计年鉴─2010》是一部全面反映中华人民共和国劳动经济情况的资料性年刊。本刊收集了2009年全国和各省、自治区、直辖市、香港特别行政区、澳门特别行政区的有关劳动统计数据。本书资料的取得形式主要有国家和部门的报表统计、行政记录和抽样调查。 2.2 数据描述 本数据集记录了全国31个省市(港、澳、台除外)的工资状况,各省市分别记录了其23个主要行业的平均工资水平,这23个主要行业包括:企业、事业、机关、金融业、制造业、建筑业、房地产业、农林牧渔业等等,具体数据格式参见图-0。
图-0 3.分析方法及原理 3.1 通过描述统计分析方法,判断哪些行业平均工资水平较高 描述统计分析方法主要是从基本统计量(诸如均值、方差、标准差、极大/小值、偏度、峰度等)的计算和描述开始的,并辅助于SPSS提供的图形功能,能够把握数据的基本特征和整体的分布特征。 在本案例中,通过比较不同行业(诸如企业、事业、机关、建筑业、制造业……)工资的均值、极大/小值,可以从总体上判断哪些行业的平均工资水平较高,哪些行业的较低。 3.2 通过聚类分析方法,判断哪些地区平均工资水平较高 聚类分析是依据研究对象的个体特征,对其进行分类的方法,分类在经济、管理、社会学、医学等领域,都有广泛的应用。聚类分析能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部个体特征之间具有相似性,不同类间个体特征的差异性较大。 在本案例中,我们将采用两种方法进行聚类分析:一种是系统聚类法,另一种是K-均值法(快速聚类法)。 3.2.1系统聚类法 系统聚类法的基本原理:首先将一定数量的样本或指标各自看成一类,然后根据样本(或指标)的亲疏程度,将亲疏程度最高的两类进行合并,然后考虑合并后的类与其他类之间的亲疏程度,再进行合并。重复这一过程,直到将所有的样本(或指标)合并为一类。 系统聚类分为Q型聚类和R型聚类两种:Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就可以在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数、降低变量维度的目的。 在本例中进行的是Q型聚类。 类与类之间距离的计算方法主要有以下几种: (1)最短距离法(Nearest Neighbor),是指两类之间每个个体距离的最小值; (2)最长距离法(Farthest Neighbor),是指两类之间每个个体距离的最大值; (3)组间联接法(Between-groups Linkage),是指两类之间个体之间距离的平均值;
8.如图3-1,甲和乙两人分别从一圆形场地的直径两端点同时开始以匀速按相反的方向绕此 圆形路线运动,当乙走了100米以后,他们第一次相遇,在甲走完一周前60米处又第二次 相遇.求此圆形场地的周长. 【分析与解】 注意观察图形,当甲、乙第一次相遇时,甲乙共走完 12圈的路程,当甲、乙第二次相遇时,甲乙共走完1+12=32 圈的路程. 所以从开始到第一、二次相遇所需的时间比为1:3,因而第二次相遇时乙行走的总路 程为第一次相遇时行走的总路程的3倍,即100×3=300米. 有甲、乙第二次相遇时,共行走(1圈-60)+300,为 32 圈,所以此圆形场地的周长为480米. 行程问题分类例析 欧阳庆红 行程问题有相遇问题,追及问题,顺流、逆流问题,上坡、下坡问题等.在运动形式上 分直线运动及曲线运用(如环形跑道). 相遇问题是相向而行.相遇距离为两运动物体的距离 和.追及问题是同向而行,分慢的在快的前面或慢的先行若干时间,快的再追 及,追及距离慢快S S S +=.顺逆流、顺风逆风、上下坡应注意运动方向,去时顺流,回时则为逆流. 一、相遇问题 例1:两地间的路程为360km ,甲车从A 地出发开往B 地,每小时行72km ;甲车出发25 分钟后,乙车从B 地出发开往A 地,每小时行使48km ,两车相遇后,各自按原来速度继续 行使,那么相遇以后,两车相距100km 时,甲车从出发开始共行驶了多少小时? 分析:利用相遇问题的关系式(相遇距离为两运动物体的距离和)建立方程.
解答:设甲车共行使了xh,则乙车行使了h x) ( 60 25 -.(如图1) 依题意,有72x+48) ( 60 25 - x=360+100, 解得x=4. 因此,甲车共行使了4h. 说明:本题两车相向而行,相遇后继续行使100km,仍属相遇问题中的距离,望读者仔细体会. 例2:一架战斗机的贮油量最多够它在空中飞行 4.6h,飞机出航时顺风飞行,在静风中的速度是575km/h,风速25 km/h,这架飞机最多能飞出多少千米就应返回? 分析:列方程求解行程问题中的顺风逆风问题. 顺风中的速度=静风中速度+风速 逆风中的速度=静风中速度-风速 解答:解法一:设这架飞机最远飞出xkm就应返回. 依题意,有6 4 25 575 25 575 . = - + + x x 解得:x=1320. 答:这架飞机最远飞出1320km就应返回. 解法二:设飞机顺风飞行时间为th. 依题意,有(575+25)t=(575-25)(4.6-t), 解得:t=2.2. (575+25)t=600×2.2=1320. 答:这架飞机最远飞出1320km就应返回. 说明:飞机顺风与逆风的平均速度是575km/h,则有6 4 575 2 . = x ,解得x=1322.5.错误原因在于飞机平均速度不是575km/h,而是) / (h km v v v v v x v x x 574 550 600 550 600 2 2 2 ≈ + ? ? = + ? = +逆 顺 逆 顺 逆 顺 例3:甲、乙两人在一环城公路上骑自行车,环形公路长为42km,甲、乙两人的速度分别为21 km/h、14 km/h. (1)如果两人从公路的同一地点同时反向出发,那么经几小时后,两人首次相遇? (2)如果两人从公路的同一地点同时同向出发,那么出发后经几小时两人第二次相遇? 分析:这是环形跑道的行程问题. 解答:(1)设经过xh两人首次相遇. 依题意,得(21+14)x=42, 解得:x=1.2. 因此,经过1.2小时两人首次相遇. (3)设经过xh两人第二次相遇. 依题意,得21x-14x=42×2, 图1
1、已知一模型的最小二乘的回归结果如下: i i ?Y =101.4-4.78X (45.2)(1.53) n=30 R 2=0.31 其中,Y :政府债券价格(百美元),X :利率(%)。 回答以下问题: (1)系数的符号是否正确,并说明理由;(2)为什么左边是i ?Y 而不是i Y ; (3)在此模型中是否漏了误差项i u ;(4)该模型参数的经济意义是什么。 答:(1)系数的符号是正确的,政府债券的价格与利率是负相关关系,利率的上升会引起政府债券价格的下降。 (2)i Y 代表的是样本值,而i ?Y 代表的是给定i X 的条件下i Y 的期望值,即?(/)i i i Y E Y X 。此模型是根据样本数据得出的回归结果,左边应当是i Y 的期望值,因此是i ?Y 而不是i Y 。 (3)没有遗漏,因为这是根据样本做出的回归结果,并不是理论模型。 (4)截距项101.4表示在X 取0时Y 的水平,本例中它没有实际意义;斜率项-4.78表明利率X 每上升一个百分点,引起政府债券价格Y 降低478美元。 2、有10户家庭的收入(X ,元)和消费(Y ,百元)数据如下表: 10户家庭的收入(X )与消费(Y )的资料 X 20 30 33 40 15 13 26 38 35 43 Y 7 9 8 11 5 4 8 10 9 10 若建立的消费Y 对收入X 的回归直线的Eviews 输出结果如下: Dependent Variable: Y
Variable Coefficient Std. Error X 0.202298 0.023273 C 2.172664 0.720217 R-squared 0.904259 S.D. dependent var 2.233582 Adjusted R-squared 0.892292 F-statistic 75.55898 Durbin-Watson stat 2.077648 Prob(F-statistic) 0.000024 (1)说明回归直线的代表性及解释能力。 (2)在95%的置信度下检验参数的显著性。(0.025(10) 2.2281t =,0.05(10) 1.8125t =,0.025(8) 2.3060t =,0.05(8) 1.8595t =) (3)在95%的置信度下,预测当X =45(百元)时,消费(Y )的置信区间。(其中29.3x =,2()992.1x x -=∑) 答:(1)回归模型的R 2=0.9042,表明在消费Y 的总变差中,由回归直线解释的部分占到90%以上,回归直线的代表性及解释能力较好。 (2)对于斜率项,11 ? 0.20238.6824?0.0233 ()b t s b ===>0.05(8) 1.8595t =,即表明斜率项 显著不为0,家庭收入对消费有显著影响。对于截距项, 00? 2.1727 3.0167?0.7202 ()b t s b ===>0.05(8) 1.8595t =, 即表明截距项也显著不为0,通过了显著性检验。 (3)Y f =2.17+0.2023×45=11.2735 0.025(8) 1.8595 2.2336 4.823t ?=?= 95%置信区间为(11.2735-4.823,11.2735+4.823),即(6.4505,16.0965)。
第五章 聚类分析 5.1 判别分析和聚类分析有何区别? 答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n 个样本,对每个样本测得p 项指标(变量)的数据,已知每个样本属于k 个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。 5.2 试述系统聚类的基本思想。 答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 5.3 对样品和变量进行聚类分析时, 所构造的统计量分别是什么?简要说明为什么这样构造? 答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n 个样本看作p 维空间的n 个点。点之间的距离即可代表样品间的相似度。常用的距离为 (一)闵可夫斯基距离:1/1()()p q q ij ik jk k d q X X ==-∑ q 取不同值,分为 (1)绝对距离(1q =) 1 (1)p ij ik jk k d X X ==-∑ (2)欧氏距离(2q =)
21/2 1 (2)() p ij ik jk k d X X ==-∑ (3)切比雪夫距离(q =∞) 1()max ij ik jk k p d X X ≤≤∞=- (二)马氏距离 (三)兰氏距离 对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。 将变量看作p 维空间的向量,一般用 (一)夹角余弦 (二)相关系数 5.4 在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则? 答: 设d ij 表示样品X i 与X j 之间距离,用D ij 表示类G i 与G j 之间的距离。 (1). 最短距离法 21()()()ij i j i j d M -'=--X X ΣX X 11()p ik jk ij k ik jk X X d L p X X =-=+∑ cos p ik jk ij X X θ= ∑ ()() p ik i jk j ij X X X X r --= ∑ ij G X G X ij d D j j i i ∈∈= ,min
路程=速度×时间; 路程÷时间=速度; 路程÷速度=时间 关键问题 确定行程过程中的位置路程 相遇路程÷速度和=相遇时间相遇路程÷相遇时间= 速度和 相遇问题(直线) 甲的路程+乙的路程=总路程 相遇问题(环形) 甲的路程 +乙的路程=环形周长 追及问题 追及时间=路程差÷速度差 速度差=路程差÷追及时间 路程差=追及时间×速度差 追及问题(直线) 距离差=追者路程-被追者路程=速度差X追及时间 追及问题(环形) 快的路程-慢的路程=曲线的周长 流水问题 顺水行程=(船速+水速)×顺水时间 逆水行程=(船速-水速)×逆水时间 顺水速度=船速+水速 逆水速度=船速-水速 静水速度=(顺水速度+逆水速度)÷2 水速:(顺水速度-逆水速度)÷2 解题关键 船在江河里航行时,除了本身的前进速度外,还受到流水的推送或顶逆,在这种情况下计算船只的航行速度、时间和所行的路程,叫做流水行船问题。 流水行船问题,是行程问题中的一种,因此行程问题中三个量(速度、时间、路程)的关系在这里将要反复用到.此外,流水行船问题还有以下两个基本公式: 顺水速度=船速+水速,(1)
逆水速度=船速-水速.(2) 这里,船速是指船本身的速度,也就是在静水中单位时间里所走过的路程.水速,是指水在单位时间里流过的路程.顺水速度和逆水速度分别指顺流航行时和逆流航行时船在单位时间里所行的路程。 根据加减法互为逆运算的关系,由公式(l)可以得到: 水速=顺水速度-船速, 船速=顺水速度-水速。 由公式(2)可以得到: 水速=船速-逆水速度, 船速=逆水速度+水速。 这就是说,只要知道了船在静水中的速度,船的实际速度和水速这三个量中的任意两个,就可以求出第三个量。 另外,已知船的逆水速度和顺水速度,根据公式(1)和公式(2),相加和相减就可以得到: 船速=(顺水速度+逆水速度)÷2, 水速=(顺水速度-逆水速度)÷2。 例:设后面一人速度为x,前面得为y,开始距离为s,经时间t后相差a米。那么 (x-y)t=s-a 解得t=s-a/x-y. 追及路程除以速度差(快速-慢速)=追及时间 v1t+s=v2t (v1+v2)t=s t=s/(v1+v2) (一)相遇问题 两个运动物体作相向运动或在环形跑道上作背向运动,随着时间的发展,必然面对面地相遇,这类问题叫做相遇问题。它的特点是两个运动物体共同走完整个路程。 小学数学教材中的行程问题,一般是指相遇问题。 相遇问题根据数量关系可分成三种类型:求路程,求相遇时间,求速度。 它们的基本关系式如下: 总路程=(甲速+乙速)×相遇时间 相遇时间=总路程÷(甲速+乙速) 另一个速度=甲乙速度和-已知的一个速度 (二)追及问题 追及问题的地点可以相同(如环形跑道上的追及问题),也可以不同,但方向一般是相同的。由于速度不同,就发生快的追及慢的问题。 根据速度差、距离差和追及时间三者之间的关系,罕用下面的公式: 距离差=速度差×追及时间 追及时间=距离差÷速度差 速度差=距离差÷追及时间