§8 向量,矩阵范数,矩阵的条件数
一 、 向量、矩阵范数
为了讨论线性方程组近似解的误差估计与研究解方程组迭代法的收敛性,需要在)(n
n n
R
R ?或中引进向量序列(或矩阵序列)极限概念。为此,
这就需要对量空间n R (或n n R ?矩阵空间)元素的“大小”引进某种度量即向量范数(或矩阵范数)即距离的概念。
(一)向量范数:向量范数是3R 中向量长度概念的推广。
},{1为复数i n n
x x x x x C ??????????== 称为n 维复向量空间。
},)({为复数ij n n ij n n a a A A C ??==称为n n ?复矩阵空间。
(2)设n
n n
C
A C x ?∈∈,,称T n H x x x x =≡),,(1 为x 的共轭转置
,
T H A A =称为A 共轭转置矩阵。
在许多应用中,对向量的范数(对向量的“大小”的度量)都要求满足
正定条件,齐次条件和三角不等式,下面给出向量范数的抽象定义。 n R x ∈(或n C x ∈)的某个实值非负函数
x x N ≡)(,如果满足下述条件
(1)正定性 00,0=??=≥x x x (2)齐次性 x ax α=其中R ∈α(或C ∈α)
(3)三角不等式 )(,,n
n
C R y x y x y x ∈∈?+≤+或,称x x N ≡)(是n
R 上(或n C )一个向量范数(或为模)。
由三角不等式可推出不等式 (4)y x y x -≤- 下面给出矩阵计算中一些常用向量范数。
设)(),,(1n n T n C x R x x x ∈∈=或 (1)向量的“∞”范数 i n i x x x N ≤≤∞
∞=≡1max )(
(2)向量的“1”范数 ∑==≡n
i i x x
x N 1
1
1)(
(3)向量的“2”范数 2/11
2
2
/12
2)()
,()(∑===≡n
i i x x x x x N
(4)向量的能量范数 设n
n R
A ?∈为对称正定阵
2
/1),()(x Ax x
x N R x A
A n =≡→∈?
称为向量的能量范数。
设n R x ∈(或n C x ∈),则)(),(),(12x N x N x N ∞是n R 上(或n C )的向量范数。
证明 只验证三角不等式:对任意n
R y x ∈,,则222
y x y
x +≤+
利用哥西不等式:22
),(y x
y x ≤,则有
),(22
y x y x y
x ++=+),(),(2),(y y y x x x ++= 22
2
2
22
2y
y
x
x
++≤222))(y x +=
对任何n
R y x ∈,则 (1) ∞∞
≤≤x n x
x 2
(2) 212
x n x x ≤≤
(3) ∞∞
≤≤x n x x
1
证 只证(1)。记j i n
i n x x x x x x ==??
?
?
??????=≤≤∞
11max ,
于是有(a)∑=∞
=≤=n
i i
j
x x x x
1
2
22
2
2
(b) ∑∑=∞
===≤=n
i j
j
n
i i
x
n x n x x x
1
22
2
1
2
22
(二)向量序列的极限
}{)
(k x
及向量*x 且记
T
n T k n k k x x x x x x ),,(,),,(1)()(1)(***==
如果2n 个数列收敛,即 ),,1(lim )
(n i x x i k i
k ==*∞
→
则称}{)
(k x
收敛于*x ,记*∞
→=x x k k )(
lim ,
或说向量序列的收敛是)(k x 分量收敛到*x 对应分量。 ),,2,1(102102)
(n k x
k k k =???? ??-+=--
显然,有???? ??=
∞
→22lim )
(k k x 设n
R y x ∈,,称非负实数y x y x d -≡),(为y x ,之间距离,其中?为
向量的任何一种意义下范数。
设}{)
(k x
为n R 中一向量序列,且n R x ∈,则
??=∞
→ x x k k )(lim 是0)(→-v
k x
x (当∞→k )
其中v ?为向量的任一范数。
证明 只对2,=∞=v v 证明。显然有
),,1(0lim lim )()(n i x x x x i k i k k k ==-??=∞
→∞
→
)(0lim )(1∞→→-??≤≤k x x i k i n
i 当
)(0)(∞→→-??∞
k x
x k 当
又由范数的等价性定理有:
∞
∞
-≤-≤-x x n x x x
x k k k )(2
)()(
于是 )(0)(02
)()
(∞→→-??∞→→-∞
k x
x k x
x
k k 当
(三)矩阵的范数
一个n n ?矩阵A 可看作2
n 维向量空间中一个向量,于是由nn R 上向量“2”范数,可以引进n n R
?中矩阵的一种范数。
∑==≡N
j i ij F
a A
A F 1
,2
/12)()(称为A 的 Frobenius 范数。
n
n R
A ?∈的某个非负实值函数
A A N ≡)(,如果满足下述条件:
(1)正定性:00,0=??=≥A A A 是且 (2)齐次性:R A A ∈=ααα, (3)三角不等式:B A B A +≤+ 则称)(A N 是n
n R
?上的一个矩阵范数(或模)。
由于在许多应用问题中,矩阵和向量是相联系的,现引进一种矩阵的算子范数。它是由向量范数诱导出来的并且这种矩阵范数和向量范数是相容的,即n
n n
R
A R x ?∈∈?,
n
n n
R A R x ?∈∈,且设有一种向量范数v
x
相应的定义一个矩阵的非负函数
v
v
R x x v x
Ax A A N n
∈≠=≡0max
)((最大比值),称)(A N 为矩阵A 的算子范数。
设v x 是n R 上的向量范数,则v A A N ≡)(是n n R ?上一个范数且满足相容条件: (1) v v v
x A Ax ≤
(2) ),(n n v v v
R B A B A AB
?∈?≤
证明 由v A A N ≡)(定义,可知有
v v
v
A x
Ax ≤ 或),(,n n n v v v R x R A x A Ax ∈∈?≤?
下面验证三角不等式:v v v
B A B A +≤+
由定义 v
v
x R
x v
x
x
B A B A n
)(max 0
+=+≠∈
由于
v v v
Bx Ax x
B A +≤+)(v v
v v
x B
x A
+≤v v v x B A )(+=
或
)0(,)(≠∈?+≤+x R x B A x
x
B A n v v v
v
且
故v v v
B A B
A +≤+
n
n n
R
A R x ?∈∈,,则
称为A 的行范数)
称为A 的列范数)
称为A 的“2”范数)
其中)(max A A T
λ为A A T
最大特征值。 证明 证(1):记`
1),,(T n x x x =,t x x
i n
i ==≤≤∞
1max
∑∑==≤≤≤≤==n j n
j j i ij n
i n i a a 1
011)1(max 0
其中μ
于是j n
j ij n
i n
j j ij n
i x a x a Ax
∑∑=≤≤=≤≤∞
≤=1
11
1max max
∑==≤n
j ij
i
t a
t 1
max
μ
说明,对任何向量0≠x ,则有
μ≤∞
∞x
Ax (a) 如果能找到一向量0x 且10
=∞
x 使
μ≤∞
∞0
0x Ax 那末,定理得证。
下面来寻求0x 使比值等于μ,记T
n x x x x ),,,(210 =且使10
=∞
x
于是,T n
j n j n
j j nj j j i j j
x a x a x a
Ax ),,,,(
1
1
1
100∑∑∑====
且由(a)式有 μ≤∞
Ax
由此,应选取0x 为:?????<-≥=0
,10
,100j i j i j a a x 当当
则10
=∞
x 及∑∑====n j n
j j i j j i a x a 1
1
00μ或μ=∞
Ax
故μ=∞
∞≠x
Ax x 0
max
证(3):由于A A T 为对称半正定矩阵,则A A T 特征值为非负,即记A A T 特征值为),,1,1(n i i =λ,则有021≥≥≥≥n λλλ 且有n
i i u 1}{=满足),,2,1(,n i u Au A i i i T
==λ,ij j i u u δ=),(
考查比值:n
R x ∈?且0≠x ,于是∑==
n
i i
i u
a x 1
)
,()
,(),(),(22
22
x x x Ax A x x Ax Ax x
Ax T
=
=
∑∑∑====n
i i
n
i n
i i i i i i u u 1
21
1
)
,(α
αλα11
21
2λα
λα
≤=
∑∑==n i i
n
i i
i
说明,对任何非零向量n
R x ∈,则有
12
2
λ≤x
Ax
另一方面,取1u x =则有11111122
1
22
1)
,()
,(λλ==
u u u u u Au
故)(max 2
A A A
T λ=
n
n R A ?∈,则
(1)
∞∞≤≤A n A A n
21;(2)
∞∞≤≤A n A A n
11
n n R A ?∈的特征值为),,1(n i i =λ,称
i n
i A λρ≤≤≡1max )(为A 的谱半径。
(1)设n n R A ?∈,则A A ≤)(ρ,其中A 为满足矩阵,向量相容性条件的矩阵范数。
(2)设n n R A ?∈为对称矩阵,则)(2
A A
ρ=。
证明 只证(1)。
设λ为A 的任一特征值,于是,存在0≠x 使x Ax λ= 且Ax x x ==λλ x A ≤ 即 A A x ≤≤)(ρλ或
?为矩阵的算子范数,且1
B I -≤
±-11
)
(1
证明 1)反证法。
设B I -为奇异阵,则0)(=-x B I 有非零解记为0x ,即00x Bx = 于是,
10
0=x Bx 由此,有1≥B ,这与假设矛盾。
2)由I B I B I =---1
))((
即得 11
)()(---+=-B I B I B I
从而11
)()
(---+≤-B I B I B I B
B I -≤
-∴-11
)(1
二 、 矩阵的条件数、病态方程组
直接法的误差原因:1.算法及舍入原因
2.方程组本身固有的问题
要分析方程组的状态并估计算法的误差(原始数据扰动对解的影响)——量度:矩阵的条件数
a=[1 1;1 1.0001];b=[2,2]';a\b
对右端项作微小变化(小扰动):
??????=????????????0001.220001.111121x x 其中??
?
???=0001.00b δ
a=[1 1;1 1.0001];b=[2,2.0001]';a\b 显然有,????
??-=??
?
???=+11,11x x x δδ0186.01012
13
001
.020152=??
≤∞
*∞x
x δ
【说明】右端常数项的相对误差
4105.02
0001
.0-∞
∞?==
b
b
δ 而引起解的相对误差
5.02
1
==
∞
*
∞x x
δ 常数项的微小误差引起解的相对误差较大,扩大了4
10
-倍,也就是说,此方程
组解对方程组的数据A,b 非常敏感,这样的方程组就是病态方程组.
设线性方程组为
Ax=b (1)
其中A ∈R n ×n ,x,b ∈R n 且A 非奇异。x *
:准确解,δx :解的误差,即 *
-=x x x δ (2)
δA--A 的误差,δb--b 的误差。讨论δx 与δA ,δb 的关系
(一) b 有误差而A 无误差情形
将带有误差的右端项和带误差的解向量代入方程组,则
b b x x A δδ+=+*)( (3)
由于b Ax ≡*,而得到 b A x δδ1
-=, 从而b A
x δδ1
-≤
另一方面,由(1)式取范数,有)0(,1≠≤?≤b b
A x x A b 或 可得
A 是非奇异矩阵,Ax=b ≠0,且A (x *
+δx )=b+δb 则有误差估计式
b
b
A cond x
x
δδ)
(≤ (4)
其中A A A cond 1
)(-=称为
方阵A 的条件数。
说明:1、解的相对误差是右端项b 的相对误差的cond(A)倍
“病态”矩阵
;称病态矩阵对应的方程组为病态方程组。反之,则称A 为良态矩阵。
(二) A 及b 都有误差的情形
设在方程组Ax=b 中,A 及b 都有误差,且11
-A A
δ,则有
???
???????+-≤
b b A A A
A A cond A cond x x
δδδδ)(1)
(*
证:带有误差的方程组为
b b x x A A δδδ+=++*))(( (5)
由于b Ax ≡*
,因而
b *x A A δδδδ=++ Ax )( …………………(6) 为从(6)式中解出δx ,必须限定(A+δA )-1
存在。从而
)()(*
1x b A A x δδδδ-+=- …………………(7) 利用)(1
A A E A A A δδ-+=+,得到
1111)()(----+=+A A A E A A δδ (8)
又由定理26知,当11
≤?-A A
δ时
A
A
A A E δδ?-≤
+---1
1111)( (9)
对(7)式取范数,并由(8)、(9)式得到
{}
*1
1
1x A b A
A
A x δδδδ+??-≤
-- (10)
从而由b A x
?≤-1*
及(10)式,有
???
???????+-≤b b A A A
A A cond A cond x x
δδδδ)(1)
(*
(11)
【注】仅A 或b 有误差是(11)式中δb=0或δA=0的特例。
(三) 常用的条件数及其性质
∞∞
-∞=A A A cond 1)( 111
1)(A A A cond -=
)
()
()(min max 22
1
2A A A A A A
A cond T T λλ==-
1.当A=A T
时,)
()
()(min max 2A A A A A cond T T λλ=;
2.当A 对称正定时,)
()
()(min max 2A A A A A cond T
T λλ=
3.对非奇异矩阵A,cond(A)≥1,
cond(A)=cond(A -1
),cond(cA)=cond(A)(c ≠0,c ∈R)
4.若U 为正交矩阵,即U T
U=I ,则 cond(U)2=1 对非奇异矩阵A,cond(A)2=cond(UA)2=cond(AU)2
(四) 病态方程组
Ax=b ,A ∈R n ×n
,且A 非奇异
当cond(A)>>1,则Ax=b 是病态方程组(坏条件的,A 是病态的)
当cond(A)相对较小时,则Ax=b 是良态方程组(好条件的,A 是良态的)
【例】在引例方程组中,b 有扰动b δ=(0,0.0001)T
,试计算 cond(A)∞,并说明b δ对解向量x 的影响。 a=[1 1;1 1.0001];b=[2;2]; norm_b=norm(b,inf);
detb=[0;0.0001];norm_detb=norm(detb,inf); err_b=norm_detb/norm_b cond_a=cond(a,inf) err_x=err_b*cond_a
%20020001
.20001
.0100004.4)
(4=≈?
?≈≤∞
∞∞∞
∞b
b
A cond x
x
δδ
【例】希尔伯特矩阵的条件数:
cond(hilb(2)),cond(hilb(3)),cond(hilb(5)),cond(hilb(8))
a=hilb(3),b=ones(3,1);a\b
a =[1.0000 0.5000 0.3333; 0.5000 0.3333 0.2500;
0.3333 0.2500 0.2000+0.000001];b=ones(3,1);a\b 【注】(1)由矩阵条件数性质可知,正交矩阵的线性方程组b Ax =是好条件的;
(2)条件数性质4指出,正交变换保持条件数)(A Cond 不变,这说明在很多方法中使用正交矩阵约化矩阵的合理性。
设有方程组b Ax =,其中n n R A ?∈为非奇异,x 为精确解,又设x 为计算解。一般,计算剩余向量x A b r -=,用r 大小来检验计算解的精度,是否很小,x 就是b Ax =一个较好的近似解呢?
事后误差估计)
(1)设A 为非奇异矩阵,x 是精确解,即0≠=b Ax 。
(2)设x 是方程组一个近似解,x A b r -=,则近似解x 的相对误差有估计式
b
r A Cond x
x x )
(≤-
证明 由r A x A b A x b A x x 1
1
1)(---=-=-=- 所以 r A
x x 1
-≤- (12)
另一方面,由b Ax =,有
x A b ≤ 即
b A x ≤1 ……………(13) 由(12)及(13)式,则
b
r A A x
x x
1-≤-
说明 近似解x 精度(误差界)不仅依赖于剩余r “大小”,而且依赖于A
的条件数,当A 是病态时,即使有很小的剩余,也不能保证x 是高精度的近似解。
三、 关于病态方程组的解法b Ax =,n n R A ?∈非奇异矩
阵
(一) 判断b Ax =是病态方程组
(1) 当A 的行列式相对来说很小,或A 某些行(或列)近似线性相关,方程组b Ax =可能病态.
(2) 如果用选主元消去法求解b Ax =,在A 约化中出现小主元,方程组b Ax =可能病态.
(3) 当系数矩阵A 元素数量级相差很大,并且无一定规则时,方程组b Ax =可能病态.
(4) 估计条件数.由于∞∞
-∞=A A
A Cond 1
)(,所以发现b Ax =病态的
可靠方法是计算A 的条件数,若直接计算1-A 再计算∞
-1
A
,那末求1-A 大
约需要2
3
2n n +次乘法运算,为求解(用直接法) b Ax =计算量的3倍,代价太高.
一个矩阵条件数的估计方法:由于
∞
∞≠∞
∞
-≠∞
-==y
w y
y A A
y y 0
10
1
max
max
(令w y A =-1
,由解y Aw =求
w )
因此∞∞∞
-≥y w A
/1
选择向量n
R y ∈且求解y Aw =使产生大的解w .于是
∞∞
-∞=A A A Cond 1
)(∞∞∞≈y w A /
【注】方法成功的关键在于怎样使比值∞∞
y w
/接近它的极大值∞
-1
A
(二) 病态方程组的解法
对于病态方程组b Ax =,当我们用一般方法求解时,仅由舍入而产生的误差也会使我们算不出比较满意的解,此时可采用下述方法求解.
1 采用高精度的算术运算
例如,采用双倍字长进行运算,或用双字长求内积等,以此改善和减轻矩阵病态的影响,其缺点是计算时间将大为增加.
2 采用预处理方法
求解??=b Ax 求解:寻求非异矩阵P,Q 使
Pb x Q PAQ =-)(1
或b Ax =其中Pb b x Q x PAQ A ===-,,1
且改善A 的条件数,
)()(A Cond PAQ Cond <
于是,可用数值稳定方法求解b Ax =,再求x Q x =,当A 为对称正定阵时,一般选择P,Q 为对角阵或三角矩阵.
3 平衡方法
当系数矩阵A 元素数量级差别很大,威尔金森提出采用行均衡方法,这时矩阵A 条件数可能得到改善.
行(或列)均衡: 就是解方程组b Ax =之前首先将A 的行(或列)大体均衡一下,即对b Ax =每一行(或每一列)乘以适当的数,使所有行(列)按照某种范数大体上有相同的长度.
设b Ax =,其中n
n R A ?∈为非奇异阵.计算
令)/1,,/1,/1(211
n S S S diag D
=-
于是求解??=b Ax 求解b D Ax D 1
1
--=或b x A =.
这时A D A 1
-=条件数可能得到改善,再用列主元消去法或部分选主元三角分解法求解b x A =.
例 设有方程组
???
? ??=???? ?????? ??210111014214x x 或b Ax =,计算∞)(A Cond . 解 计算∞∞
-∞=A A
A Cond 1
)(
???
?
??---=???? ??=-111011101,111014414A A
于是44
2
4101
10)110()(≈-+=∞A Cond 行平衡:
对A 每一行计算1,10,m ax 241===S S a S ij j
i .
即???
?
?
?=--10
0104
1D ,求解b D Ax D 11--=.记b x A =
或???
? ??=???? ?????? ??-2111110214x x 且??????---=---441
101111011A 所以 410
14
)(4
≈-=
-∞A Cond ,说明 b x A =为良态方程组. 用列主元消去法求解b x A =(且3位浮点数进行计算)可得计算解
1,121==x x (是较好的近似解).
4 迭代改善法
设b Ax =,其中n n R A ?∈为非奇异矩阵且为病态.如果
u A Cond /1)(≈∞其中ββ,2
11t
u -=
为机器基数,t 计算机字长,就说A 对于机器的精度来说是病态的,现假设u A Cond /1)(≈∞.
首先用选主元三角分解法实现分解 LU PA ≈
其中P 为置换阵,L 为单位下三角阵,U 为上三角阵且得到计算解1x ,将按下述方法改善近似解1x 的精度.
(1) 计算剩余向量 11Ax b r -= ...............(14) (2) 求解 1r Ad =记解为1d ...............(15) (3) 改善 112d x x += (16)
如果(14),(15),(16)计算没有误差,则2x 就是b Ax =的精确解. 可验证,即b r Ax Ad Ax d x A Ax =+=+=+=1111112)(
但是,在实际计算中,由于有舍入误差,2x 只是近似解,重复(14)~(16)过程,就得到一近似解序列}{k x .
第五专题 矩阵的数值特征 (行列式、迹、秩、相对特征根、范数、条件数) 一、行列式 已知A p ×q , B q ×p , 则|I p +AB|=|I q +BA| 证明一:参照课本194页,例4.3. 证明二:利用AB 和BA 有相同的非零特征值的性质; 从而I p +AB ,I q +BA 中不等于1的特征值的数目 相同,大小相同;其余特征值都等于1。 行列式是特征值的乘积,因此|I p +AB|和|I q +BA|等于特征值(不等于1)的乘积,所以二者相等。 二、矩阵的迹 矩阵的迹相对其它数值特征简单些,然而,它在许多领域,如数值计算,逼近论,以及统计估计等都有相当多的应用,许多量的计算都会归结为矩阵的迹的运算。下面讨论有关迹的一些性质和不等式。 定义:n n ii i i 1 i 1 tr(A)a ====λ∑∑,etrA=exp(trA)
性质: 1. tr(A B)tr(A)tr(B)λ+μ=λ+μ,线性性质; 2. T tr(A )tr(A)=; 3. tr(AB)tr(BA)=; 4. 1 tr(P AP)tr(A)-=; 5. H H tr(x Ax)tr(Axx ),x =为向量; 6. n n k k i i i 1 i 1 tr(A),tr(A )===λ=λ∑∑; 从Schur 定理(或Jordan 标准形)和(4)证明; 7. A 0≥,则tr(A)0≥,且等号成立的充要条件是A=0; 8. A B(A B 0)≥-≥即,则tr(A)tr(B)≥,且等号成立的充要条件是A=B (i i A B (A)(B)≥?λ≥λ); 9. 对于n 阶方阵A ,若存在正整数k,使得A k =0,则tr(A)=0(从Schur 定理或Jordan 标准形证明)。 若干基本不等式 对于两个m ×n 复矩阵A 和B ,tr(A H B)是m ×n 维酉空间上的内积,也就是将它们按列依次排成的两个mn 维列向量的内积,利用Cauchy-schwarz 不等式 [x,y]2≤[x,x]﹒[y,y]
§8 向量,矩阵范数,矩阵的条件数 一 、 向量、矩阵范数 为了讨论线性方程组近似解的误差估计与研究解方程组迭代法的收敛性,需要在)(n n n R R ?或中引进向量序列(或矩阵序列)极限概念。为此, 这就需要对量空间n R (或n n R ?矩阵空间)元素的“大小”引进某种度量即向量范数(或矩阵范数)即距离的概念。 (一)向量范数:向量范数是3R 中向量长度概念的推广。 },{1为复数i n n x x x x x C ??????????== 称为n 维复向量空间。 },)({为复数ij n n ij n n a a A A C ??==称为n n ?复矩阵空间。 (2)设n n n C A C x ?∈∈,,称T n H x x x x =≡),,(1 为x 的共轭转置 , T H A A =称为A 共轭转置矩阵。 在许多应用中,对向量的范数(对向量的“大小”的度量)都要求满足 正定条件,齐次条件和三角不等式,下面给出向量范数的抽象定义。 n R x ∈(或n C x ∈)的某个实值非负函数 x x N ≡)(,如果满足下述条件 (1)正定性 00,0=??=≥x x x (2)齐次性 x ax α=其中R ∈α(或C ∈α) (3)三角不等式 )(,,n n C R y x y x y x ∈∈?+≤+或,称x x N ≡)(是n R 上(或n C )一个向量范数(或为模)。
由三角不等式可推出不等式 (4)y x y x -≤- 下面给出矩阵计算中一些常用向量范数。 设)(),,(1n n T n C x R x x x ∈∈=或 (1)向量的“∞”范数 i n i x x x N ≤≤∞ ∞=≡1max )( (2)向量的“1”范数 ∑==≡n i i x x x N 1 1 1)( (3)向量的“2”范数 2/11 2 2 /12 2)() ,()(∑===≡n i i x x x x x N (4)向量的能量范数 设n n R A ?∈为对称正定阵 2 /1),()(x Ax x x N R x A A n =≡→∈? 称为向量的能量范数。 设n R x ∈(或n C x ∈),则)(),(),(12x N x N x N ∞是n R 上(或n C )的向量范数。 证明 只验证三角不等式:对任意n R y x ∈,,则222 y x y x +≤+ 利用哥西不等式:22 ),(y x y x ≤,则有 ),(22 y x y x y x ++=+),(),(2),(y y y x x x ++= 22 2 2 22 2y y x x ++≤222))(y x += 对任何n R y x ∈,则 (1) ∞∞ ≤≤x n x x 2 (2) 212 x n x x ≤≤ (3) ∞∞ ≤≤x n x x 1
第五专题 矩阵的数值特征 (行列式、迹、秩、相对特征根、范数、条件数) 一、行列式 已知A p ×q , B q ×p , 则|I p +AB|=|I q +BA| 证明一:参照课本194页,例4.3. 证明二:利用AB 和BA 有相同的非零特征值的性质; 从而I p +AB ,I q +BA 中不等于1的特征值的数目 相同,大小相同;其余特征值都等于1。 行列式是特征值的乘积,因此|I p +AB|和|I q +BA|等于特征值(不等于1)的乘积,所以二者相等。 二、矩阵的迹 矩阵的迹相对其它数值特征简单些,然而,它在许多领域,如数值计算,逼近论,以及统计估计等都有相当多的应用,许多量的计算都会归结为矩阵的迹的运算。下面讨论有关迹的一些性质和不等式。 定义:n n ii i i 1i 1tr(A)a ====λ∑∑,etrA=exp(trA) 性质: 1. tr(A B)tr(A)tr(B)λ+μ=λ+μ,线性性质; 2. T tr(A )tr(A)=; 3. tr(AB)tr(BA)=; 4. 1tr(P AP)tr(A)-=;
5. H H tr(x Ax)tr(Axx ),x =为向量; 6. n n k k i i i 1i 1tr(A),tr(A )===λ=λ∑∑; 从Schur 定理(或Jordan 标准形)和(4)证明; 7. A 0≥,则tr(A)0≥,且等号成立的充要条件是A=0; 8. A B(A B 0)≥-≥即,则tr(A)tr(B)≥,且等号成立的充要条件是A=B (i i A B (A)(B)≥?λ≥λ); 9. 对于n 阶方阵A ,若存在正整数k,使得A k =0,则tr(A)=0(从Schur 定理或Jordan 标准形证明)。 若干基本不等式 对于两个m ×n 复矩阵A 和B ,tr(A H B)是m ×n 维酉空间上的内积,也就是将它们按列依次排成的两个mn 维列向量的内积,利用Cauchy-schwarz 不等式 [x,y]2≤[x,x]﹒[y,y] 得 定理:对任意两个m ×n 复矩阵A 和B |tr(A H B)|2≤tr(A H A)﹒tr(B H B) 这里等号成立的充要条件是A=cB,c 为一常数。特别当A 和B 为实对称阵或Hermit 矩阵时 0≤|t r(AB)|≤ 定理:设A 和B 为两个n 阶Hermite 阵,且A≥0,
3.4 向量和矩阵范数 3.4.1 内积与向量范数 为了研究方程组Ax=b解的误差和迭代法收敛性,需对向量及矩阵的"大小"引进一 种度量,就要定义范数,它是向量"长度"概念的直接推广,通常用表示n维实向量空间,表示n维复向量空间. 定义4.1设(或),,,实数或 复数,称为向量x与y的数量积也称内积. 非负实数,称为向量x的欧氏范数或2-范数. 定理4.1设设(或)则内积有以下性质: (1) ,当且仅当x=0时等号成立; (2) ,或; (3) ,或; (4) ; (5) (3.4.1) 称为Cauch-Schwarz不等式. (6) ,称为三角不等式. 定义4.2向量的某个实值函数N(x),记作,若满足下列条件: (1) ‖x‖≥0,当且仅当x=0时等号成立(正定性); (2) (齐次性); (3) (三角不等式); 则称是上的一个向量范数.
对于,由内积性质可知它满足定义4.2的三个条件,故它是一种向量范数.此外还有以下几种常用的向量范数. (称为∞-范数) (称为1-范数) 容易验证及均满足定义4.2的三个条件.更一般的还可定义 但只有p=1,2,∞时的三种范数是常用的向量范数. 例如给定,则可求出 定理4.2设是上任一种向量范数,则N(x)是向量x的分量的连续函数. 定理4.3设与是上任意两种向量范数,则存在常数,使 (3.4.2) 不等式称为向量范数等价性. 以上两定理证明可见[2],[3]. 讲解: 在向量得内积(x,y)的性质中,定理4.1的(5)为Cauch-Schwarz不等式(3.4.1)是经常使用的,下面给出证明,显然当x=0或y=0时(3.4.1)成立,现设,考察 若取 则上式为 于是
《周国标师生交流讲席010》 向量和矩阵的范数的若干难点导引(二) 一. 矩阵范数的定义 引入矩阵范数的原因与向量范数的理由是相似的,在许多场合需要“测量”矩阵的“大小”,比如矩阵序列的收敛,解线性方程组时的误差分析等,具体的情况在这里不再复述。 最容易想到的矩阵范数,是把矩阵m n A C ?∈可以视为一个mn 维的向量(采用所谓“拉 直”的变换),所以,直观上可用mn C 上的向量范数来作为m n A C ?∈的矩阵范数。比如 在1l -范数意义下,111 ||||||m n ij i j A a === ∑∑( ) 12 tr()H A A =; () 在2l -范数意义下,1 2 211||||||m n F ij i j A a ==??= ??? ∑∑, () 注意这里为了避免与以后的记号混淆,下标用“F ”,这样一个矩阵范数,称为Frobenius 范数,或F-范数。可以验证它们都满足向量范数的3个条件。 那么是否矩阵范数就这样解决了因为数学上的任一定义都要与其对象的运算联系起来,矩阵之间有乘法运算,它在定义范数时应予以体现,也即估计AB 的“大小”相对于A B 与的“大小”关系。 定义1 设m n A C ?∈,对每一个A ,如果对应着一个实函数()N A ,记为||||A ,它满足以下条件: (1)非负性:||||0A ≥; (1a )正定性:||||0m n A O A ?=?= (2)齐次性:||||||||||,A A C ααα=∈; (3)三角不等式:||A ||||||||||||,m n A B A B B C ?+≤+?∈ 则称()||||N A A =为A 的广义矩阵范数。进一步,若对,,m n n l m l C C C ???上的同类广义矩阵 范数||||?,有 (4)(矩阵相乘的)相容性:||A ||||||||||||AB A B ≤, n l B C ?∈, 则称()||||N A A =为A 的矩阵范数。 我们现在来验证前面()和()定义的矩阵范数是否合法我们这里只考虑(),把较容易的()的验证留给同学们, 三角不等式的验证。按列分块,记1212(,,,),(,,,)n n A a a a B b b b ==。 2 22112||)(,),(),(||||||F n n F b a b a b a B A +++=+ 2 222222211||||||||||||n n b a b a b a ++++++= ()()2 2 121222||||||||||||||||n n a b a b ≤++ ++ ()()()2 2 2 2 122121222122||||||||2||||||||||||||||||||||||n n n n a a a b a b b b =+ +++ +++ + 对上式中第2个括号内的诸项,应用Cauchy 不等式,则有 222||||||||2||||||||||||F F F F F A B A A B B +≤++2 (||||||||)F F A B =+ () 于是,两边开方,即得三角不等式。 再验证矩阵乘法相容性。
第五专题矩阵的数值特征 (行列式、迹、秩、相对特征根、范数、条件数) 一、行列式 已知A p×q, B q×p, 则|I p+AB|=|I q+BA| 证明一:参照课本194页,例4.3. 证明二:利用AB和BA有相同的非零特征值的性质; 从而I p+AB,I q+BA中不等于1的特征值的数目相同,大小相同;其余特征值都等于1。 行列式是特征值的乘积,因此|I p+AB|和|I q+BA|等于特征值(不等于1)的乘积,所以二者相等。 二、矩阵的迹 矩阵的迹相对其它数值特征简单些,然而,它在许多领域,如数值计算,逼近论,以及统计估计等都有相当多的应用,许多量的计算都会归结为矩阵的迹的运算。下面讨论有关迹的一些性质和不等式。 定义: n n ii i i1i1 tr(A)a == ==λ ∑∑,etrA=exp(trA) 性质: 1. tr(A B)tr(A)tr(B) λ+μ=λ+μ,线性性质;
2. T tr(A )tr(A)=; 3. tr(AB)tr(BA)=; 4. 1 tr(P AP)tr(A)-=; 5. H H tr(x Ax)tr(Axx ),x =为向量; 6. n n k k i i i 1 i 1 tr(A),tr(A )===λ=λ∑∑; 从Schur 定理(或Jordan 标准形)和(4)证明; 7. A 0≥,则tr(A)0≥,且等号成立的充要条件是A=0; 8. A B(A B 0)≥-≥即,则tr(A)tr(B)≥,且等号成立的充要条件是A=B (i i A B (A)(B)≥?λ≥λ); 9. 对于n 阶方阵A ,若存在正整数k,使得A k =0,则tr(A)=0(从Schur 定理或Jordan 标准形证明)。 若干基本不等式 对于两个m ×n 复矩阵A 和B ,tr(A H B)是m ×n 维酉空间上的内积,也就是将它们按列依次排成的两个mn 维列向量的内积,利用Cauchy-schwarz 不等式 [x,y]2≤[x,x]﹒[y,y] 得 定理:对任意两个m ×n 复矩阵A 和B |tr(A H B)|2≤tr(A H A)﹒tr(B H B)
矩阵范数的意义 几何方法是一种数学思维方法。函数和几何是数学的两条主要主线。我们学习各种函数及其性质,比如微积分、复变函数、实变函数、泛函等。而几何是函数形象表达,函数是几何的抽象描述,几何研究“形”,函数研究“数”,它们交织在一起推动数学向更深更抽象的方向发展。 函数图象联系了函数和几何,表达两个数之间的变化关系,映射推广了函数的概念,使得自变量不再仅仅局限于一个数,也不再局限于一维,任何事物都可以拿来作映射,维数可以是任意维,传统的函数图象已无法直观地表达高维对象之间的映射关系,这就要求我们在观念中,把三维的几何空间推广到抽象的n维空间。 由于映射的对象可以是任何事物,为了便于研究映射的性质以及数学表达,我们首先需要对映射的对象进行“量化”,取定一组“基”,确定事物在这组基下的坐标,事物同构于我们所熟悉的抽象几何空间中的点,事物的映射可以理解为从一个空间中的点到另一个空间的点的映射,而映射本身也是事物,自然也可以抽象为映射空间中的一个点,这就是泛函中需要研究的对象——函数。 从一个线性空间到另一个线性空间的线性映射,可以用一个矩阵来表达,矩阵被看线性作映射,线性映射的性质可以通过研究矩阵的性质来获得,比如矩阵的秩反映了线性映射值域空间的维数,可逆矩阵反映了线性映射的可逆,而矩阵范数反映了线性映射把一个向量映射为另一个向量,向量的“长度”缩放的比例。 并不是只有线性空间才有范数的定义,任意空间都可以引入范数,这样的空间称为赋范空间,使得这个空间可以被度量,如希尔伯特空间。 范数是把一个事物映射到非负实数,且满足非负性、齐次性、三角不等式,符合以上定义的都可以称之为范数,所以,范数的具体形式有很多种(由内积定义可以导出范数,范数还也可以有其他定义,或其他方式导出),要理解矩阵的算子范数,首先要理解向量范数的内涵。矩阵的算子范数,是由向量范数导出的,由形式可以知: 或方阵
《周国标师生交流讲席010》 向量和矩阵的范数的若干难点导引(二) 一. 矩阵范数的定义 引入矩阵范数的原因与向量范数的理由是相似的,在许多场合需要“测量”矩阵的“大小”,比如矩阵序列的收敛,解线性方程组时的误差分析等,具体的情况在这里不再复述。 最容易想到的矩阵范数,是把矩阵m n A C ?∈可以视为一个mn 维的向量(采用所谓“拉 直”的变换),所以,直观上可用mn C 上的向量范数来作为m n A C ?∈的矩阵范数。比如 在1l -范数意义下,111 ||||||m n ij i j A a === ∑∑( ) 12 tr()H A A =; (1.1) 在2l -范数意义下,1 2 211||||||m n F ij i j A a ==??= ??? ∑∑, (1.2) 注意这里为了避免与以后的记号混淆,下标用“F ”,这样一个矩阵范数,称为Frobenius 范数,或F-范数。可以验证它们都满足向量范数的3个条件。 那么是否矩阵范数就这样解决了?因为数学上的任一定义都要与其对象的运算联系起来,矩阵之间有乘法运算,它在定义范数时应予以体现,也即估计AB 的“大小”相对于A B 与的“大小”关系。 定义1 设m n A C ?∈,对每一个A ,如果对应着一个实函数()N A ,记为||||A ,它满 足以下条件: (1)非负性:||||0A ≥; (1a )正定性:||||0m n A O A ?=?= (2)齐次性:||||||||||,A A C ααα=∈; (3)三角不等式:||A ||||||||||||,m n A B A B B C ?+≤+?∈ 则称()||||N A A =为A 的广义矩阵范数。进一步,若对,,m n n l m l C C C ???上的同类广义矩阵 范数||||?,有 (4)(矩阵相乘的)相容性:||A ||||||||||||AB A B ≤, n l B C ?∈, 则称()||||N A A =为A 的矩阵范数。 我们现在来验证前面(1.1)和(1.2)定义的矩阵范数是否合法?我们这里只考虑(1.2),把较容易的(1.1)的验证留给同学们, 三角不等式的验证。按列分块,记1212(,, ,),(,,,)n n A a a a B b b b ==。 2 22112||)(,),(),(||||||F n n F b a b a b a B A +++=+ 2 222222211||||||||||||n n b a b a b a ++++++= ()()2 2 121222||||||||||||||||n n a b a b ≤++ ++ ()()()2 2 2 2 122121222122||||||||2||||||||||||||||||||||||n n n n a a a b a b b b =+ +++ +++ + 对上式中第2个括号内的诸项,应用Cauchy 不等式,则有 222||||||||2||||||||||||F F F F F A B A A B B +≤++2 (||||||||)F F A B =+ (1.3) 于是,两边开方,即得三角不等式。