§2 在数模竞赛中用到概率论的一些实例
一、(2002年全国数模竞赛B 题)彩票中的数学
要求对各种彩票的设置方案,计算各个奖项的中奖概率、奖金额,以及对彩民的吸引力,评价各种方案的合理性,设计一种“更好”的方案,给彩票管理部门提出建议。 目前流行的彩票主要有下列两种类型: (1)“传统型”
例(“10选6+1”)投注者从0~9这10个号码中选出6个基本号码(可重复),排列成一个6位数,再从0~4这5个号码中选出1个特别号码,构成一注。开奖时,从0~9中摇出6个基本号码(可重复),排列成一个6位数,再从0~4中摇出1个特别号码,根据投注号码与开奖号码相符的情况确定中奖等级,如下表所示(其中abcdef 为摇出的基本号码,g 为摇出的特别号码,X 为其他号码):
投注者选的每个基本号码,与摇出号码相符的概率都是10
1,不符的概率是10
9。选的特
别号码,与摇出号码相符的概率是
5
1,选错的概率是
5
4。因为各位号码的选对与否,是相
互独立的,所以,一组投注号码中奖的概率,等于各位号码选对与否的概率的乘积,即有
0000002.051)101(}{6
=?=一等奖P ; 0000008.05
4)101(
}{6=?=二等奖P ; 000018.0109)10
1(2}{5=?
?=三等奖P ;
000243.0109
)101(
3}{2
4
=??=)(四等奖P ; 002916.010
9)101
(4}{3
3
=??=)(五等奖P ; 032805.010
9)10
1(
5}{42=??=)(
六等奖P 。
(2)“乐透(lottery)型”
例(“36选6+1”)投注者从01~36这36个号码中选出7个号码(无重复,不考虑排列次序),构成一注。开奖时,从01~36中摇出6个基本号码(无重复,不考虑排列次序)和1个特别号码,根据投注号码与开奖号码相符的情况确定中奖等级,如下表所示(其中O 为摇出的基本号码,★为摇出的特别号码,X 为其他号码):
36
从36个号码中任意选7个号码(无重复,不考虑排列次序),有7
36C 种不同选法。在彩民选
出的7个号码中,恰好有i 个基本号码和j 个特别号码的情况,相当于先从6个基本号码中选i 个,再从1个特别号码中选j 个,再从29个其他号码中选j i --7个,共有j
i j
i
C C C --72916种不同选法,所以,中奖概率为
7
36
729
16}{C C C C j i P j
i j
i
--=
个特别号码个基本号码和
选中 (6,5,4,3=i ,1,0=j )。
彩民购买一注彩票的金额为2元,获得的奖金金额由下列表格和计算公式给出(以上面的“乐透型36选6+1”为例):
奖、三等奖称为“高项奖”,奖金额不固定,按照下列公式求出:
高项奖奖金总数低项奖奖金总数
彩票销售总额
-?=%50, 高项奖单项奖金总数
这一单项所占的比例
高项奖奖金总数
?=,
高项奖单项每注奖金额这一项中奖的投注数
高项奖单项奖金总数=
。
高项奖单项每注奖金额,与彩票销售总额和这一项中奖的投注数有关。但是,如果按照概率计算,可以求出高项奖单项平均每注奖金额,与彩票销售总额无关,与这一项中奖的投注数也无关:
高项奖单项每注奖金额这一项中奖的投注数
高项奖单项奖金总数=
投注数
这一项的中奖概率
所占比例
低项奖奖金总数)
彩票销售总额??-?=
%50(
投注数
这一项的中奖概率
所占比例投注数)中奖概率低项奖每注奖金额
投注数元????-
??=
∑%502(
这一项的中奖概率
所占比例
)中奖概率低项奖每注奖金额
元??-
?=
∑%502( 。
按照这一公式,可以求得高项奖平均每注奖金额为
设投注者每购买一注彩票可以得到的奖金额为随机变量ξ,他能得到的平均奖金额就是ξ的数学期望ξE ,把上面求出的奖金额和中奖概率代入,可以求得
ξE ∑==
i
i i
x P x
}{ξ∑?=
中奖概率各项奖每注奖金额
1=(元)
。 得到这一结果是必然的,因为,投注者每购买一注彩票付出的金额为2元,按照规定,
返回给彩民的奖金总数为彩票销售总额的50%,所以平均每注彩票的奖金额显然应该就是
元元1%502=? 。
对各种彩票设置方案,都可以用上述方法求出各项奖的中奖概率和奖金额,在此基础上,便可进一步考虑彩票设置方案的合理性,对彩民的吸引力,设计出“更好”的方案来。
二、(2004年国际数模竞赛A 题)指纹是唯一的吗?
人们普遍相信一种说法:在世界上曾经生活过的任何两个人,他们的指纹,都是不相同的。要求建立一个模型,分析评估一下,这种说法,成立的可能性有多大。
(1)任意选出两个人,他们的指纹相同的概率
设一个指纹中有m 个特征点,在每个特征点处,都有可能出现n 种不同的特征(如:核心、分岔、孤岛、孔洞、三角、端点、交叉、……,等等)。 设在第i 个特征点处,出现各种特征的概率分别为
1i p ,2i p ,…,in p ( 显然有 ∑=n
j ij p 1
1= )。
于是,在第i 个特征点处,两个人的指纹特征恰好相同的概率,显然应该等于
∑
==
+++n
j j i in
i i p p
p
p
1
2
222
2
1
( m i ,,2,1 = )。
设各个特征点相互独立,则在所有m 个特征点处,两个人的指纹特征完全相同的概率就是
∏
∑∑∑∑=====???
?
??=???
? ??????
?????? ??=m
i n
j j i n
j mj n
j j n
j j
p p p p p 1
1212
12
2
1
2
1 。 作为特例,如果在所有m 个特征点处,出现n 种不同特征的概率都相等,即有
n
p j
i
1= (m i ,,2,1 =,n j ,,2,1 =)。
这时,两个人的指纹特征完全相同的概率就是
∏
∑∏
∑====???
?
??=???
? ??=
m
i n j m
i n
j j i n p p 1
121
121m
m
i m
i n
n
n n 1111
1
2=
=??
? ??=
∏
∏
== 。
(2)在世界上曾经生活过的N 个人中,至少有两个人指纹相同的概率
上面,我们已经求出了“任意选出两个人,他们的指纹相同”的概率∏
∑==???
? ??=
m
i n
j j i p p 1
12。在此基础上,我们进一步来求“在N 个人中,至少有两个人指纹相同”的概率。为此,我们先来求“在N 个人中,任何两个人的指纹都不相同”的概率。 将这N 个人编号为:第1人,第2人,…,第N 人。
第1人与第2人指纹相同的概率为p ,第1人与第2人指纹不同的概率为p -1。 在已知第1人、第2人指纹不同的条件下,第3人与第1人、第2人中至少一人指纹相同的概率为p p p 2=+,第3人与前两人指纹都不同的概率为p 21-。
在已知第1人、第2人、第3人指纹都不同的条件下,第4人与第1人、第2人、第3人中至少一人指纹相同的概率为p p p p 3=++,第4人与前三人指纹都不同的概率为
p 31-。
……
在已知第1人、第2人、…、第1-N 人指纹都不同的条件下,第N 人与前1-N 人中至少一人指纹相同的概率为p N )1(-,第N 人与前1-N 人指纹都不同的概率为
p N )1(1--。
所以,“在N 个人中,任何两个人的指纹都不相同”的概率为
∏-=-=
-----1
1
)1(])1(1[)31)(21)(1(N k kp p N p p p 。
“在N 个人中,至少有两个人的指纹相同”的概率为
∏-=--
1
1
)1(1N k kp 。
作为特例,当m
n
p 1=
时,有
∏
-=--
1
1
)1(1N k kp ∏
-=-
-
=1
1
)1(1N k m
n
k )11()21)(11(1m
m
m
n
N n
n
--
-
-
-=
N
m
m
m
m
m n N n
n
n
n )
()
1()2)(1(1+----
= N
m
N
n n P m )
(1-
= 。
(3)概率∏-=--1
1
)1(1N k kp 的计算
上面求出了“在N 个人中,至少有两个人指纹相同”的概率∏-=--1
1
)1(1N k kp ,在这个式
子中,要计算多达1-N 项的连乘积,当N 很大时(例如N 是世界上曾经生活过的人口数),这个连乘积,即使用计算机,也是很难计算的。所以,我们要考虑它的近似计算。
设
∏-=-1
1
)
1(N k kp 1
1332210)
)(()()()()(---++-+-=N N p N F p N F p N F p N F N F
∑-=-=
1
)
)((N i i
i
p N F
其中,)(N F i 是展开式中i p )(-的系数,当0
∑=-+N
i i
i
p N
F 0
))(1(∏=-=
N
k kp 1
)1(∏-=--=1
1
)
1()1(N k kp Np ∑-=--=1
))(()1(N i i
i p N F Np
∑∑-=+-=-+
-=
1
1
1
)
)(()
)((N i i i
N i i
i
p N NF
p N F ∑∑=--=-+
-=
N
i i
i N i i
i
p N NF
p N F 1
1
1
))(()
)((
∑=--+=
N
i i
i i
p N NF
N F 0
1
))](()([ ,
对比等式两边,可以看出,有递推公式:
)()()1(1N NF N F N F i i i -+=+ (N i ,,2,1 =)。
再加上显然有1)(0=N F ,就可以逐步递推得到
2)1()(1N
N N F -=
,
24
)
13()1)(2()(2---=
N N N N N F ,
48
)1)(2)(3()(2
23N
N N N N F ---=
,
5760
)
253015()1)(2)(3)(4()(2
3
4++-----=
N N
N
N N N N N N F ,
…… 。
即有
∏-=--
1
1
)
1(1N k kp ∑-=--
=1
)
)((1N i i
i
p N F -+-=3
3221)()()(p N F p N F p N F
p N
N 2
)1(-=
2
24
)
13()1)(2(p N N N N ----
----+
3
2
248
)1)(2)(3(p N
N N N 。
作为特例,设一个指纹中共有25个特征点,每个特征点处可能出现10种不同的特征,出现各种特征的概率都相等,即有 25=m ,10=n ,25
25
10
10
11-==
=
m
n
p 。
设在世界上曾经生活过的人口数为300亿,即10103?=N 。代入上面的公式,可以求得“在世界上曾经生活过的N 个人中,至少有两个人指纹完全相同”的概率为
∏-=--
1
1
)1(1N k kp
p N
N 2
)1(-=
2
24
)
13()1)(2(p N N N N ----
----+
3
2
248
)1)(2)(3(p N
N N N
25
10
10
10
2
103)110
3(-???-?=
50
10
10
10
10
10
24
)
11033(103)110
3()210
3(-?-?????-??-?-
-???-??-??-?+
-75
2
10210
10
10
10
48
103)110
3()210
3()310
3()
(
≈ +-1250000000010.00000000450000.0≈000045.0 。
这个概率非常小,也就是说,“在世界上曾经生活过的人中,至少有两个人指纹完全相同”的概率几乎等于0。由此可见,“在世界上曾经生活过的任何两个人,他们的指纹,都是不相同的”这种说法,是完全可信的。
三、(2006年华东地区数学建模邀请赛第一题)乒乓赛问题
A 、
B 两乒乓球队进行一场五局三胜制的乒乓球赛,两队各派3名选手上场,并各有3种选手的出场顺序(分别记为321,,ααα和321,,βββ)。根据过去的比赛记录,可以预测出
如果A 队以i α次序出场而B 队以j β次序出场,则打满5局A 队可胜j i a 局。由此得矩阵
)(j i a R =如下:
????
? ?
?=
13
5430412
3
21321
αααβββR (1)根据矩阵R 能否看出哪一队的实力较强?
(2)如果两队都采取稳妥的方案,比赛会出现什么结果? (3)如果你是A 队的教练,你会采取何种出场顺序?
首先要弄清楚:矩阵R 中的元素j i a 到底表示什么意思?是不是表示:如果A 队以i α次序出场而B 队以j β次序出场,A 队在5局中可以百分之百保证一定会胜j i a 局?显然不是这个意思,比较合理的看法,应该认为它只是对A 队平均获胜局数的一个估计。
当A 队以i α次序出场、B 队以j β次序出场时,设这时A 队每一局比赛获胜的概率是一个不变的常数j i p ,并且假设各局是否获胜是相互独立的(实际上也许并不是这样,但是题目中给我们的信息太少,我们只能这样假设)。这样,5局比赛就是一个独立重复试验序列。
设ξ是A 队在5局比赛中获胜的局数,显然,ξ服从二项分布),5(j i p b ,概率分布为
k
j i k
j i k
p p C k P --==55)
1(}{ξ,5,,1,0 =k 。
容易求得它的数学期望为
j i p E 5=ξ 。
如果我们认为矩阵R 中元素j i a 给出的数据,不是完全确定的结果,而是估计A 队在5局比赛中平均获胜的局数,则有
j
i
a j i p E 5==ξ 。
这样,就可以得到j i p 的估计值
5
5
j
i j
i
a E p ==ξ 。
对应于矩阵==)(j i a R ???
?
?
???
??13
5
430
412,我们可以得到这样一个矩阵
)(j i p P =???
?
?
???
??=2.06
.01
8.06.00
8.02.04.0 。 要比较A ,B 两队实力的大小,可以比较两队在每一局比赛中获胜的平均概率大小。矩阵)(j i p P =中的9个元素,是在9种不同的出场次序下A 队每局获胜的概率。假设这9种不同的出场次序出现的概率相同,都是91,那么,根据全概率公式,就可以求出A 队在每一局比赛中获胜的平均概率
511111.09
6.49
2
.06.018.06.008.02.04.0==++++++++ ,
这个概率超过了5.0,也就是说,从每一局比赛来说,A 队的实力比B 队略微强一些。
以上是从每一局比赛获胜概率的大小来比较实力,但是,比赛实际上是五局三胜制,要在五局三胜制比赛中最后获胜,才是真正获胜。
下面我们来计算在五局三胜制比赛中A 队最后获胜的概率: A 队最后获胜,可以分成下列几种情况: (1)A 队连胜三局。这种情况的概率为 3
j i p ;
(2)在前三局中A 队胜二局,最后A 队又胜一局。这种情况的概率为
)1(3)1(3
2
2
3j i j i j i
j i j i p p p p p C -=- ;
(3)在前四局中A 队胜二局,最后A 队又胜一局。这种情况的概率为
2
32
2
2
4)1(6)1(j i j i j
i
j i j i p p p p p C -=- ;
把这三种情况加起来,就得到在五局三胜制比赛中A 队最后获胜的概率
=j
i
q 2
333)1(6)1(3j i j i j i j i j
i
p p p p p -+-+
)]21(6)1(31[2
3
j i j i j i j i p p p p +-+-+=)61510(2
3
j i j i j i p p p +-= 。 根据以上公式,从矩阵)(j i p P =???
?
?
???
??=2.06
.01
8.06.00
8.02.04.0 出发,可以计算出这样一个矩阵 ??
?
?
?
???
?
?==05792.068256
.0194208.068256.00
94208.005792.031744
.0)(j i q Q 。
矩阵Q 中元素j i q 表示:当A 队以i α次序出场、B 队以j β次序出场时,在五局三胜制比赛中A 队最后获胜的概率(也就是B 队最后失败的概率)。
如果两队都随机排阵,9种出场次序出现的可能性相等,都是91,根据全概率公式,就可以算出A 队在五局三胜制比赛中最后获胜的平均概率
9
05792
.068256.0194208.068256.0094208.005792.031744.0++++++++
520284.0= 。
这个数字大于5.0,同样也说明A 队的实力比较强。
下面来看,如果两队都采取稳妥的方案,比赛会出现什么结果?
什么是“稳妥的方案”?我们的理解是:所谓“稳妥的方案”,就是对自己的每一种出场次序,都考虑最坏的情况,求出在最坏的情况下,我方失败的概率是多少,然后在各种出场次序中,选择一种最坏情况下失败概率最小的出场次序,作为我方的排阵方案。
从矩阵 ??
??
?
???
?
?=
=05792.068256
.0194208
.068256.0094208.005792.031744
.0)(3
213
2
1
αααβββj i q Q (其中的元素j i q ,是A
队获胜的概率,也是B 队失败的概率)可以看出:
对于B 队来说,采用出场次序1β时,最坏情况是A 队采用出场次序3α,B 队失败概率为1;采用出场次序2β时,最坏情况是A 队采用出场次序2α或3α,B 队失败概率为
68256.0;采用出场次序3β时,最坏情况是A 队采用出场次序1α或2α,B 队失败概率为94208.0。3个失败概率中,68256.0为最小,所以,B 队最稳妥的方案是采用出场次序2β。
对于A 队来说,采用出场次序1α时,最坏情况是B 队采用出场次序2β,A 队获胜概率为05792.0;采用出场次序2α时,最坏情况是B 队采用出场次序1β,A 队获胜概率为0;采用出场次序3α,最坏情况是B 队采用出场次序3β,A 队获胜概率为05792.0。3个获胜概率中,05792.0为最大,所以,A 队最稳妥的方案是采用出场次序1α或3α。
那么,A 队到底采用1α还是3α呢?如果A 队预料到B 队一定会采用最稳妥的出场次序2β,那么,这时A 队采用1α,获胜的概率只有05792.0,A 队采用3α,获胜的概率就会有68256.0,当然,A 队应该采用3α。
但是,如果B 队又预料到A 队会采用3α,那么,B 队就不会采用失败概率为68256.0的2β,而是应该采用失败概率更小(失败概率为05792.0)的3β。
如果A 队又预料到B 队会采用3β,A 队又会改变出场次序。……。这样的推理,可以无穷无尽地进行下去。
其实,这是一个博弈论(Game Theory )中的两人零和博弈(Zero-Sum Two-Person Game )
问题。A 队可以采用的3种出场次序321,,ααα,是A 队可以采用的3种策略;B 队可以采用的3种出场次序321,,βββ,是B 队可以采用的3种策略。矩阵)(j i q Q =是A 队的得分矩阵,也是B 队的失分矩阵(支付矩阵Payout Matrix )。
当博弈的双方都只采用一种固定的策略(称为纯策略)时,两人零和博弈问题要得到一个稳定的解,矩阵)(j i q Q =中必须有一个鞍点(Saddle Point ),即在同一列中取到最大值、又在同一行中取到最小值的元素。
在矩阵)(j i q Q =中找不到这样的鞍点,所以,这个问题不可能有一个稳定的纯策略解。 但是,在这种情况下,可以考虑混合策略解。所谓混合策略,就是博弈双方不是固定采用一种纯策略,而是以某种概率混合采用各种策略。
设A 队以概率321,,x x x 采用策略321,,ααα。因为321,,x x x 是概率,所以必须满足
1321=++x x x ,01≥x ,02≥x ,03≥x 。
设z 是A 队采用这种混合策略时,不管B 队采用什么策略,A 队的得分(最后获胜概率)能够保证的最小值。
由全概率公式可知,当B 队采用纯策略j β时,A 队的得分(最后获胜概率)为
332211x q x q x q j j j ++ ,3,2,1=j 。
因为z 是A 队的得分(最后获胜概率)能够保证的最小值,所以必须有
332211x q x q x q j j j ++z ≥ ,3,2,1=j 。
容易看出,只要上述不等式成立,当B 队以某种概率混合采用各种策略时,A 队的得分同样也可以保证大于z ,所以不必另外再列式子了。
A 队的目标,是要使得这个能够保证的最小得分达到最大,所以,整个问题就可以表示成一个线性规划问题:
目标函数 z max
约束条件 ?????
??
??≥≥≥=++≥++≥++≥++0
,0,01321321333223113332222112331221111x x x x x x z x q x q x q z x q x q x q z x q x q x q 。
解这个线性规划问题,可以求得:A 队采用策略321,,ααα的概率应该分别为
235987.01=x ,303772.02=x ,460241.03=x ,
当A 队采用这种混合策略时,A 队能够保证的获胜概率为 535135.0=z 。
对于B 队,也可以列出类似的线性规划问题,正好是上述A 队问题的对偶问题。
解这个对偶的线性规划问题,可以求得:B 队采用策略321,,βββ的概率应该分别为
378901.01=y ,192556.02=y ,428543.03=y ,
当B 队采用这种混合策略时,B 队能够保证的获胜概率为 464865.0='z 。
混合策略是以一定的概率混合采用各种策略,但是实际上,在一次具体的比赛中,必须取定其中的一种策略,到底取那一种呢?这又是一个值得研究的问题。
四、(2000年国际数模竞赛A 题)空中交通管理
一个空中交通管理员,负责管理一个空中区域。现在的问题是:
(1)为了避免区域中飞机发生碰撞,管理员在什么情况下,必须对飞机的飞行进行干涉处理?
(2)从管理员工作量的角度来看,怎样测量空中交通管理的复杂度?这个复杂度与区域中飞机的架数是什么关系?
解决问题(1)的关键是:已知两架飞机现在的位置、飞行的方向和速度,判断这两架飞机会不会碰撞。这是一个物体运动问题,实际上,可以化为一个几何问题来求解,是比较容易解决的。因为我们主要关心的是概率论在数模竞赛中的应用,这个几何问题的解法就不在此详细讨论了。
解决问题(2)的关键是:怎样计算管理员的工作量? 管理员的工作量与他管理空中交通的工作方式有关。设想管理员用下列方式管理这个区域的空中交通:每当一架飞机进入区域时,就计算一下它会不会与现在已经在区域内的任何一架飞机发生碰撞。如果会发生碰撞,就调整一次它的飞行路线。调整后,再计算它会不会发生碰撞。如果会发生碰撞,再调整一次它的飞行路线。调整后,再计算它会不会发生碰撞。……。这样一直进行下去,直到这架飞机不会与区域内任何一架飞机发生碰撞为止。
管理员的工作量由下列两部分组成:
(1)计算是否碰撞:设一共要计算ξ次,每一次计算的工作量为1W 。
(2)调整飞行路线:设一共要调整1-ξ次(从上面的流程图可以看出,调整总是要比计算
少1次),每一次调整的工作量为2W 。
所以,每一架飞机进入区域,管理员的工作量为
22121)()1(W W W W W W -+=-+=ξξξ ,
平均工作量,即工作量W 的数学期望为
221)(W E W W EW -+=ξ 。
设p 是一架飞机进入区域时,它与区域内任何一架飞机都不碰撞的概率。
从上面的流程图可以看出,完成这架飞机的飞行路线管理工作,保证这架飞机与区域内任何一架飞机都不碰撞,只需要计算1次的概率为
p P ==}1{ξ ,
完成这架飞机的飞行路线管理工作,需要计算2次,调整1次的概率为
p p P )1(}2{-==ξ ,
完成这架飞机的飞行路线管理工作,需要计算3次,调整2次的概率为
p p P 2
)1(}3{-==ξ ,
……,
一般地,完成这架飞机的飞行路线管理工作,需要计算k 次,调整1-k 次的概率为
p p k P k 1
)
1(}{--==ξ 。
由此可见,所需计算次数ξ服从几何分布,即有ξ~)(p g ,它的数学期望p
E 1=
ξ。
设0p 是一架飞机进入区域时,它与区域内的某一架飞机不碰撞的概率。概率0p 可以通过随机模拟的方法求出,具体做法是:在区域边界上随机地取一个点,作为进入区域的飞机的位置,随机地确定这架飞机飞入区域的飞行路线。再在区域内部随机地取一个点,作为区域内的飞机的位置,随机地确定这架飞机的飞行路线。然后判断这两架飞机会不会碰撞(在问题(1)的解答中已经给出了判断方法)。这作为一次模拟试验。重复多次做这样的模拟试验,计算出飞机不碰撞的频率(即不碰撞的试验次数与总的试验次数之比)。随着试验次数越来越多,不碰撞的频率会越来越接近不碰撞的概率0p ,这样,就得到了0p 的近似值。 设区域内共有N 架飞机,作为近似,设这些飞机是相互独立的。由于一架飞机进入区域时,它与区域内的某一架飞机不碰撞的概率为0p ,所以,一架飞机进入区域时,它与区
域内N 架飞机中的任何一架飞机都不碰撞的概率为N
p p 0=。
这样,就有
221)(W E W W EW -+=ξ22
1W p
W W -+=
20
2
1W p
W W N -+=
。
同时,上式中的1W 也与N 有关。1W 是一架飞机进入区域时,判断它是否与区域内N 架飞机都不碰撞所需的计算工作量。设0W 是一架飞机进入区域时,判断它是否与区域内某一架飞机碰撞所需的计算工作量。显然应该有
01NW W = 。
所以,
EW 20
2
1W p
W W N
-+=
20
2
W p
W NW
N -+=
。
这只是一架飞机进入区域时管理员的平均工作量。要考虑空中交通管理的复杂度,不能只考虑这一架飞机进入时管理员的平均工作量,还要考虑管理员整个一天的平均工作量。 设M 是一天24小时内进入区域的飞机总数,显然,一天的工作量应该是一架飞机进入时的工作量的M 倍,即有
EW M ???
?
??-+=2020W p W NW M N 。 但M 也与区域内的飞机数N 有关。
设一天24小时中的每一时刻,区域内的飞机数N 都近似是一个常数。设T 是平均每架
飞机进入区域后,在区域内飞行的时间(可以用随机模拟的方法,求出T 的近似值)。则有
N T M 2424==的总的飞行时数
小时,区域内所有飞机
一天 。
因此有
T
N M 24=
。
我们把“空中交通管理的复杂度”定义为“管理员一天的平均工作量”。于是有 空中交通管理的复杂度=管理员一天的平均工作量EW M =???
?
??-+=2020W p W NW M N ???
? ??-+=
20
2024W p W NW T N N ≈N
p kN )1(02 。 因为100<
110
>p 。作为N 的函数,复杂度的图像为
从图像可以看出,空中交通管理的复杂度随着飞机架数N的增加而增大,一开始,复杂度增大的速度不是很快,但随着N越来越大,复杂度增大的速度会越来越快。
数学建模实验答案-概率模型
实验10 概率模型(2学时) (第9章 概率模型) 1.(验证)报童的诀窍p302~304, 323(习题2) 关于每天报纸购进量的优化模型: 已知b 为每份报纸的购进价,a 为零售价,c 为退回价(a > b > c ),每天报纸的需求量为r 份的概率是f (r )(r =0,1,2,…)。 求每天购进量n 份,使日平均收入,即 1 ()[()()()]()()()n r r n G n a b r b c n r f r a b nf r ∞ ==+=----+ -∑∑ 达到最大。 视r 为连续变量,f (r )转化为概率密度函数p (r ),则所求n *满足 * ()n a b p r dr a c -= -? 已知b =, a =1, c =,r 服从均值μ=500(份),均方差σ=50(份)的正态分布。报童每天应购进多少份报纸才能使平均收入最高,这个最高收入是多少 [提示:normpdf, normcdf] 要求:
(1) 在同一图形窗口内绘制10 ()()n y n p r dr =?和2()a b y n a c -= -的图形,观察其交点。 [提示] 22 ()2()r p r μσ-- = ,0 ()()()n n p r dr p r dr p r dr -∞ -∞ =-?? ? ☆(1) 运行程序并给出结果: (2) 求方程0()n a b p r dr a c -= -?的根n *(四舍五入取整),并求G (n *)。
mu=500;sigma=50; a=1; b=; c=; r=n+1; while (a-b)*n*normpdf(r,mu,sigma)>1e-6 r=r+1; end r=n+1:r; G=sum((a-b)*n*normpdf(r,mu,sigma)); r=0:n; G=G+sum(((a-b)*r-(b-c)*(n-r)).*normpdf(r,mu,sigma)) ☆(2) 运行程序并给出结果: 2.(编程)轧钢中的浪费p307~310 设要轧制长l=的成品钢材,由粗轧设备等因素决定的粗轧冷却后钢材长度的均方差σ=,问这时钢材长度的均值m应调整到多少使浪费最少。 平均每得到一根成品材所需钢材的长度为 () () m J m P m = 其中, 2 2 () 2 ()(), () 2 x m l P m p x dx p xσ πσ - - ∞ == ? 求m使J(m)达到最小。 等价于求方程 () () z z z λ ? Φ =- 的根z*。 其中:
一、人体重变化 某人的食量是10467焦/天,最基本新陈代谢要自动消耗其中的5038焦/天。每天的体育运动消耗热量大约是69焦/(千克?天)乘以他的体重(千克)。假设以脂肪形式贮存的热量100% 地有效,而1千克脂肪含热量41868焦。试研究此人体重随时间变化的规律。 一、问题分析 人体重W(t)随时间t变化是由于消耗量和吸收量的差值所引起的,假设人体重随时间的变化是连续变化过程,因此可以通过研究在△t时间内体重W的变化值列出微分方程。 二、模型假设 1、以脂肪形式贮存的热量100%有效 2、当补充能量多于消耗能量时,多余能量以脂肪形式贮存 3、假设体重的变化是一个连续函数 4、初始体重为W0 三、模型建立 假设在△t时间内: 体重的变化量为W(t+△t)-W(t); 身体一天内的热量的剩余为(10467-5038-69*W(t)) 将其乘以△t即为一小段时间内剩下的热量; 转换成微分方程为:d[W(t+△t)-W(t)]=(10467-5038-69*W(t))dt; 四、模型求解 d(5429-69W)/(5429-69W)=-69dt/41686 W(0)=W0 解得: 5429-69W=(5429-69W0)e(-69t/41686) 即: W(t)=5429/69-(5429-69W0)/5429e(-69t/41686) 当t趋于无穷时,w=81; 二、投资策略模型 一、问题重述 一家公司要投资一个车队并尝试着决定保留汽车时间的最佳方案。5年后,它将卖出所有剩余汽车并让一家外围公司提供运输。在策划下一个5年计划时,这家公司评估在年i 的开始买进汽车并在年j的开始卖出汽车,将有净成本a ij(购入价减去折旧加上运营和维修成本)ij
§8 主成分分析的应用 主成分分析的基本思想是通过构造原变量的适当的线性组合,以产生一系列互不相关的新变量,从中选出少数几个新变量并使它们尽可能多地包含原变量的信息(降维),从而使得用这几个新变量替代原变量分析问题成为可能。即在尽可能少丢失信息的前提下从所研究的m 个变量中求出几个新变量,它们能综合原有变量的信息,相互之间又尽可能不含重复信息,用这几个新变量进行统计分析(例如回归分析、判别分析、聚类分析等等)仍能达到我们的目的。 设有n 个样品,m 个变量(指标)的数据矩阵 (1)1112 1(2)21222()12m m n m n n n nm x x x x x x x x X x x x x ??? ?? ? ? ? ?== ? ? ? ? ????? 寻找k 个新变量12,,,()k y y y k m ≤ ,使得 1、1122,(1,2,,)l l l lm m y a x a x a x l k =+++= 2、12,,k y y y 彼此不相关 这便是主成分分析。主成分的系数向量12(,,,)l l l lm a a a a = 的分量lj a 刻划出第j 个变量关于第l 个主成分的重要性。 可以证明,若12(,,,)T m x x x x = 为m 维随机向量,它的协方差矩阵V 的m 个特征值为 120m λλλ≥≥≥≥ ,相应的标准正交化的特征向量为12,,,m u u u ,则 12(,,,)T m x x x x = 的第i 主成分为(1,2,,)T i i y u x i m == 。 称1 / m i j j λλ =∑为主成分(1,2,,)T i i y u x i m == 的贡献率, 1 1 /k m j j j j λλ ==∑∑为主成分 12,,k y y y 的累计贡献率,它表达了前k 个主成分中包含原变量12,,,m x x x 的信息量大 小,通常取k 使累计贡献率在85%以上即可。当然这不是一个绝对不变的标准,可以根据实 际效果作取舍,例如当后面几个主成分的贡献率较接近时,只选取其中一个就不公平了,若都选入又达不到简化变量的目的,那时常常将它们一同割舍。 计算步骤如下: 1、由已知的原始数据矩阵n m X ?计算样本均值向量12?(,,,)T m x x x x μ== ; 其中1 1(1,2,,)n i ij j x x i m n ===∑
一、人体重变化 某人得食量就是10467焦/天,最基本新陈代谢要自动消耗其中得5038焦/天。每天得体育运动消耗热量大约就是69焦/(千克?天)乘以她得体重(千克)。假设以脂肪形式贮存得热量100% 地有效,而1千克脂肪含热量41868焦。试研究此人体重随时间变化得规律. 一、问题分析 人体重W(t)随时间t变化就是由于消耗量与吸收量得差值所引起得,假设人体重随时间得变化就是连续变化过程,因此可以通过研究在△t时间内体重W得变化值列出微分方程。 二、模型假设 1、以脂肪形式贮存得热量100%有效 2、当补充能量多于消耗能量时,多余能量以脂肪形式贮存 3、假设体重得变化就是一个连续函数 4、初始体重为W0 三、模型建立 假设在△t时间内: 体重得变化量为W(t+△t)—W(t); 身体一天内得热量得剩余为(10467—5038-69*W(t)) 将其乘以△t即为一小段时间内剩下得热量; 转换成微分方程为:d[W(t+△t)-W(t)]=(10467—5038-69*W(t))dt; 四、模型求解 d(5429—69W)/(5429-69W)=-69dt/41686 W(0)=W0 解得: 5429-69W=(5429-69W0)e(-69t/41686) 即:
W(t)=5429/69—(5429-69W0)/5429e(-69t/41686) 当t趋于无穷时,w=81; 二、投资策略模型 一、问题重述 一家公司要投资一个车队并尝试着决定保留汽车时间得最佳方案。5年后,它将卖出所有剩余汽车并让一家外围公司提供运输。在策划下一个5年计划时,这家公司评估在年i得开始买进汽车并在年j得开始卖出汽车,将有净成本aij(购入价减去折旧加上运营与维修成本).以千元计数aij得由下面得表给出: 请寻找什么时间买进与卖出汽车得最便宜得策略。 二、问题分析 本问题就是寻找成本最低得投资策略,可视为寻找最短路径问题.因此可利用图论法分析,用Dijkstra算法找出最短路径,即为最低成本得投资策略。 三、条件假设 除购入价折旧以及运营与维护成本外无其她费用; 四、模型建立 二 5 11 7 三6 4
实验10 概率模型(2学时) (第9章 概率模型) 1.(验证)报童的诀窍p302~304, 323(习题2) 关于每天报纸购进量的优化模型: 已知b 为每份报纸的购进价,a 为零售价,c 为退回价(a > b > c ),每天报纸的需求量为r 份的概率是f (r )(r =0,1,2,…)。 求每天购进量n 份,使日平均收入,即 1 ()[()()()]()()()n r r n G n a b r b c n r f r a b nf r ∞ ==+=----+ -∑∑ 达到最大。 视r 为连续变量,f (r )转化为概率密度函数p (r ),则所求n *满足 * ()n a b p r dr a c -= -? 已知b =0.75, a =1, c =0.6,r 服从均值μ=500(份),均方差σ=50(份)的正态分布。报童每天应购进多少份报纸才能使平均收入最高,这个最高收入是多少? [提示:normpdf, normcdf] 要求:
(1) 在同一图形窗口内绘制10 ()()n y n p r dr =?和2()a b y n a c -= -的图形,观察其交点。 [提示] 22 ()2()r p r μσ-- = ,0 ()()()n n p r dr p r dr p r dr -∞ -∞ =-?? ? ☆(1) 运行程序并给出结果: (2) 求方程0()n a b p r dr a c -= -?的根n *(四舍五入取整),并求G (n *)。
mu=500;sigma=50; a=1; b=0.75; c=0.6; r=n+1; while (a-b)*n*normpdf(r,mu,sigma)>1e-6 r=r+1; end r=n+1:r; G=sum((a-b)*n*normpdf(r,mu,sigma)); r=0:n; G=G+sum(((a-b)*r-(b-c)*(n-r)).*normpdf(r,mu,sigma)) ☆(2) 运行程序并给出结果: 2.(编程)轧钢中的浪费p307~310 设要轧制长l =2.0m的成品钢材,由粗轧设备等因素决定的粗轧冷却后钢材长度的均方差σ=0.2m,问这时钢材长度的均值m应调整到多少使浪费最少。 平均每得到一根成品材所需钢材的长度为 () () m J m P m = 其中, 2 2 () 2 ()(), () 2 x m l P m p x dx p xσ πσ - - ∞ == ? 求m使J(m)达到最小。 等价于求方程 () () z z z λ ? Φ =- 的根z*。 其中:
§7 消费分布规律的分类 为研究辽宁、浙江、河南、甘肃、青海5省份在某年城镇居民生活消费的分布规律,需要用调查资料对这5个省分类.数据见下表: 其中,X 1:人均粮食支出; X 2:人均副食品支出; X 3:人均烟、酒、茶支出; X 4:人均其它副食品支出; X 5:人均衣着商品支出; X 6:人均日用品支出; X 7:人均燃料支出; X 8:人均非商品支出. 在科学研究、生产实践、社会生活中,经常会遇到分类的问题.例如,在考古学中,要将某些古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中,要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品,二等品等等. 这些问题可以用聚类分析方法来解决. 聚类分析的研究内容包括两个方面,一是对样品进行分类,称为Q 型聚类法,使用的统计量是样品间的距离;二是对变量进行分类,称为R 型聚类法,使用的统计量是变量间的相似系数. 设共有n 个样品,每个样品i x 有p 个变量,它们的观测值可以表示为 n i x x x x pi i i i ,,2,1),,,,(21 == 一、样品间的距离 下面介绍在聚类分析中常用的几种定义样品i x 与样品j x 间的距离. 1、 Minkowski 距离 m m p k kj ki j i x x x x d 11 ][),(∑=-= 2、绝对值距离 ∑=-=p k kj ki j i x x x x d 1),( 3、欧氏距离 21 21][),(∑=-=p k kj ki j i x x x x d 二、变量间的相似系数 相似系数越接近1,说明变量间的关联程度越好.常用的变量间的相似系数有 1、 夹角余弦
概率论与数学建模
概率论与数学建模 基础知识部分 一、概率论: 1、概率:刻化某一事件在一次试验中发生的可能性大小的数。 注:事件指随机事件(可重复、可预测、结果明确) 例如抛骰子,抛一枚硬币。 2、常见的随机变量:X (1)离散型: 泊松分布:k e P X k k k λ λ-(=)= ,=0、1、2、、、! 实际应用:时间t 内到达的次数; (小概率事件)一本书中一页中的印刷错误数; 某地区在一天内邮件遗失的信件数; 某一天内医院的急症病人数; 某一地区一个时间间隔内发生交通事故的次数; 一个时间间隔内某种放射性物质发出的经过计数器的α粒子数等等…… (2)连续型: 指数分布:x e x>0 f X λλ???-,()=0,其它 其中>0λ为常数 ,记为)(~λExp X 特点:无记忆性。即是P(/)()X s t X s P X t >+>=>
一个元件已经使用了s 小时,在此情形下,它总共能使用至少s+t 小时的概率,与开始使用时算起它至少能使用t 小时的概率相等,即元件对已使用过s 小时无记忆。 实际应用:(可靠性理论、排队论)许多“等待时间”都服从指数分布;一些没有明显“衰老”迹象的机械元器件(如半导体元件)的寿命也可也用指数分布来描述…… 正态分布:x e f X “3σ“原则: “3σ“原则被实际工作者发现,工业生产上用的控制图和一 些产品质量指数都是根据3σ原则制定。 3、随机变量的特征数(数字特征): 均值(期望):k k k x p E X xf x dx ∞ ∞ ∞ ???????∑?=1 +-,(离散型)()=(),(连续型) 方差:22 D X = E X E X ()(())E X E X =-2()(-()) 中心极限定理:n X X ,,1 是独立同分布的随机变量序列,且 22(),(),0i i E X D X μσσ==> 则有:)(}{lim 1t t n n X X P n n Φ=≤-+∞ →σμ 模型一、轧钢中的浪费模型: 问题:将粗大的钢坯制成合格的钢材需要两道工序:粗轧(热轧),形成刚才的雏形;精轧(冷轧),得到规定长度的成品材料。由于受到环境、技术等因素的影响,得到钢材的长度是随机的,大体上呈正态分布,其均值可以通过调整轧机设定,而均方差是由设备的精度决定,不能随意改变。如果粗轧后的钢材长度大于规定长度,精轧时要把多余的部分切除,造成浪费; 而如果粗轧后的钢材长度小于规定长 2σ x 99.7% 6σ 4σ (1) (2) (3) μ 数学建模疾病的诊断 现要你给出疾病诊断的一种方法。 胃癌患者容易被误诊为萎缩性胃炎患者或非胃病者。从胃癌患者中抽 取5人(编号为1-5),从萎缩性胃炎患者中抽取5人(编号为6-10),以及非胃病者 中抽取5人(编号为11-15),每人化验4项生化指标:血清铜蓝蛋白( X)、 1 蓝色反应( X)、尿吲哚乙酸(3X)、中性硫化物(4X)、测得数据如表1 2 所示: 表1. 从人体中化验出的生化指标 根据数据,试给出鉴别胃病的方法。 论文题目:胃病的诊断 摘要 在临床医学中,诊断试验是一种诊断疾病的重要方法。好的诊断试验方法将对临床诊断的正确性和疾病的治疗效果起重要影响。因此,对于不同疾病不断发现新的诊断试验方法是医学进步的重要标志。传统的诊断试验方法有生化检测、DNA检测和影像检测等方法。而本文则通过利用多元统计分析中的判别分析及SPSS软件的辅助较好地解决了临床医学中胃病鉴别的问题。在临床医学上,既提高了临床诊断的正确性,又对疾病的治疗效果起了重要效果,同时也减轻了病人的负担。 判别分析是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。 其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。 首先,由判别分析定义可知,只有当多个总体的特征具有显著的差异时,进行判别分析才有意义,且总体间差异越大,才会使误判率越小。因此在进行判别分析时,有必要对总体多元变量的均值进行是否不等的显著性检验。 其次,利用判别分析中的费歇判别和贝叶斯判别进行判别函数的建立。 最后,利用所建立的判别函数进行回判并测得其误判率,以及对其修正。 本文利用SPSS软件实现了对总体间给类变量的均值是否不等的显著性检验并根据样本建立了相应的费歇判别函数和贝叶斯判别函数,最后进行了回判并测得了误判率,从而获得了在临床诊断中模型,给临床上的诊断试验提供了新方法和新建议。 关键词:判别分析;判别函数;Fisher判别;Bayes判别 一问题的提出 在传统的胃病诊断中,胃癌患者容易被误诊为萎缩性胃炎患者或非胃病患者,为了提高医学上诊断的准确性,也为了减少因误诊而造成的病人死亡率,必须要找出一种最准确最有效的诊断方法。为诊断疾病,必须从人体中提取4项生化指标进行化验,即血 第六章 概率论与数学建模 一、随机事件及其概率 1.随机事件:可重复;可预测结果且结果明确;试验前出现那个结果 不能确定 例如:抛骰子一次,抛一枚硬币三次等。 2.事件的运算及其含义: B A ?:A 为B 的子事件。其含义是:A 发生则B 必发生 B A =:事件A ,B 相等。其含义是:A 发生则B 必发生,反之亦然 C B A =?:事件A 与B 的交。其含义是:C 发生当且仅当A ,B 同 时发生 C B A =?:事件A 与B 的并(和) 。其含义是:C 发生当且仅当A ,B 中至少有一个发生。 C B A =-:事件A 与B 的差。其含义是:C 发生当且仅当A 发生并 且B 不发生。 φ=AB :事件A 与B 互不相容。其含义是:A 与B 不可能同时发生。 A :事件A 的对立事件。 3.概率:刻化某一事件在一次试验中发生的可能性大小的数量指标。 (当∞→n 时,)()(A P A f P ?→? ) 4.古典概论:某个试验共有n 个等可能的结果(样本点),事件A 包含其中m 个结果(样本点),则认为 n m 就是事件A 的概率。这种基于等可能性确定概率的模型称为古典概率模型。 例6.1.1(Monte Hall Problem )20世纪60,70年代,美国“电视游戏 秀”曾经非常流行一个名叫“Let ’s Make a Deal ”的节目,由Monte Hall 主持。游戏过程如下:有三扇关着的门,其中一扇门后面有奖品(一辆汽车),其余两扇门后面则没有奖品,若猜中了有奖品的门就能赢取这辆汽车。你从中挑选一扇门,但暂不打开。这时,主持人在另外两扇门中挑一个没有奖品的门打开,并展示给你和观众。然后,主持人问你:是坚持原来的选择,还是换成最后那扇门? 解:从能不能得奖的角度看,这个游戏只有两个结果:不换门得奖(A )、换门能得奖(B )。第一个门是你“三选一”随机(等可能地)挑选的,故P(A)=1/3,自然,另一个结果的概率就是P(B)=2/3。因此,正确的决定是换成那扇门。 例6.1.2(抽签原理)袋中有2只红球8只黑球(除颜色外无法再分辨)。10个人依次摸球,得红球者中奖。求:k A ={第k 个摸球者中奖}的概率,k=1,2,…,10 解法一:假定对解题者来说这些球可辨别。样本点为一轮抽签结束后这10个球的排列,共有10!个等可能的样本点。事件k A 所含样本点 的特征是:两个红球中任选一个排在第k 位(有12C 种可能),而其余 9个球在其余9个位置上可任意排列(有9!种可能)。因此k A 包含了 9!12 C 个样本点,故5 1 !10!9)(1 2== C A P K . 解法二:假定球不可辨,只需关注红球落入哪两个人之手,样本空间 共有452 10 =C 个等可能的样本点。事件k A 发生意味着第k 个人得一红球,另一红球落入其余9人中某一人之手,这有1 9C 种可能,所以 数学建模 论文题目: 一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物试验,给患有同种疾病的病人使用这种新止痛剂的以下4个剂量中的某一个:2 g,5 g,7 g和10 g,并记录每个病人病痛明显减轻的时间(以分钟计). 为了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压的低、中、高三档平均分配来进行测试. 通过比较每个病人血压的历史数据,从低到高分成3组,分别记作,和. 实验结束后,公司的记录结果见下表(性别以0表示女,1表示男). 请你为该公司建立一个数学模型,根据病人用药的剂量、性别和血压组别,预测出服药后病痛明显减轻的时间. 一、摘要 在农某医药公司为了掌握一种新止痛药的疗效,设计了一个药物实验,通过观测病人性别、血压和用药剂量与病痛时间的关系,预测服药后病痛明显减轻的时间。我们运用数学统计工具m i n i t a b软件,对用药剂量,性别和血压组别与病痛减轻 时间之间的数据进行深层次地处理并加以讨论概率值P (是否<)和拟合度R-S q的值是否更大(越大,说明模型越好)。 首先,假设用药剂量、性别和血压组别与病痛减轻时间之间具有线性关系,我们建立了模型Ⅰ。对模型Ⅰ用m i n i t a b 软件进行回归分析,结果偏差较大,说明不是单纯的线性关系,然后对不同性别分开讨论,增加血压和用药剂量的交叉项,我们在模型Ⅰ的基础上建立了模型Ⅱ,用m i n i t a b软件进行回归分析后,用药剂量对病痛减轻时间不显着,于是我们有引进了用药剂量的平方项,改进模型Ⅱ建立了模型Ⅲ,用m i n i t a b 软件进行回归分析后,结果合理。最终确定了女性病人服药后病痛减轻时间与用药剂量、性别和血压组别的关系模型: Y=1x 3x 1x 3x 2 1 x 对模型Ⅱ和模型Ⅲ关于男性病人用m i n i t a b软件进行回归分析,结果偏差依然较大,于是改进模型Ⅲ建立了模型Ⅳ,用m i n i t a b软件进行回归分析后,结果合理。最终确定了男性病人服药后病痛减轻时间与用药剂量、性别和血压组别的关系模 型:Y=1x1x 3x 2 1 x关键词止痛剂药剂量性别病痛减轻时 间 概 率 在 数 学 建 模 中 : 的 应 用 姓名:邓洪波高强庞宁 班级:文电082-2 专业:电子计算机与科学技术 电话: ? 概率论与数理统计在数学建模中的应用 通过五天的学习我们主要学习了三个方面的知识,包括:概率模型,统计回 归模型,以及马氏链模型。通过这三个方面的学习,大体上了解了概率在数学建 模中的应用以及它所能解决的问题类型。下面就这三个方面的内容做一下简单的 介绍 。 首先对概率模型做一下简单的介绍。对于实际问题我们所研究的对象无非是 制定计划使效率最高,收入最高,费用最小,浪费最小以及变化趋势的估计等问 题。在这类问题中,题目往往给出的是实际背景,我们需要从这些实际背景中, 抽象出数学模型,设出所需要的变量,然后用所学的知识解决问题,并且每一个 模型都要进行“模型假设”,这是用数学知识解决问题的一个前提条件,下面就 一个实际的题目进行各个方面的分析。 比如有如下问题:以周为时间单位;一周的商品销售量为随机;周末根据库 存决定是否订货,供下周销售。用到的知识是(s ,S )存贮策略,即制丁下界s , 上界S ,当周末库存小于s 时订货,是下周初的库存达到S;否则,不订货。要解 决的问题是考在虑订货费,存贮费,缺货费,购进费的情况下,制订(s ,S )存 贮策略,使总费用最小。 首先我们进行模型的假设,设出建模中所用到的变量,如下:1.每次订货费0c , 每件商品的购进价为1c ,每件商品一周贮存费2c ,每件商品缺货损失费3 c (1c <3c );2.每周销售量r 随机,连续,概率密度p(r);3.每周库存量x ,订货 量u ,周初库存量u x +;4. 每周贮存量按 x+u-r 计等等,当然有些问题再“模 型的假设”这一过程中除了对变量做相关的假设以外还要对实际问题进行假设, 比如在《传送系统的效率》中我们曾假设:生产进入稳态,每人生产完一件产品 的时刻在一个周期内是等可能的等。当然有些问题在做一般假设的时候还不能解 决问题,还要进行进一步的假设,比如在《随机人口模型》中,在我们假设出生 率x b 与t ?成正比之后,又做了进一步的假设,假设出生率x b 与人口的总数n 成 正比。通过进行各种模型的假设有利于我们在建模的过程中解决实际问题。 模型的建立,对于上题,我们考虑到两种情况,即一种是不用订货,另一种 是需要订货,写出目标函数: ???+++=) (),()(1 0x L u x L u c c u J 00=>u u , 其中??∞ -+-=x x dr r p x r c dr r p r x c x L )()()()()(032,在此步骤中我们需要列出目标函数 以及约束条件,当然目标函数的选择也是至关重要的,选择一个合适的模型是取 得比赛胜利的关键,比如在《轧钢中的浪费》中我们建立的第一个模型是: ] 数学建模个人经验谈——组队和分工 数学建模竞赛是三个人的活动,参加竞赛首要是要组队,而怎么样组队是有讲究的。此外还需要分工等等,一般的组队情况是和同学组队,很多情况是三个人都是同一系,同一专业以及一个班的,这样的组队是不合理的。让三人一组参赛一是为了培养合作精神,其实更为重要的原因是这项工作需要多人合作,因为人不是万能的,掌握知识不是全面的,当然不排除有这样的牛人存在,事实上也是存在的,什么都会,竞赛可以一个人独立搞定。但既然允许三个人组队,有人帮忙总是好的,至少不会太累。而三个人同系同专业甚至同班的话大家的专业知识一样,如果碰上专业知识以外的背景那会比较麻烦的。所以如果是不同专业组队则有利的多。 众所周知,数学建模特别需要数学和计算机的能力,所以在组队的时候需要优先考虑队中有这方面才能的人,根据现在的大学专业培养信息与计算科学,应用数学专业的较为有利,尤其是信息与计算科学可以说是数学和计算机专业的结合,两方面都有兼顾,虽然说这个专业的出路不是很好,数学和计算机都涉及点但是都没有真正的学通这两门专业的,但对于弄数学建模来说是再合适不过了。应用数学则偏重于数学,但是一般来讲玩计算机的时间不会太少,尤其是在科学计算和程序设计都会设计到比较多,又有深厚的数学功底,也是很不错的选择。 有不少的人会认为第一人选是数学方面的那第二人选就应该考虑计算机了,因为学计算机的会程序,其实这个概念可以说是对也可以说是不对的。之所以需要计算机方面的人是为了弥补数学方面的人在算法实践方面的不足,但是不是所有的计算机方面专业人都擅长算法实践的,如果要选的话就选擅长算法分析实践的,因为学计算机的不一定会程序,并且会程序的不一定会算法。拿出一个算法,让学计算机的编写程序实践不一定能行,不是小看计算机的,但是这种情况还是比较多的,不然可以看到参加ACM的数学系的居多,比学计算机的搞的好。因此一定要弄清这个概念,不是计算机的就适合的。所以在组队中有两种人是必需的,一个是对建模很熟悉的,对各类算法理论熟悉,在了解背景后对此背景下的各类问题能建立模型,设计求解算法。一个是能将算法编制程序予以实现,求得解。当然有可能是一个人就将这两种都具备了,这样的话再找个任意具备上述两种能力的人就可以了,以减轻工作量,不然非累死不可。第三个就是专门需要写作的啦,从专业角度看是需要别的专业,比较适合的有生物、土木、机电、电信或机械等专业。在数学建模中各种背景的问题都会出现,所以有其他专业同学的话可以弥补专业知识方面的不足。 综上所述,组队要根据分工而来的,三个人要具备一个数学功底深厚,理论扎实,一个擅长算法实践,另一个是写作(弥补专业知识不足),如果一个组能有这样的人员配置是比较合理的。但是往往事 数学模型的分类 按模型的数学方法分: 几何模型、图论模型、微分方程模型、概率模型、最优控制模型、规划论模型、马氏链模型等 按模型的特征分: 静态模型和动态模型,确定性模型和随机模型,离散模型和连续性模型,线性模型和非线性模型等 按模型的应用领域分: 人口模型、交通模型、经济模型、生态模型、资源模型、环境模型等。 按建模的目的分: 预测模型、优化模型、决策模型、控制模型等 一般研究数学建模论文的时候,是按照建模的目的去分类的,并且是算法往往也和建模的目的对应 按对模型结构的了解程度分: 有白箱模型、灰箱模型、黑箱模型等 比赛尽量避免使用,黑箱模型、灰箱模型,以及一些主观性模型。 按比赛命题方向分: 国赛一般是离散模型和连续模型各一个,2016美赛六个题目(离散、连续、运筹学/复杂网络、大数据、环境科学、政策) 数学建模十大算法 1、蒙特卡罗算法 (该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,比较好用的算法) 2、数据拟合、参数估计、插值等数据处理算法 (比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab作为工具) 3、线性规划、整数规划、多元规划、二次规划等规划类问题 (建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo软件实现) 4、图论算法 (这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备) 5、动态规划、回溯搜索、分治算法、分支定界等计算机算法 (这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中) 6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法 (这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用) 7、网格算法和穷举法 (当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具) 8、一些连续离散化方法 (很多问题都是从实际来的,数据可以是连续的,而计算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的) 9、数值分析算法 (如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用) 10、图象处理算法 (赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的这些图形如何展示,以及如何处理就是需要解决的问题,通常使用Matlab进行处理) 算法简介 1、灰色预测模型(必掌握) 解决预测类型题目。由于属于灰箱模型,一般比赛期间不优先使用。 满足两个条件可用: ①数据样本点个数少,6-15个 ②数据呈现指数或曲线的形式 2、微分方程预测(高大上、备用) 微分方程预测是方程类模型中最常见的一种算法。近几年比赛都有体现,但其中的要求,不言而喻。学习过程中 无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据的关系。 3、回归分析预测(必掌握) 求一个因变量与若干自变量之间的关系,若自变量变化后,求因变量如何变化; 样本点的个数有要求: ①自变量之间协方差比较小,最好趋近于0,自变量间的相关性小; ②样本点的个数n>3k+1,k为自变量的个数; 中学数学建模论文指导 中学阶段常见的数学模型有:方程模型、不等式模型、函数模型、几何模型和统计模型等。我们也把运用数学模型解决实际问题的方法统称为应用建模。可以分五种模型来写。论文最好自己写,如果是参加竞赛的话从网上找的会被搜出来的。 一、建模论文的标准组成部分 建模论文作为一种研究性学习有意义的尝试,可以锻炼学生发现问题、解决问题的能力。一般来说,建模论文的标准组成部分由论文的标题、摘要、正文、结论、参考文献等部分组成。现就每个部分做个简要的说明。 1. 题目 题目是给评委的第一印象,所以论文的题目一定要避免指代不清,表达不明的现象。建议将论文所涉及的模型或所用的计算方式写入题目。如“用概率方法计算商场打折与返券的实惠效应”。 2. 摘要 摘要是论文中重要的组成部分。摘要应该使用简练的语言叙述论文的核心观点和主要思想。如果你有一些创新的地方,一定要在摘要中说明。进一步,必须把一些数值的结果放在摘要里面,例如:“我们的最终计算得出,对于消费者来说,打折比返券的实惠率提高了23%。”摘要应该最后书写。在论文的其他部分还没有完成之前,你不应该书写摘要。因为摘要是论文的主旨和核心内容的集中体现,只有将论文全部完成且把论文的体系罗列清楚后,才可写摘要。 摘要一般分三个部分。用三句话表述整篇论文的中心。 第一句,用什么模型,解决什么问题。 第二句,通过怎样的思路来解决问题。 第三句,最后结果怎么样。 当然,对于低年级的同学,也可以不写摘要。 3. 正文 正文是论文的核心,也是最重要的组成部分。在论文的写作中,正文应该是从“提出问题—分析问题—选择模型—建立模型—得出结论”的方式来逐渐进行的。其中,提出问题、分析问题应该是清晰简短。而选择模型和建立模型应该是目标明确、数据详实、公式合理、计算精确。在正文写作中,应尽量不要用单纯的文字表述,尽量多地结合图表和数据,尽量多地使用科学语言,这会使得论文的层次上升。 4. 结论 概率论与数学建模 基础知识部分 一、概率论: 1、概率:刻化某一事件在一次试验中发生的可能性大小的数。 注:事件指随机事件(可重复、可预测、结果明确) 例如抛骰子,抛一枚硬币。 2、常见的随机变量:X (1)离散型: 泊松分布:k e P X k k k λ λ-(=)= ,=0、1、2、、、! 实际应用:时间t 内到达的次数; (小概率事件)一本书中一页中的印刷错误数; 某地区在一天内邮件遗失的信件数; 某一天内医院的急症病人数; 某一地区一个时间间隔内发生交通事故的次数; 一个时间间隔内某种放射性物质发出的经过计数器的α粒子数等等…… (2)连续型: 指数分布:x e x>0 f X λλ???-,()=0,其它 其中>0λ为常数 ,记为)(~λExp X 特点:无记忆性。即是P(/)()X s t X s P X t >+>=> 一个元件已经使用了s 小时,在此情形下,它总共能使用至少s+t 小时的概率,与开始使用时算起它至少能使用t小时的概率相等,即元件对已使用过s小时无记忆。 实际应用:(可靠性理论、排队论)许多“等待时间”都服从指数分布;一些没有明显“衰老”迹象的机械元器件(如半导体元件)的寿命也可也用指数分布来描述…… 正态分布: x e f X “ 3σ“原则: “ 3σ“原则被实际工作者发现,工业生产上用的控制图和一些产品 质量指数都是根据3σ原则制定。 3、随机变量的特征数(数字特征): 均值(期望):k k k x p E X xf x dx ∞ ∞ ∞ ???????∑?=1 +-,(离散型)()=(),(连续型) 方差:22 D X = E X E X ()(())E X E X =-2()(-()) 中心极限定理:n X X ,,1Λ是独立同分布的随机变量序列,且 22(),(),0i i E X D X μσσ==> 则有:)(}{lim 1t t n n X X P n n Φ=≤-+∞ →σμ Λ 模型一、轧钢中的浪费模型: 问题:将粗大的钢坯制成合格的钢材需要两道工序:粗轧(热轧),形成刚才的雏形;精轧(冷轧),得到规定长度的成品材料。由于受到环境、技术等因素的影响,得到钢材的长度是随机的,大体上呈正态分布,其均值可以通过调整轧机设定,而均方差是由设备的精度决定,不能随意改变。如果粗轧后的钢材长度大于规定长度,精轧时要把多余的部分切除,造成浪费; 而如果粗轧后的钢材长度小于规定长 2σ 6σ 4σ (1) (2) (3) μ 概率论与数理统计在数学建模中的应用 ——国 冰 。 第一节 概率模型 一、初等概率模型 初等概率模型主要介绍了可靠性模型、传染病流行估计、常染色体遗传模型等三类问题: 1、复合系统工作的可靠性问题的数学模型 设某种机器的工作系统由N 个部件组成,各部件之间是串联的,即只要有一个部件失灵,整个系统就不能正常工作.为了提高系统的可靠性,在每个部件上都装有主要元件的备用件及自动投入装置(即当所使用元件损坏时,备用元件可自动替代之而开始工作)明显地,备用件越多,整个系统正常工作的可靠性就越大. 但是,备用件过多势必导至整个系统的成本、重量和体积相应增大,工作精度也会降低. 因此,配置的最优化问题便被提出来了:在某些限制性条件之下,如何确定各部件的备用件数量,使整个系统的工作可靠性最大? 这是一个整体系统的可靠性问题.我们假设第i 个部件上装有i x 个备用件 (1,2, ,)i N =,此时该部件正常工作的概率为()i p x ,那么整个系统正常工作的可 靠度便可用 1()n i i p p x ==∏ (9.1) 来表示. 又设第i 个部件上的每个备用件的费用为i C ,重量为i W ,并要求总费用不超过C ,总重量不超过W ,则问题的数学模型便写成为 1max ()n i i p p x ==∏ (9.2) 11 ..,1,2,N i i i N i i i i c x c s t w x c x N i N ==?≤???≤???∈=?? ∑∑ 问题的目标函数为非线性的,决策变量取整数,属于非线性整数规划问题。 2、传染病流行估计的数学模型 问题分析和模型假设 本世纪初,瘟疫还经常在世界的某些地方流行。被传染的人数与哪些因素有关?如何预报传染病高潮的到来?为什么同一地区一种传染病每次流行时,被传染的人数大致不变?科学家们建立了数学模型来描述传染病的蔓延过程,以便对这些问题做出回答。 这里不是从医学角度探讨每一种瘟疫的传染机理,而是利用概率论的知识讨论传染病的蔓延过程。 假定人群中有病人或更确切地说是带菌者,也有健康人,即可能感染者,任何两人之间的接触是随机的,当健康人与病人接触时健康人是否被感染也是随机的. 问题在于一旦掌握了随机规律,那么如何去估计平均每天有多少健康人被感染,这种估计的准确性有多大? 给出以下假设 (1)设人群只分病人和健康人两类,病人数和健康人数分别记为i 和s ,总数n 不变,即 i s n += (9.3) (2)人群中任何二人的接触是相互独立的,具有相同概率p ,每人每天平均与m 人接触; (3) 当健康人与一病人接触时,健康人被感染的概率为λ。 模型建立求解 由假设(2)知道一个健康人每天接触的人数服从(1,)b n p -,且平均值是m ,则 (1)m n p =- § 7消费分布规律的分类 为研究辽宁、浙江、河南、甘肃、青海 5省份在某年城镇居民生活消费的分布规律,需要用 调查资料对这5个省分类?数据见下表: 指标 省份、\ X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 辽宁 7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29 浙江 7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.87 河南 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76 甘肃 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35 青海 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81 其中,X 1 :人均粮食支出; X 2 : 人均副食品支出; X 3:人均烟、酒、茶支出; X 4 : 人均其它副食品支出; X 5:人均衣着商品支出; X 6 : 人均日用品支出; X 7:人均燃料支出; X 8: 人均非商品支出. 在科学研究、生产实践、社会生活中,经常会遇到分类的问题 ?例如,在考古学中,要将某些 古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中, 要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指 标而将其分为一等品,二等品等等 ? 这些问题可以用聚类分析方法来解决 ? 聚类分析的研究内容包括两个方面,一是对样品进行分类,称为 Q 型聚类法,使用的统计量 是样品间的距离;二是对变量进行分类,称为 R 型聚类法,使用的统计量是 变量间的相似系数. 设共有n 个样品,每个样品 人有p 个变量,它们的观测值可以表示为 x i - (x ii , x 2i , ,x pi ), i =1 2 ,n 、样品间的距离 、变量间的相似系数 相似系数越接近i ,说明变量间的关联程度越好.常用的变量间的相似系数有 1、夹角余弦 F 面介绍在聚类分析中常用的几种定义样品 x i 与样品X j 间的距离. 1、Mi nkowski 距离 d(X i ,X j )=[》X ki — Xq ] km 2、绝对值距离 p d(X i ,X j )=送 X ki -Xq k=1 3、欧氏距离 p d(X i ,X j )珂' X ki km X kj数学建模题目及其答案(疾病诊断)
概率论与数学建模
数学建模统计模型
概率论与数理统计在数学建模中的应用
数学建模个人经验谈——组队和分工
最新数学建模常用算法模型资料
初中数学建模案例教学内容
概率论与数学建模
概率论与数理统计在数学建模中的应用
数学建模案例分析消费分布规律的分类概率统计方法建模