SARS传播的数学模型 数学建模全国赛优秀论文

SARS传播的数学模型

(轩辕杨杰整理)

摘要

本文分析了题目所提供的早期SARS传播模型的合理性与实用性,认为该模型可以预测疫情发展的大致趋势,但是存在一定的不足.第一,混淆了累计患病人数与累计确诊人数的概念;第二,借助其他地区数据进行预测,后期预测结果不够准确;第三,模型的参数L、K的设定缺乏依据,具有一定的主观性.

针对早期模型的不足,在系统分析了SARS的传播机理后,把SARS的传播过程划分为:征兆期,爆发期,高峰期和衰退期4个阶段.将每个阶段影响SARS 传播的因素参数化,在传染病SIR模型的基础上,改进得到SARS传播模型.采用离散化的方法对本模型求数值解得到:北京SARS疫情的预测持续时间为106天,预测SARS患者累计2514人,与实际情况比较吻合.

应用SARS传播模型,对隔离时间及隔离措施强度的效果进行分析,得出结论:“早发现,早隔离”能有效减少累计患病人数;“严格隔离”能有效缩短疫情持续时间.

在建立模型的过程中发现,需要认清SARS传播机理,获得真实有效的数据.而题目所提供的累计确诊人数并不等于同期累计患病人数,这给模型的建立带来不小的困难.

本文分析了海外来京旅游人数受SARS的影响,建立时间序列半参数回归模型进行了预测,估算出SARS会对北京入境旅游业造成23.22亿元人民币损失,并预计北京海外旅游人数在10月以前能恢复正常.

最后给当地报刊写了一篇短文,介绍了建立传染病数学模型的重要性.

1.问题的重述

SARS (严重急性呼吸道综合症,俗称:非典型肺炎)的爆发和蔓延使我们认识到,定量地研究传染病的传播规律,为预测和控制传染病蔓延创造条件,具有很高的重要性.现需要做以下工作:

(1) 对题目提供的一个早期模型,评价其合理性和实用性.

(2) 建立自己的模型,说明优于早期模型的原因;说明怎样才能建立一个真正能够预测以及能为预防和控制提供可靠、足够信息的模型,并指出这样做的困难;评价卫生部门采取的措施,如:提前和延后5天采取严格的隔离措施,估计对疫情传播的影响.

(3) 根据题目提供的数据建立相应的数学模型,预测SARS 对社会经济的影响.

(4) 给当地报刊写一篇通俗短文,说明建立传染病数学模型的重要性.

2.早期模型的分析与评价

题目要求建立SARS 的传播模型,整个工作的关键是建立真正能够预测以及能为预防和控制提供可靠、足够的信息的模型.如何结合可靠、足够这两个要求评价一个模型的合理性和实用性,首先需要明确:

合理性定义 要求模型的建立有根据,预测结果切合实际.

实用性定义 要求模型能全面模拟真实情况,以量化指标指导实际. 所以合理的模型能为预防和控制提供可靠的信息;实用的模型能为预防和控制提供足够的信息.

2.1早期模型简述

早期模型是一个SARS 疫情分析及疫情走势预测的模型, 该模型假定初始时刻的病例数为0N ,

平均每病人每天可传染K 个人(K 一般为小数),K 代表某种社会环境下一个病人传染他人的平均概率,与全社会的警觉程度、政府和公众采取的各种措施有关.整个模型的K 值从开始到高峰期间保持不变,高峰期后 10天的范围内K 值逐步被调整到比较小的值,然后又保持不变.

平均每个病人可以直接感染他人的时间为L 天.整个模型的L 一直被定为20.则在L 天之内,病例数目的增长随时间t (单位天)的关系是:

t

k N t N )1()(0+?=

考虑传染期限L 的作用后,变化将显著偏离指数律,增长速度会放慢.采用半模拟循环计算的办法,把到达L 天的病例从可以引发直接传染的基数中去掉.

2.2早期模型合理性评价

根据早期模型对北京疫情的分析与预测,其先将北京的病例起点定在3月1日,经过大约59天在4月29日左右达到高峰,然后通过拟合起点和4月20日以后的数据定出高峰期以前的K =0.13913.高峰期后的K 值按香港情况变化,即10天范围内K 值逐步被调整到0.0273.L 恒为20.由此画出北京3月1日至5月7日疫情发展趋势拟合图像以及5月7日以后的疫情发展趋势预测图像,如图1.

SARS传播的数学模型  数学建模全国赛优秀论文

图1 早期模型计算值与实际值对比图

从图1可以看出,从 4月20日至5月7日模型计算值与同期实际值的拟合程度比较好,但5月7日后模型计算值(即预测值)随着日期的增长逐渐偏离实际值.

为了进一步验证上述分析,对模型计算值曲线和实际值进行残差分析,记i

y 表示第i 天实际累计病例,i y

?表示第i 天计算累计病例.计算 n i y

y e e i i i

i ,,2,1,?*

=-=

=

σ

σ

其中,用σ?作为σ的估计:

2

)?(?1

--?=∑

=n y y y n

i i i i σ

做出标准化残差*i e 的分布图,如图2:

SARS传播的数学模型  数学建模全国赛优秀论文

图2 早期模型的标准化残差分布图

可以很明显地看出,在后期,残差图上出现明显的单减规律性,预测值高于实际值,说明预测值确实逐渐偏离实际值.

通过以上分析得合理性评价:

○1从预测准确度上有失合理性,虽然早期模型在拟合前期疫情时拟合程度较好,但对后期情况的预测出现较大偏差.

○2尽管预测准确程度不高,但是该模型确实预测出了整个疫情的发展趋势.从这一点上看,该模型还是切合实际的.

○3该模型选用公布数据直接拟合,从而预测后期疫情发展趋势,这有悖于模型本身的含义.因为模型中的)(t

N实际代表的是t时刻全社会的累计SARS患者,而公布数据仅为同期的累计确诊SARS患者,显然前者是大于或等于后者的.如果把公布数据当成实际数据处理,这必然导致模型解出现偏差,且解的实际意义不明确.对于这一点,我们将在建立自己的模型时重点关注!

2.3早期模型实用性评价

模型的实用性关注的是模型能否真实全面的模拟真实情况,从而用模型指导实际.这里主要抓住早期模型的参数设置情况进行实用性评价:

○1该模型简单地以高峰期作为分析的临界点,这似乎对SARS发展的阶段没有了解透彻.同时,模型没有提出高峰期的确定方法,整个模型的建立必须有实际高峰期附近数据的支撑.如果仅有疫情爆发初期的数据,该模型就无法预测出疫情中后期发展的趋势,模型的实际应用范围受到限制.

○2参数K代表某种社会环境下一个病人每天传染他人的人数,与全社会的警觉程度、政府和公众采取的各种措施有关.在初期,该模型将K固定在一个比较高的定值,在疫情高峰期过后,在10天内逐步调整K值到比较小,然后保持不变.但模型并没有给出K值的具体算法,只是不断地进行人工调整,具有一定的主观性.同时沿用了香港疫情分析中的数据来预测北京的情况,可见该模型未对北京的实际情况进行充分的考虑.

○3参数L代表平均每个病人在被发现前后可以造成直接传染的期限,在此期限后失去传染作用,可能的原因是被严格隔离、病愈不再传染和死去等等.该模型把L的值固定为20,而实际的L应该随疫情发展趋势变化而变化,固定L势必使模型只能片面模拟真实情况.

综上,早期模型的一部分分析脱离了实际,而且在整个模型的建立和求解中人工干预过多,实际应用范围受到了限制,实用性不强.

3. SARS传播过程的分析

由于早期模型缺少对SARS传播过程的系统分析,所以,要建立真正能预测病情发展的模型,应该首先对整个传播过程有一个全面而详尽的分析.

SARS的传播大致经历了4个过程,相关描述可按照Kink于1986年提出的危机“四阶段说”.

第一阶段是征兆期.在SARS传播初期,由于SARS感染者需要经历一定时间才表现出临床症状,所以在病毒实际上已经广泛传播的情况下,政府和公众并未引起注意.在这个时期,携带病毒的传播源没受到控制,平均传播期长,但整个社会的发病率还较低.

第二阶段是迅速爆发期和蔓延期.当公众发现感染者不断增加时,恐慌情绪

增加,政府随即采取多种措施,但由于对病毒传播的特点不清楚,并未收到预期效果.在这个时期,传播源的平均传播期依然较长,整个社会的发病率突然猛增.

第三个阶段是高峰期.当高强度的措施实施后,病毒扩散速度实际已经被控制,发病人数保持稳定,处在一个高平台阶段.在这个时期,有效隔离措施的产生,大大缩短了平均传染期,但由于病患基数较大,社会发病率依然很高.

第四个阶段是衰退期和有效控制期.在高平台现象一段时间以后,控制措施的作用开始显现,患病人数开始下降,进入控制时期.在这个时期,平均感染期最短,社会发病率低.疫情进入了4个阶段的最后时期.

有了以上的分析,建立的模型就应该体现4个不同时期下疫情的发展过程,并能够在此基础上准确预测疫情变化情况,提出切实可行的控制措施.考虑在经典传染病SIR 模型基础上,通过机理分析,加入合理的实际因素,建立适合SARS 的分段微分方程模型,称为SARS 传播的SIR 改进模型.

4. SARS 传播的SIR 改进模型

4.1模型的假设

1.SARS 的持续期不太长,可以忽略在SARS 持续期内的城市人口的自然出生率和自然死亡率.

2.被SARS 感染后经治疗康复的人群在SARS 流行期不会被再次感染. 3.病人被严格隔离、治愈或者死亡后,不再有感染作用.

4.不考虑人口的流动,仅仅在一个城市范围内研究SARS 疫情的发展过程.

4.2模型的符号定义

)(t S :易感类人群占城市人口总数的比例. )(t I :传染类人群占城市人口总数的比例. )(t R :排除类人群占城市人口总数的比例.

)(t ω:SARS 患者的就诊率患者总数

时刻全社会患者数

时刻被隔离的

SARS SARS t t =

λ:单位时间内一个传染者与他人的接触率.

L

:平均传染期.

4.3传播机理分析

针对早期模型的不足,需要在模型的合理性和实用性方面进行改进.考虑在经典传染病模型SIR 的基础上,通过机理分析,用实际因素来描述SARS 的传播过程.

为了简化模型,这里不考虑人口的流动带来的影响,仅仅在一个封闭城市中研究SARS 的传播机理.那么,整个社会人群可以分为3类:

S 类:称为易感类,该类成员没有染上传染病,但缺乏免疫能力,可以被染上传染病.

I 类:称为传染类,该类成员已经染上传染病,而且可以传染给S 类成员. R 类:称为排除类或恢复类,R 类成员或者是I 类成员被严格隔离、治愈,或者死亡等.I 类成员转化为R 类后,立刻失去传染能力.

S(t)、I(t)、R(t)分别表示t 时刻上述3类成员占城市人口总数的比例. 对于传播过程有3条基本假设:

1A :人口总数为常数N ,N 足够大,可以把变量S(t)、I(t)、R(t)视为连续

变量,还可进一步假定为连续可微变量.

2A :人群中3类成员均匀分布,传播方式为接触性传播.单位时间内一个传染者与他人的接触率为λ,则一个传播者在单位时间内与S 类成员的接触率为)(t S λ,因此,单位时间内I 类成员与S 类成员的接触总数为)()(t I t S N ??λ,这就是单位时间内I 类成员增加的数量,称为发病率,它是S(t)和I(t)的双线性函数.

3A :传播者的被控制数正比于传染者的数量)(t NI ,比例系数为v ,v 称为被控制率,则平均传染期为v L /1=.v /λσ=为一个传染者在其传播期内与其他成员的接触总数,称为接触数.

那么SARS 的传播流程如图3:

)()()(t NR t NI t NS vNS NSI 排除类传染类易感类控制

传染???→????→???λ

图3 SARS 传播流程图

在这个模型中,排除类)(t NR 就是已确诊SARS 患者累计数,而)](1[t S N -?是全社会累计SARS 患者数,包括已确诊的和未被发现的两部分.

4.4模型的建立

有了以上的机理分析,建立起针对SARS 的改进SIR 模型:

?

??

?

???

???

???≥>>=++=-=-=0

0,01(2) (1) 000R I S S R I vI

dt dR vI SI dt dI SI dt dS

λλ

该模型中参数λ和v 在疫情发展的各个阶段受实际因素影响,会有比较明显的变化,现分析如下:

○1参数λ表示单位时间内一个传染者与他人的接触率,其与全社会的警觉程度和政府、公众采取的各种措施有关,例如,佩戴口罩,减少停留在公共场所的时间,喷洒消毒药剂,提高隔离强度等都能有效地降低接触率λ的值.

一般认为,λ的数值随着SARS 发展的4个阶段不断变化.在SARS 初期,由于潜伏期的存在和社会对SARS 病毒传播的速度认识不足,政府和公众并未引起重视,故λ维持在一个较高的数值;进入爆发期后,公众发现感染者不断增加,恐慌情绪增加,随即采取多种措施,使λ得到一定的控制,但效果不明显,此处假设λ呈线性形式缓慢衰减;在高峰期,当高强度的控制措施实施后,病毒传播的有效接触率明显减少,可以认为λ按天数呈指数形式衰减;此后进入衰减期,λ就维持在一个较低值附近.

2参数v 表示传播者的被控制率.v L /1=称为平均传染期,表示一个传播者在被隔离或者死亡之前具有传播能力的平均时间.一般认为,SARS 患者经过传染期L 过后,将隔离治疗或者死亡,从I 类成员变为R 类,失去传播能力.

L 与政府采取的措施密切相关,例如,尽量早地发现病患,对疑似病例提前进行隔离,“早发现,早隔离” ;提供更广范围的医疗手段,使更多的人接受有效的治疗等,都可以有效地降低平均传染期L 的长度.因此这里将L 直接抽象为每一时期SARS 患者的就诊率)(t ω的函数.

平均传染期L 应随)(t ω的变化而变化.但是在初期,由于政府对SARS 的认识不足,并没有采取有效控制措施, L 的变化很小可以近似看作定值,这里我们取SARS 病毒最长潜伏期(约19天)为这个定值;在爆发期,有效控制措施的逐步加强,使SARS 患者的就诊率)(t ω逐渐增加,而平均传染期L 会逐渐减小并趋于一个定值,这里我们将SARS 病毒平均潜伏期(约7天)定为L 的最小值;在此后的高峰期以及衰减期,由于控制措施都保持在一定水平,L 的值会维持在7天左右.

4.5针对北京疫情求解模型

首先采用数学推导的方法,确定参数λ和v ,并证明模型有唯一解. ○1确定λ和v 的关系 令v

λ

σ=

,方程组中)1()2(÷得:

S

dS

dI σ1

1+

-=

在病情刚开始时,

1

1S dS

dI σ+

-=,由于)(t S 是单调减少的,且)(t I 最终趋近于0,

则当1≤S σ时,)(t I 单调减少趋近于0;当1>S σ时,)(t I 先单调增加达到最大值,然后单调减少趋近于0.

容易知道,当1>S σ时,才满足SARS 的传播规律,所以参数λ和v 的取值必须满足这个条件. ○

2证明模型有唯一解 在初值条件下解微分方程组:

???

??=+++-=1

11000

R S I S dS

dI

σ 得到关系式:

)ln(

1

1)(0

0S S S R t I σ+

--=

令∞?→?

t ,由○1得 )ln(

1

100

0S S S R ∞∞+

--=σ

因为0>∞S ,所以令

)

ln(

1

1)(0

0S x

x R x f σ

+

--=

则 -∞=?→?)(lim

x f x ,01)(0000>=--=I S R S f

当σ

1

0≤S 时,由于0)(=x f 在),0(0S 范围内有根,因而在)

1,0(σ

内有根.

当σ

1

0>

S 时,因为

x

x

x f σσ-=

1)('

当σ

1

>

x 时,0)('

(00>=>I S f f σ

,因而0)(=x f 在)

1,

0(σ

内也有根.

注意到当σ

1

0<x f ,故0)(=x f 在)

1

,

0(σ

内有唯一根.

所以,∞S 在)1

,

0(σ

内有唯一解.

3划分SARS 传播的4个阶段 由于SARS 的传播经历了4个阶段,所以,要以具体的指标划分这4个阶段.因为在4个阶段中,日发病率)()()(t I t S N t ??=λμ是一个区分每个阶段特点的关键特征,所以以日发病率作为划分的指标.从第一个患者出现日开始: 征兆期:日发病率在10(人/天)以下.北京疫情期的前40天. 爆发期:从日发病率10(人/天)到日发病率最大,即

0=dt

d μ时.北京疫情期的

第40天到第74天.

高峰期:从日发病率最大到患者数量最大,即

=dt

dI 时.北京疫情期的第74天到

第79天.

衰退期:患者数量最大点以后.北京疫情期第79天以后. ○

4确定λ和v 根据北京最终SARS 患者总数2521人以及北京人口总数(约14000000人),得

19998.014000000

25211≈=-

=∞S ,所以

11

>=

λ

σ

v

.

因为平均传染期v

L 1=,而L 是SARS 患者就诊率)(t ω的函数,且]19,7[∈L ,

所以,这里设计L 函数为:

)

(17t e

L ω-=

)(t ω由政府的控制措施决定,它的变化反映了政府控制措施的力度.根据实际情况,推导出:

??

??

?

??≥<≤+-<≤=74

t 174

t 40 )178.340(log 40t 0 0)(10t t ω

而接触率λ与全社会的警觉程度和公众采取的各种措施有关,根据实际情况

确定为:

????

???

??≥<≤-<≤-<≤=79t 0672.079t 74 33

ln 116.074t 40 3400126.040t 0 126.0t t

λ

确定出所有的参数后,做出北京各时期累计全社会SARS 患者数和各时期累计确诊SARS 患者数预测图(图4)以及北京市预测确诊SARS 患者累计和实际确诊SARS 患者累计对比图(图5).同时得到:北京SARS 疫情的预测持续时间为106天,预测SARS 患者累计2514人.(计算程序见附件1:SIR 模型程序

SARS传播的数学模型  数学建模全国赛优秀论文

)

图4 北京市预测非典病人累计总数和预测非典病人确诊病例累计对比图

SARS传播的数学模型  数学建模全国赛优秀论文

图5 北京市预测确诊病例累计和实际确诊病例累计对比图

5.改进SIR模型的分析与评价

5.1合理性评价

从图5可以看出,本模型对数据的拟合程度非常高,完全克服了早期模型对后期数据预测不准的缺陷.做出标准化残差分析图,如图6:

SARS传播的数学模型  数学建模全国赛优秀论文

图6 改进SIR模型的标准化残差分布图(实际值-预测值)

可以看出,残差分布比较均匀,残差平方和为2.0361,低于初期模型的5.510.

通过以上分析得出结论:改进SIR模型不仅在预测前期病情的时候非常准确,而且在预测后期病情的时候也没有出现明显偏差,预测值与实际值非常吻合.该模型能对整个病情的发展做出准确预测,这是该模型优于早期模型的方面之一.

5.2实用性评价

对比早期模型实用性方面的不足,对改进SIR模型分析如下:

○1早期模型在没有对SARS的传播过程进行系统分析的情况下就简单地以高峰期作为分析的临界点,同时,模型并没有提出高峰期的确定方法,模型的实际应用范围受到限制.而改进SIR模型在分析SARS传播过程的前提下,依据日发病率把整个传播过程细分为征兆期,爆发期,高峰期和衰退期4个阶段,并且考虑了每个阶段影响SARS传播的实际因素,能够更好地反映实际因素对SARS传播的影响.

○2早期模型预测的仅仅是已确诊累计SARS患者数,不包括未被发现的患者人数,这样的做法不能对防治工作提供真正有用的数据.而改进SIR模型不仅能准确预测已确诊累计病例,而且能够预测未被发现的患者人数,可以对防治工作提供更有用的数据.

○3早期模型用参数K代表一个病人每天传染他人的人数.模型没有给出K值的具体算法,只是不断地进行人工调整,同时沿用了香港疫情分析中的数据来预测北京的情况,未对北京的实际情况进行充分的考虑.而改进SIR模型用参数λ表示单位时间内一个传染者与他人的接触率,并且考虑了4个阶段内λ的变化情

况,给出了λ的函数表达式.

○4早期模型用参数L代表平均每个病人在被发现前后可以造成直接传染的期限,并且把L的值固定在20天,就造成了后期预测值明显偏离实际值的结果.而改进SIR模型中建立了L的分段函数表达式,根据各个阶段的具体影响因素控制L的大小.这样,在后期的预测上,也与实际值相当吻合.

综上,改进SIR模型弥补了早期模型的不足,实际应用范围得到扩大,实用性强.

5.3建立可靠、优良模型的困难

要建立一个真正能够预测以及能为预防和控制提供可靠、足够的信息的模型,存在着许多的困难,还有许多努力的方向.

○1缺乏详尽的,反映SARS疫情的实际统计数据,以及数据基础上的模型参数的具体取值.本文的模型计算与分析研究,主要依据关于北京市的SARS疫情通告的数据.这些数据不包括未被发现的患者人数的统计,数据的形式不能满足模型求解的要求.

○2需要与流行病学家密切合作,更加合理地设计模型结构与调整参数,以及估计并设定比较符合实际的参数取值,从而完善模型以及模拟结果.

○3需要研究SARS在不同自然条件和社会条件下的差异性,总结SARS传播与控制的典型地域性模式.

6.分析具体措施对SARS传播的影响

在SARS传播的实际过程中,有关部门采取了一些控制疫情的措施,在所有措施中,隔离开始的时间和隔离的强度是两个比较关键的因素,究竟这些因素对疫情传播能造成怎样的影响,现分析如下.

改变隔离开始的时间通过对L调整实现,减小L的数值就提前了隔离时间;而改变隔离的强度通过对λ调整实现,减小λ的数值就提高了隔离的强度.

以北京的隔离强度为100%,分别在100%和80%强度下用改进SIR模型预测不同控制措施下累计病例总数(人)和疫情持续总时间(天).结果如表1:

SARS传播的数学模型  数学建模全国赛优秀论文

分析表1,得出结论:

○1在相同隔离强度下,发现隔离开始的时间越早,累计病例总数就越小.

○2在相同隔离开始时间下,隔离强度越大,疫情持续的时间就越短.

○3综上,累计病例总数的大小主要由隔离开始时间的早晚决定;疫情持续时间的长短主要由隔离强度的大小决定.

所以,有关部门采取的措施确实对疫情的控制起到了很大的作用:“早发现,早隔离”能有效减少累计病例总数;“严格隔离”能有效缩短疫情持续时间.

7.SARS 对旅游业的影响

SARS 的流行会对国民经济带来一定的影响.现在题目提供了北京市接待海外旅游人数的数据,要求根据这些数据,预测SARS 对北京市的旅游业所产生的影响.

7.1预测正常情况下2003年的旅游人数

旅游业随着社会经济的发展,会有一个逐年提高的趋势.如果没有SARS 的流行,那么,海外旅游人数会以一定的规律保持增长的趋势.

现在需要预测正常情况下2003年的旅游人数,采用季节性时间序列的半参数回归模型进行预测.

一般的半参数回归模型是指:

(3) ) (T g Y '∈++=β 其中1),(R R T X P ?∈ 为随机向量或设计点列,T 的支撑集为有界闭集,β为1P ?的未知参数向量, )( g ?是定义于一有界闭集上的未知函数, E 为随机误差,22)E(0, )E(σ=∈=∈(未知),且∈与T X ,相互独立.

对季节性时间序列资料),,2,1;,,2,1(l j n i X ij ==,其中n 为年份长度,l 为季节长度.

根据时间序列资料的加法原理有如下半参数回归模型

(4)

)(j ij j g bi X ε++=

其中b 为模型参数, 主要反应时间序列在年度上的增长趋势.)(j g 为未知函数, 主要反应时间序列在季节上的效应,22)(,0)(σεε==ij ij E E 且ij ε相互独立.显然模型中不应包含常数项,因为常数项可包含在季节效应中.

在对旅游人数的估计时,因为采用了1997~2002年的数据进行参数估计,所以年份长度6=n ,而季节上的效应实际上就是每个月的效应,季节长度12=l .参数估计如下:

○1把b 看为已知时)(j g 的最小二乘估计为使∑--i

ij j g bi X 2

))((最小的解,即

(5)

2

1)(?+?

-=n b X j g

j

其中,∑=

i

ij

j n X

X /,即为所有数据在季节点j 上的均数.显然)(?j g

也是)(j g 的一个临近估计.

○2将(5)代入(4)后b 的最小二乘估计为使∑∑+---i

j

j ij n b

X bi X 2

))

2

1((最小

的解.作变换2

1~,~+-

=-=n i i X X X j ij ij 则

(6) ~~

~?2∑

∑??=i

ij

ij

i

l X i

b

在小样本条件下,误差的总体方差2σ估计为

(7)

)~?~(1

1?21

1

2

i b X l nl n i l

j ij ---=

∑∑

==σ

将北京海外旅游人数1997~2002年的数据代入式(5)、(6)、(7),得到:

?????==0044.0?8245.1?2

σ

b

)

4642.12,1642,18,5808.21,7475.20,0808.21 ,0808.16,3975.16,9975.17,2142.17,5142.12,2808.13,5642.4()(?=j g

根据这些参数,预测正常情况下2003年的旅游人数(计算程序见附件2:时间序列程序),结果如表2(单位:万人):

SARS传播的数学模型  数学建模全国赛优秀论文

1997-2003年旅游人数的变化如图7所示:

SARS传播的数学模型  数学建模全国赛优秀论文

图7 1997-2003年旅游人数的变化

7.2季节性时间序列半参数模型的检验

我们利用时间序列模型对1997~2002年的旅游人数进行拟合,再与实际值对照,画出残差图(图8):

SARS传播的数学模型  数学建模全国赛优秀论文

图8 1997~2002年各月旅游人数估计值的标准化残差

图中,标准化残差随机均匀分布在x轴周围,说明时间序列模型对1997-2002年旅游人数的拟合程度比较高,能够对2003年各个月份的旅游人数做出比较准确的预测.

7.3预测2003年实际旅游人数

实际旅游人数受到SARS的影响,从3月开始下降,在5月达到最低点后开始回升.

做出实际旅游人数

y占预测旅游人数i y?的百分比图,如图9:

i

SARS传播的数学模型  数学建模全国赛优秀论文

图9 实际旅游人数占预测旅游人数的百分比图

对5月以后旅游人数的回升用对数函数进行拟合:

5 t , ?)18.1(5

.1)

10(≥-=-i t i y

e

y 根据这个函数预测出2003年实际旅游人数,如表3(单位:万人):

SARS传播的数学模型  数学建模全国赛优秀论文

旅游人数在9月1日时回复到正常水平的92.6%,在9月4日左右恢复正常水平.2003年的旅游总人数比预期减少116.11万人.若平均每位旅游者花销2000元人民币,则累计经济损失达到23.22亿元人民币,比预计经济收入减少了34.67%.

可以看出,SARS 对旅游业的影响还是比较大的,使整个旅游业收入减少了3成左右.

8.模型的改进方向

本文在传染病SIR 模型的基础上,改进得到了SARS 传播模型.模型能够比较准确地预测出累计病例数,还能隔离时间及隔离措施强度的效果进行分析,具有很好的合理性和实用性.但本模型还有一些可以完善的地方:

1本模型不考虑人口的流动,仅仅在一个城市范围内研究SARS 的传播机理.可以增加参数ij μ表示第i 个城市向第j 个城市的人口流动率,定量地研究相邻的N 个城市之间人口的流动.这样,就需要有关方面提供城市间人口流动数据来确定参数ij μ.

2对SARS 最新研究表明,该病毒对小孩的影响远远小于成年人.因此,可以将模型中R(t)I(t)S(t)、、改变为t)R(a,t)I(a,t)S(a,、、,分别表示t 时刻时易感类、传

染类、恢复类按年龄分布的密度函数.这样,模型就能研究不同年龄层次的病情发展情况.

9.写给报刊的短文

小小“抗非典英雄”

2003年初,春意昂然,万物复苏.没有人预料到,在一片安静祥和之中,一场灾难却悄悄地笼罩在人类社会的上空.

不起眼的咳嗽、发烧,竟然导致了大范围的快速传播,甚至引起死亡,专家们似乎都对这个叫做“非典”的病魔束手无策.一时间,人心惶惶,谣言四起,大家都到了“谈非典色变”的地步.

但是,我们岂会轻易服输?在这个关键时刻,科研工作者聚到一起,运用科学这一有力的武器,向“非典”病魔做出有力的反击.在党中央和国务院的领导下,全国人民齐心协力,同舟共济.终于,在科学和团结面前,嚣张一时的“非

典”病魔低下了头.春回大地,举国欢庆.

亲爱的读者朋友,你是否知道,在这场“非典”攻坚战中,一个叫做“传染病数学模型”的工具,发挥了不可磨灭的作用吗?让我来介绍一下这位小小“抗非典英雄”吧.

传染病数学模型,是科技工作者分析了这次非典爆发的部分数据后,建立的一种研究病情传播规律的工具.这些模型使我们能够对疫情的发展情况做出预测,并估计疫情发展所处的阶段.

首先,传染病模型揭示了非典传播的规律,预测了病情发展的趋势.在那个谣言四起的时期,数学模型肯定地告诉我们,非典是可以战胜的.这颗定心丸的出现,克服了人们的恐惧心理,维持了社会的安定.

其次,通过对模型的分析,我们发现,在病情蔓延时期,对传播源及早的发现、严格隔离,对整个病情发展的控制起到了至关重要的作用.于是,我们提出了“早发现,早隔离”,“加大控制力度”这些措施.事实证明,这是行之有效的.数学模型对实际工作的指导意义也就显现出来.

数学模型还能预测出“非典”对经济的影响,估计经济的恢复速度.

看,名不见经传的传染病数学模型,竟然有如此重要的作用,让大家刮目相看了吧.相信随着研究的继续深入,这位小英雄还会发挥出它更大的本领.

10.参考书目

[1]寿纪麟,数学建模——方法与范例,http://m.wendangku.net/doc/1581d5c158f5f61fb7366674.html/html/19/10070287.htm, 2003年9月23日

[2]胡鞍钢,正确认识SARS危机,民主与科学,第3期:第5~8页,2003

[3]王文昌等,季节性时间序列资料预测的半参数回归模型,中国卫生统计,14

卷第6期:第4~6页,1997

附件

附件1:SIR模型程序

function f=sor

S(1)=14000000;I(1)=1;R(1)=0;na=0.126;F=19;L=19;JU=19;M(1)=1;

for i=2:74 %初期与爆发期if i>=40&i<74

JU=JU-0.25;

end

if i>=40

na=na-0.01/35; %爆发期 缓慢减少end

S(i)=S(i-1)-na*S(i-1)*I(i-1)/14000000; %求解S,I,R if i>L+2

R(i)=S(i-L-2)-S(i-L-1);

else

R(i)=0;

end

if i>=51

F=F-0.5;L=fix(F);

if F==L

R(i)=S(i-L-3)-S(i-L-1);

end

end

I(i)=I(i-1)+na*S(i-1)*I(i-1)/14000000-R(i);

t=log(abs(14000001-S(i)))/log(10);

o(i)=abs(14000001-S(i));p=log(o(i)-o(i-1))/log(10);

plot(i+JU-19,t,'sr'),hold on,plot(i+JU-19,t,'sr'),

if p>0.1

plot(i+JU-19,p,'or'),plot(i+JU-19,p,'or')

end

end

h=na;g(1)=17;n=1;

for i=75:139 %高峰期与衰减期

n=n+1;

if i<80

na=h-log(i-73)/35; %在高峰期急剧减少,此后为一定值end

R(i)=S(i-L-2)-S(i-L-1); %求解S,I,R

S(i)=S(i-1)-na*S(i-1)*I(i-1)/14000000;

I(i)=I(i-1)+na*S(i-1)*I(i-1)/14000000-R(i);

t=log(abs(14000001-S(i)))/log(10);o(i)=abs(14000001-S(i));

p=log(o(i)-o(i-1)+1)/log(10);

plot(i+JU-19,t,'sr'),plot(i+JU-19,p,'or')

end

附件2:时间序列程序

function sjxl

X(1,:)=[9.4 11.3 16.8 19.8 20.3 18.8 20.9 24.9 24.7 24.3 19.4 18.6];

X(2,:)=[9.6 11.7 15.8 19.9 19.5 17.8 17.8 23.3 21.4 24.5 20.1 15.9];

X(3,:)=[10.1 12.9 17.7 21.0 21.0 20.4 21.9 25.8 29.3 29.8 23.6 16.5];

X(4,:)=[11.4 26.0 19.6 25.9 27.6 24.3 23.0 27.8 27.3 28.5 32.8 18.5];

X(5,:)=[11.5 26.4 20.4 26.1 28.9 28.0 25.2 30.8 28.7 28.1 22.2 20.7];

X(6,:)=[13.7 29.7 23.1 28.9 29.0 27.4 26.0 32.2 31.4 32.6 29.2 22.9];

for i=1:12

y(i)=0;

for j=1:6

y(i)=y(i)+X(j,i);

end

y(i)=y(i)/6;

end

for i=1:6 %计算b?、)

g和 ?

(?j

for j=1:12

Z(i,j)=X(i,j)-y(j);

end

end

for i=1:6

p(i)=i-3.5;

end

b=0;q=0;

for i=1:6

for j=1:12

b=b+p(i)*Z(i,j);

end

q=q+p(i)^2;

end

b=b/q/12;

for i=1:12

g(i)=y(i)-b*7/2;

end

si=0;

for i=1:6

for j=1:12

si=(Z(i,j)-b*p(i))^2;

end

end

si=sqrt(si/59);

for i=1:12 %预测2003年无SARS情况下每个月的旅游人数 X7(i)=7*b+g(i)+rand*si;

end

相关推荐
相关主题
热门推荐