文档库 最新最全的文档下载
当前位置:文档库 › 基于复杂网络模型的基因调控网络的计算模拟

基于复杂网络模型的基因调控网络的计算模拟

基于复杂网络模型的基因调控网络的计算模拟
基于复杂网络模型的基因调控网络的计算模拟

第37卷 第1期2010年1月计算机科学Comp uter Science Vol.37No.1J an 2010

到稿日期:2009202220 返修日期:2009205208 本文受上海市重点学科建设项目(项目编号:J 50103),上海大学系统生物研究基金(200825)资助。

张律文 博士生,主要研究方向为高性能计算、生物信息学等,E 2mail :zhanglvwen @https://www.wendangku.net/doc/086462630.html, ;谢 江 博士,副教授,主要研究方向为高性能计算、生物信息学等;陈建娇 博士生,主要研究方向为生物信息学等;张 武 教授,博士生导师,主要研究方向为高性能计算、生物信息学等。

基于复杂网络模型的基因调控网络的计算模拟

张律文1,2 谢 江1,2 陈建娇1 张 武1

(上海大学计算机工程与科学学院 上海200072)1 (上海大学系统生物技术研究所 上海200444)2

 

摘 要 随着大通量基因芯片数据的产生,基因调控机制的网络化研究需求日趋迫切。提出了基于复杂网络理论的基因调控网络的模拟方法,构建了基因调控网络模拟器GN 2Simulator 。通过分析真实基因调控网络的拓扑特性,提出了对应的矩阵模型,并充分考虑了网络的生物学鲁棒性和动力学稳定性,给出了人工基因网络的生成过程和计算模拟方法。计算实验表明,GN 2Simulator 能高效地模拟出与真实基因调控网络高度相似的大规模人工网络,并可为不同算法提供无偏验证的多样化人工模拟数据。关键词 复杂网络,无标度特性,动力学稳定性,模拟,基因调控网络

Artif icial G ene R egulatory N etw orks Construction B ased on Complex N etw ork

ZHAN G L u 2wen 1,2 XIE Jiang 1,2 CH EN Jian 2jiao 1 ZHAN G Wu 1

(School of Computer Engineering and Science ,Shanghai University ,Shanghai 200072,China )1

(Institute of Systems Biology ,Shanghai University ,Shanghai 200444,China )2

 

Abstract Along with the explosion of high 2throughput genomic information produced f rom such as DNA microarrays ,modeling the mechanism of gene regulations and constructing gene regulatory network become an urgent task.We pro 2posed a novel method ,GN 2Simulator ,to simulate gene regulatory networks based on complex network theory.The real gene networks were modeled explicitly in matrixes based on the scale 2f ree topology.According to the robust biological mechanism ,we constructed artificial gene regulatory networks related topology to the dynamic stability.We considered the features of real gene network structures into the artificial system.The computing experiments illustrate that GN 2Simulator can simulate large 2scale gene networks efficiently with high confidence level.Moreover ,G N 2Simulator genera 2tes various synthetic networks for testifying different algorithms performance and provides reasonable estimation on them.

K eyw ords Complex network ,Scale 2f ree topology ,Dynamic stability ,Simulation ,Gene regulatory network

1 引言

复杂生命现象是大量基因互相调控、协同作用的结果。随着基因组测序的完成、基因组学的快速发展,生物学积累了大量的基因调控实验数据,如何挖掘出海量数据所蕴藏的生命现象和生物规律已成为生命科学的研究热点。如今,复杂生物系统的研究开始从对细胞内个别基因功能的局部性描述发展到对复杂基因调控网络(G ene Regulatory Network )的定量刻画。由于基因与其他生物小分子倾向于成组地通过网状的相互作用而影响生物系统的功能,因此对基因功能的研究必须分析其调控网络。

关于基因调控机制的系统性研究,最行之有效的方法就是结合计算机科学和数学等理论把基因之间的复杂相互作用进行整合,并简化成网络,然后建立理论模型,从而研究基因调控网络的结构、网络模块及动力学性质。自2000年Nature 上发表了利用复杂网络就理论研究生物网络拓扑特性[1]的研

究成果之后,复杂网络被广泛地应用于生物网络,包括基因调控网络的构建和模拟等各方面,使得基因网络的研究取得了极大进展。

用来模拟真实基因调控的复杂网络模型经历了几个阶段的发展。最初,简单的随机网络模型[2]被用来描述基因网络的结构,但在1998年,Watts 和Strogats 在结合规则网络和随机网络特点的基础上,建立了小世界(Small 2world )网络模型[3],接着1999年,Barabase 和Albert 发现了真实网络的无标度(Scale 2f ree )性质[4]。在对大规模基因网络进行数据采集和统计分析后,无标度被认为是最接近真实基因网络的一种拓扑结构[5],基因相互作用网络的结构特性可能与其他复杂系统网络(比如Internet 网)在很大程度上是一致的。

在构建人工基因网络的过程中,仅仅关注网络的大体拓扑结构是远远不够的。为了尽可能地模拟出接近真实基因网络的人工网络,构建了基因调控网络模拟器G ene network

simulator (GN 2Simulator ),从以下几个方面系统地考虑了网

?

112?

络特征。

1)网络度分布:在随机一致的原则下挑选出的节点的度数为k的概率为p(k)。

2)网络拓扑结构:无标度网络模型虽然最符合现实复杂网络的论断仍有争议,但依然被认为是目前最接近现实网络特性的模型,因此我们的模拟器采用的是无标度模型。

3)人工网络的鲁棒性:模拟出的网络必须符合动力学稳定性。

GN2Simulator的意义在于,理论上将复杂网络模型与经过大量实验证明的真实基因调控网络特征很好地结合起来,使得模拟网络具有较高的可信度;技术上它为基因调控网络甚至生物网络的模拟提供了有效的一体化解决途径。在更为重要的实际应用中,许多构建基因网络的算法需要得到详细全面的测试,虽然在真实基因网络上可以进行直接而简单的测试实验,但由于已知真实网络的规模有限、类型很少、动力学机制不明等缺点,很容易对特定算法产生偏袒,那么由GN2 Simulator模拟产生的大规模、多类型、参数可控的高可信基因调控网络无疑成为公平系统地验证算法的金标准(gold standard)。本文将开展构建人工基因调控网络的研究,并对基因调控网络的模拟结果进行动力学稳定性分析,给出其应用于算法评估的步骤。

2 基因调控网络模拟器构建

2.1 人工网络的矩阵表示

采用网络来描述基因调控关系是一种简便有效的方法,即把基因简化为节点(vertex),其调控作用简化为节点之间的连线(edge),基因调控网络就是由节点集合V及其节点间边的集合E构成的:

N etw ork=(V,E)

由于邻接矩阵可以用来描述一个网络中节点与节点之间的关系,因此网络的拓扑结构用邻接矩阵A表示:

A N×N=

0a11 (1)

a210 (2)

……ω…

a N1a N2 0

其中,A中的每一个元素a ij代表基因之间的调控关系。考虑到真实调控网络中每个基因的状态改变主要取决于其他基因对它的作用,为了简化分析,基因自身的自调控可以被忽略,即A中对角元素均为0。基因之间的调控关系有两种:激活和抑制,真实调控网络中基因之间的抑制作用通常强于激活作用,且a ij的具体值并不影响网络的整体动力学性质,因此以a ij=-∞表示抑制作用,a ij=1表示激活作用。

此外,在网络的存储方面,由于真实的生物网络大多是稀疏网络,如芽殖酵母的蛋白质相互作用网络的平度连结度仅约为2[6],在储存对应的稀疏矩阵时,如果直接用邻接矩阵表示法,对于一个有n个节点的网络,将占用n2的存储空间,当模拟大规模的全局基因网络时,将产生过高的空间复杂度;因此,采用边列表示法建立了一个以边为元素的数组来记录每条边的出节点和入节点,从而使得整个网络需要占用的存储空间下降为2n。

2.2 给定度分布及基于无标度拓扑模型的网络构建

为了定义一个基因网络模型,必须建立网络的拓扑结构,或是连线图。这包括两方面的工作:一是决定网络中节点(基因)的数量,二是确定对每个节点产生激活或抑制效应的是哪些节点,即每个节点的出入度。在对43个物种的基因网络的度分布进行统计分析[7]后发现,这些网络的入度和出度分布均服从幂率分布:p(k)~k-r,幂指数r约为2.2,为基因网络的无标度拓扑特性提供了又一有力证据。同时,研究表明,当网络的平均连接度在2~3时,网络中的大部分具有生物学意义的动力学行为在此区间产生[8]。如果仅关注某一执行具体功能的子模块,其平均连接度相对高于整个网络的平均连接度,约在2~4之间。因此,在构建基因网络模拟器(GN2Simu2 lator)时,平均连接度的默认区间为k=2~4。另外,人工基因网络的构建也考虑了无标度网络演化的BA模型(Barabase &Albert model)的内在机制:网络规模的增长和择优连结。根据这种无标度特性,网络不断有新节点加入,且倾向于与度数较高的节点连接,那么,网络中连接度高的节点往往是网络形成过程中较早加入的节点。基于真实基因网络以上特性的分析,模拟真实基因网络的过程概括如下:

步骤1 基因网络初始状态:m0个节点,e0条边,m0个节点被随机分为l个子集,那么每个子集中各有m01,m02,…, m0l个节点,e01,e02,…,e0l条边。

步骤2 增加新节点。一个新节点首先被随机分到一个子集中,随着新节点的加入将产生m条入边或m条出边,其中m≤Min(m01,m02,…,m0l)。

步骤3 产生新的入边。当新节点以概率p产生m条入边时,系统首先随机为新节点在初始网络中选择一个子集,然后在该子集中偏好选取m-1个节点与之相连。原则为:择优选择连接节点的概率取决于该节点的入度。与此同时新节点的另一条边也在择优连接的原则下与另一个子集的节点相连。

步骤4 产生新的出边。当新节点以概率q产生m条出边时,也随机为新节点在初始网络中选择一个子集,并在该子集中偏好选取m-1个节点与之相连。原则为:择优选择连接节点的概率取决于该节点的出度。同时新节点的另一条边也在择优连接的原则下与另一个子集的节点相连。

步骤5 重复步骤2-4,同时统计节点数,直到网络增长到需要的规模为止。

通过以上步骤,初步构建了GN2Simulator。

2.3 人工网络的鲁棒性和动力学稳定性

生物系统和调控网络的基本性质是鲁棒性和稳定性[9],这两种重要的性质有利于生物应对复杂多变的外界环境和不断受到扰动的内部环境,甚至在某些基因缺失的情况下,整体的生物状态和重要的基本功能还能够保持稳定。因此,如何构建出具有动力学稳定性的人工网络是一项重要的研究内容。我们必须首先清楚地分析生物调控网络是如何实现鲁棒性和稳定性的。一方面通过网络的结构性质[10],例如基因的冗余性、功能模块化、网络中的负反馈机制,可以实现稳定性。另一方面,生物系统可以通过网络的整体结构和动力学性质来实现鲁棒性[11]。这种由网络的整体性质产生的鲁棒性是本文关注的重点。

在建立好基因调控网络的理论模型后,将进一步研究其网络的动力学稳定性,包括状态稳定性和结构稳定性。状态稳定性指研究网络中不同节点所代表的基因数量发生变化

?

2

1

2

?

时,网络所执行的生物学过程能否继续。结构稳定性指网络中不同节点的具体数值所代表的基因相互作用的强度发生改变时生物学状态的稳定性。

在模拟基因调控网络的过程中,为了构建具有动力学稳定性的人工网络,我们进行了具有全局稳定不动点的骨架网络的设计。在一个网络中,具有最少的边数且对整个网络的整体动力学性质起决定性作用的一个连通子集被称为该网络的骨架网。为了保证网络的整体动力学性质,这个特殊的子网是不能随意改变的。在网络的除骨架网之外的拓扑结构上进行随机扰动,例如,随机删除或增加一条边,抑或改变一条边的属性,如果网络仍然定性地保持其整体动力学性质不变,就成功构建了一个拓扑结构上具有鲁棒性的人工网络[12]。

此外,为验证模拟网络的稳定性,可以计算其相关矩阵的特征根,如果所有特征根实部为负或最大特征根实部为负,系统必将趋于稳定。同时,最大负特征根的绝对值越大,系统在经历微小的扰动后趋于稳定的速度将越快。

3 数值试验及应用分析

如前所述,GN 2simulator

建立的一个重要目的在于为全面评估基因调控关系的预测算法提供“金标准”人工网络。首先,在应用于算法评估之前我们验证了人工基因调控网络的动力学稳定性。基于GN 2simulator ,本文模拟产生了10个有着不同平均连接度的基因调控网络样本,其平均连接度k =3.9,抑制作用关系与激活作用关系之比r =0.7,网络规模为节点数n =100,网络拓扑为具有小世界特性的无标度结构。图1给出了一个人工网络的动力学稳定性示例,在加给系统一个微小的扰动后,可以看出整个系统在10个时间步内快速收敛并达到平衡状态。

图1 微扰后网络中所有节点随时间收敛图

同时,从著名的基因调控和基因组数据库KEGG [13]及

NCBI [14]数据库中收集了人类转录因子调控网络、酵母基因调控网络和蛋白质组网络,将它们的网络拓扑性质与GN 2Simulator 模拟的网络进行对比,如表1所列,本文模拟的基因调控网络与真实网络相比具有高相似性。

表1 拓扑性质比较

GN 2Simulator

H TFN Y east Proteome Average degree 3 3.7 3.7 2.4Average clustering 0.130.170.150.7Average path length 4.7 4.5 4.15 6.81Assortative mixing

-0.16

-0.18

-0.05

-0.15

将GN 2Simulator 产生的并经过动力学稳定性测试和相

似性实验证明的人工基因调控网络用于算法评估,以比较在不同的网络参数下各个预测算法的整体表现,从而公平地反映出算法的优缺点以及对于特定网络的预测偏好。应用GN 2Simulator 产生的人工基因调控网络进行算法评估的步骤如

下。

1)网络参数设置:根据用户选择,生成n 个具有不同网络规模、平均度(average 2degree )、平均路径长度(average path length )、群聚系数(clustering coefficient )和介数(vertex be 2tweenness and edge betweenness )的人工基因调控网络。

2)网络模拟:根据每个网络生成相应的邻接矩阵,记为A 1,A 2,…,A n ,以稀疏矩阵的形式表示,并以边列表的形式储存。

3)稳定性检验:随机选取矩阵中一定数量的节点,将其数值增加0.1(保证扰动足够微小,以免使整个系统偏离平衡点过大),检测整体网络在一定时间步内的收敛性,如果不符合动力学稳定性,可进行修正:将对角元素减去矩阵的最大特征值,这样既不会改变网络的拓扑结构和度分布等特性,同时又保证了系统的稳定。

4)结果比对:用户以矩阵形式提交其算法预测出来的基因调控网络,记为A 1′,A 2′,…,A n ′,将A 与A ′进行相似性比对,给出正确率、召回率和覆盖率等统计性比较结果。表2给出了不同网络参数下几种典型算法的表现情况。

表2 不同人工网络测试样本下的算法表现

Algorithms Coverage (Number of nodes ,average degree )(50,2)(200,2)(500,2)(500,3)(500,4)SWN I

[15]

65%95%97%91%85%ARACN E 84%77%63%64%68%BANJ O 76%72%58%58%59%Clustering

63%

55%

53%

57%

60%

从表2可以看出,不同的算法均对网络规模和网络平均

度敏感,但敏感趋势和敏感度不同。SWN I 在大规模稀疏网络的预测方面相对其它算法表现较优,但其预测覆盖率却随着网络稠密化而降低。另外,可以明显看出ARACN E 等3种算法的预测覆盖率随着网络规模的增大而下降,但似乎在对较稠密网络的预测中有较好的表现。

结束语 本文提出了专门针对基因调控网络的人工网络建立模型。与其他的复杂网络分析软件Pajek ,Netdraw 和Ucient 等比较,GN 2Simulator 具有很强的针对性和生物信息学应用性,为系统生物领域的研究人员提供了基因网络模拟工具。数值试验结果显示,GN 2Simulator 产生的网络与真实基因调控网络相比,在整体结构和动力学性质上有很高的相似性,能弥补真实网络规模不足等缺点,为各种基因调控关系预测算法提供了大量多种类的测试网络数据集;同时,它集成了算法评估、比较和分析功能,对算法在不同网络数据集上的表现进行打分,为生物网络结构及其预测算法提供了一个高效、合理的计算实验平台。

参考文献

[1]

J eong H ,Tombor B ,Albert R ,et al.The large 2scale organization of metabolic networks[J ].Nature ,2000,407:6512654[2]

Erd s P ,R ényi A.On random graphs[J ].Publ Mat h Debrecen ,1959,6:2902297[3]

Strogatz S H.Exploring complex networks [J ].Nature ,2001,410:2682276[4]

Barabasi A L ,Albert R.Emergence of scaling in random net 2works[J ].Science ,1999,286:5092512

(下转第221页)

0,x i ∈X ΙΙ,X ΙΙΙ最优解为x i =-1,x i ∈X ΙΙΙ。

正如尚荣华等人认为[6],该问题的理论Pareto 面满足f 2=

1-

f 1

(H (t )+153(1+H (t ))2)-1

,而不是由凸变为非凸。为了观察方

便,将目标函数值f 1和f 2都平移0.5t 。在该测试问题中,|X Ι|=1,|X ΙΙ|=|X ΙΙΙ=15。

从图4(a )、图4(b )和图4(c )可知算法DM EIA 所搜索到的最优解与其他两种算法相比分布更均匀。DNSGAII 2A 好于DBM ,但在f 2接近1时很难找到最优解。从图4(d )可知DM EIA 相对其他两种算法其收敛的最小值不如其他两种算法小,但DM EIA 随时间变化波动较小,相对平稳

图4 DMOP2的3种算法的仿真结果图

5.2.3 DMOP3

DMOP3是第2种类型,且该问题的理论Pareto 面满足f 2=(1+G (t ))3(1-

f 1),且0≤G (t )≤1,1-f 1≤

1,由此可知f 2≤2。在该测试问题中,X Ι=5,X ΙΙ=25。

从图5(a )、图5(b )和图5(c )可知算法DM EIA 所得最优解明显好于其他两种算法,并且DNSGA II 2A 和DBM 均不能找到Pareto 面上的全部解。从图5(d )可知DM EIA 相对其他两种算法其随时间变化波动较小,

相对平稳。DBM 收敛的最小值最小。

结束语 本文提出了一种新的动态多目标人工免疫系统模型,并给出了模型的核心元素———DM EIA 算法。算法结合了进化算法与免疫算法的优良特性,适时地调用模型规则集R 中的环境追踪规则,并采用基于Parzen 窗估计法进行信

息熵的密度估计。仿真实验表明DM EIA 具有很强的环境追

踪能力及全局搜索能力,在收敛性、分布性方面也体现了良好的效果,这些充分验证了模型的综合性能。

图5 DMOP3的3种算法的仿真结果图

参考文献

[1]

Wang Yuping ,Dang Chuangyin.An evolutionary algorit hm for dynamic multi 2objective optimization [J ].Applied Mat hematics and Computation ,2008,205(1):6218[2]

Jin Y ,Branke J.Evolutionary Optimization in Uncertain Envi 2ronment s —A Survey[J ].IEEE Transactions Evolutionary Com 2putation ,2005,9(3):3032317[3]

尚荣华,焦李成,公茂果,等.免疫克隆算法求解动态多目标优化问题[J ].软件学报,2007,11(8):270022711

[4]郑金华.多目标进化算法及其应应用[M ].北京:科学出版社,

2007:1210

[5]

Farina M ,Deb K ,Amato P.Dynamic multiobjective optimization problems :test case ,approximations ,and applications [J ].IEEE T ransactions on Evolutionary C omputation ,2004,8(5):4252442[6]

Deb K ,Uda YA B R N ,Kart hik S.Dynamic multi 2objective opti 2mization and decision 2making using modified NSGA 2II :a case study on hydro 2t hermal power scheduling bi 2objective optimiza 2tion problems[R ].Kan GAL Report.2006

(上接第213页)

[5]

Soranzo N ,Bianconi G ,Altafini https://www.wendangku.net/doc/086462630.html,paring association net 2work algorit hms for reverse engineering of large 2scale gene re 2gulatory networks :synt hetic versus real data [J ].Bioinformati 2cs ,2007,23:164021647[6]

Lee T I ,Rinaldi N J ,Robert F ,et al.Transcriptional regulatory networks in Saccharomyces cerevisiae [J ].Science ,2002,298:7992804[7]Tyers M.Cell cycle goes global [J ].Curr Opin Cell Biol ,2004,16:6022613

[8]

Li F T ,Long T ,Lu Y ,et al.The yeast cell 2cycle cutwork is ro 2bustly designed[J ]https://www.wendangku.net/doc/086462630.html,A ,2004,101:478124786[9]

K itano H.Biological rebustness [J ].Nature Reviews Genetics ,2004,5:8262837

[10]Fengli R ,Jinde C.Asymptotic and robust stability of genetic

regulatory networks wit h time 2varying delays [J ].Nerocompu 2

ting ,2008,71:8342842

[11]Crombach A ,Hogeweg P.Evolution of Evolvability in Gene

Regulatory Networks[J ].PLoS Comput Biol ,2008,4

[12]Xiaohua L ,Hongyan G ,Yuanwei J.Robust decentralized con 2

nective stabilization for expanding construction of large 2scale systems[C]∥Automation and Logistics ,2008.ICAL 2008.Sept 2008:112121125

[13]National Center for Biotechnology Instit ute[OL ].http ://www.

https://www.wendangku.net/doc/086462630.html,/

[14]Kyoto Endyclopedia of Genes and Genomes[OL ].http ://www.

genome.jp/kegg/

[15]Luwen Z ,Wu Z ,Mei X ,et al.Reverse engineering large 2scale

gene networks using linear model and robust regression synthetic versus real data.待发表

阿尔法资产模型及计算方法

阿尔法资产模型及计算方法 阿尔法资产(Alpha investment)是一种风险调整过的积极投资回报。它是根据所承担的超额风险而得到的回报,因此经常用来衡量基金经理的管理和表现水平。通常会在计算时,将基准的回报减去,以便看出它的相对水平。 阿尔法资产是资本资产定价模型中的一个量效率市场假说阿尔法系数为零 计算公式: 其中的阿尔法系数(αi)是资本资产定价模型中的一个量,是证券特征线与纵坐标的截距。在效率市场假说中,阿尔法系数为零。 阿尔法系数(α系数,Alpha(α)Coefficient) α系数的定义:α系数是一投资或基金的绝对回报(Absolute Return) 和按照β系数计算的预期回报之间的差额。绝对回报(Absolute Return)或额外回报(Excess Return)是基金/投资的实际回报减去无风险投资收益(在中国为1年期银行定期存款回报)。绝对回报是用来测量一投资者或基金经理的投资技术。预期回报(Expected Return)贝塔系数β和市场回报的乘积,反映投资或基金由于市场整体变动而获得的回报。 一句话,平均实际回报和平均预期回报的差额即α系数。 α系数计算方法 α系数简单理解 α>0,表示一基金或股票的价格可能被低估,建议买入。亦即表示该基金或股票以投资技术获得平均比预期回报大的实际回报。 α<0,表示一基金或股票的价格可能被高估,建议卖空。亦即表示该基金或股票以投资技术获得平均比预期回报小的实际回报。 α=0,表示一基金或股票的价格准确反映其内在价值,未被高估也未被低估。亦即表示该基金或股票以投资技术获得平均与预期回报相等的实际回报。 例子分析

复杂网络模型的matlab实现

function [DeD,aver_DeD]=Degree_Distribution(A) %% 求网络图中各节点的度及度的分布曲线 %% 求解算法:求解每个节点的度,再按发生频率即为概率,求P(k) %A————————网络图的邻接矩阵 %DeD————————网络图各节点的度分布 %aver_DeD———————网络图的平均度 N=size(A,2); DeD=zeros(1,N); for i=1:N % DeD(i)=length(find((A(i,:)==1))); DeD(i)=sum(A(i,:)); end aver_DeD=mean(DeD); if sum(DeD)==0 disp('该网络图只是由一些孤立点组成'); return; else figure; bar([1:N],DeD); xlabel('节点编号n'); ylabel('各节点的度数K'); title('网络图中各节点的度的大小分布图'); end figure; M=max(DeD); for i=1:M+1; %网络图中节点的度数最大为M,但要同时考虑到度为0的节点的存在性 N_DeD(i)=length(find(DeD==i-1)); % DeD=[2 2 2 2 2 2] end P_DeD=zeros(1,M+1); P_DeD(:)=N_DeD(:)./sum(N_DeD); bar([0:M],P_DeD,'r'); xlabel('节点的度 K'); ylabel('节点度为K的概率 P(K)'); title('网络图中节点度的概率分布图'); 平均路径长度 function [D,aver_D]=Aver_Path_Length(A) %% 求复杂网络中两节点的距离以及平均路径长度 %% 求解算法:首先利用Floyd算法求解出任意两节点的距离,再求距离的平均值得平均路

基因调控网络的重构及其疾病学应用

上海交通大学 硕士学位论文 基于基因芯片数据的基因调控网络的重构及其疾病学应用 姓名:蒋强 申请学位级别:硕士 专业:控制理论与控制工程 指导教师:杨根科 20090201

基于基因芯片数据的基因调控网络的重构及其疾病学应用 摘要 随着高通量生物学技术的发展,为以单个分子的结构和功能为研究对象的分子生物学逐渐转变为以分子之间相互作用机理为研究对象的系统生物学。基因调控网络的重构和疾病基因的预测是系统生物学中颇具挑战性的两个课题。 基因调控网络是由一组基因、蛋白质、小分子以及它们之间的相互调控作用所构成的一种生化网络,是生命功能在基因表达层面上的展现。研究基因调控网络的目的是通过建立基因调控网络模型对某一个物种或者组织中的全部基因的表达关系进行整体模拟分析和研究,在系统的框架下认识生命现象。 另一方面,随着疾病学研究的深入开展,人们越来越认识到目前单基因疾病分析方法的局限性,越来越多的研究人员开始从基因的相互关系着手研究人类疾病,更多地关注基因与疾病之间的关联关系。 作为网络分析的基础,论文首先给出了基于谱聚类的复杂网络社团结构剖分算法。然后,提出了基因调控网络的多时延动态贝叶斯模型。在此基础上,论文提出了一种新的两步启发式的模型结构学习算法。接着,论文详细阐述了疾病和基因网络的关系,构建了一个整合的症状-基因网络。随后提出了一种基于症状网络模块化利用一致性分数来预测疾病基因的算法。论文的主要贡献如下: 1.首次证明了数据聚类的谱方法可以最大化网络模块函数Q,并且

提出了一种基于谱聚类的网络社团结构的剖分算法框架; 2.构建了基因调控网络的多时延动态贝叶斯网络模型,提出了一种 新的两步启发式的模型结构学习算法。论文用酵母基因芯片表达 数据重构了酵母细胞周期基因调控网络,以此比较了新方法和传 统的动态贝叶斯方法。 3.论文初步给出了利用症状和基因网络关系来预测疾病基因的方 法框架,构建了一个整合的症状-基因网络,提出了一种基于该 网络模块化利用一致性分数来预测疾病基因的方法。 关键词:基因调控网络,症状-基因对应关系,疾病基因预测,网络模块,社团结构,谱聚类,动态贝叶斯网络,一致性分数

神经网络一个简单实例

OpenCV的ml模块实现了人工神经网络(Artificial Neural Networks,ANN)最典型的多层感知器(multi-layer perceptrons, MLP)模型。由于ml模型实现的算法都继承自统一的CvStatModel基类,其训练和预测的接口都是train(),predict(),非常简单。 下面来看神经网络CvANN_MLP 的使用~ 定义神经网络及参数: [cpp]view plain copy 1.//Setup the BPNetwork 2. CvANN_MLP bp; 3.// Set up BPNetwork's parameters 4. CvANN_MLP_TrainParams params; 5. params.train_method=CvANN_MLP_TrainParams::BACKPROP; 6. params.bp_dw_scale=0.1; 7. params.bp_moment_scale=0.1; 8.//params.train_method=CvANN_MLP_TrainParams::RPROP; 9.//params.rp_dw0 = 0.1; 10.//params.rp_dw_plus = 1.2; 11.//params.rp_dw_minus = 0.5; 12.//params.rp_dw_min = FLT_EPSILON; 13.//params.rp_dw_max = 50.; 可以直接定义CvANN_MLP神经网络,并设置其参数。BACKPROP表示使用 back-propagation的训练方法,RPROP即最简单的propagation训练方法。 使用BACKPROP有两个相关参数:bp_dw_scale即bp_moment_scale: 使用PRPOP有四个相关参数:rp_dw0, rp_dw_plus, rp_dw_minus, rp_dw_min, rp_dw_max:

BP神经网络模型应用实例

BP神经网络模型 第1节基本原理简介 近年来全球性的神经网络研究热潮的再度兴起,不仅仅是因为神经科学本身取得了巨大的进展.更主要的原因在于发展新型计算机和人工智能新途径的迫切需要.迄今为止在需要人工智能解决的许多问题中,人脑远比计算机聪明的多,要开创具有智能的新一代计算机,就必须了解人脑,研究人脑神经网络系统信息处理的机制.另一方面,基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径.它对传统的计算机结构和人工智能是一个有力的挑战,引起了各方面专家的极大关注. 目前,已发展了几十种神经网络,例如Hopficld模型,Feldmann等的连接型网络模型,Hinton等的玻尔茨曼机模型,以及Rumelhart等的多层感知机模型和Kohonen的自组织网络模型等等。在这众多神经网络模型中,应用最广泛的是多层感知机神经网络。多层感知机神经网络的研究始于50年代,但一直进展不大。直到1985年,Rumelhart等人提出了误差反向传递学习算法(即BP算),实现了Minsky的多层网络

设想,如图34-1所示。 BP 算法不仅有输入层节点、输出层节点,还可有1个或多个隐含层节点。对于输入信号,要先向前传播到隐含层节点,经作用函数后,再把隐节点的输出信号传播到输出节点,最后给出输出结果。节点的作用的激励函数通常选取S 型函数,如 Q x e x f /11)(-+= 式中Q 为调整激励函数形式的Sigmoid 参数。该算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐含层逐层处理,并 传向输出层。每一层神经元的状态只影响下一层神经

复杂网络理论及其研究现状

复杂网络理论及其研究现状 复杂网络理论及其研究现状 【摘要】简单介绍了蓬勃发展的复杂网络研究新领域,特别是其中最具代表性的是随机网络、小世界网络和无尺度网络模型;从复杂网络的统计特性、复杂网络的演化模型及复杂网络在社会关系研究中的应用三个方面对其研究现状进行了阐述。 【关键词】复杂网络无标度小世界统计特性演化模型 一、引言 20世纪末,以互联网为代表的信息技术的迅速发展使人类社会步入了网络时代。从大型的电力网络到全球交通网络,从Internet 到WWW,从人类大脑神经到各种新陈代谢网络,从科研合作网络到国际贸易网络等,可以说,人类生活在一个充满着各种各样的复杂网络世界中。 在现实社会中,许多真实的系统都可以用网络的来表示。如万维网(WWW网路)可以看作是网页之间通过超级链接构成的网络;网络可以看成由不同的PC通过光缆或双绞线连接构成的网络;基因调控网络可以看作是不同的基因通过调控与被调控关系构成的网络;科学家合作网络可以看成是由不同科学家的合作关系构成的网络。复杂网络研究正渗透到数理科学、生物科学和工程科学等不同的领域,对复杂网络的定性与定量特征的科学理解,已成为网络时代研究中一个极其重要的挑战性课题,甚至被称为“网络的新科学”。 二、复杂网络的研究现状 复杂网络是近年来国内外学者研究的一个热点问题。传统的对网络的研究最早可以追溯到18世纪伟大数学家欧拉提出的著名的“Konigsberg七桥问题”。随后两百多年中,各国的数学家们一直致力于对简单的规则网络和随机网络进行抽象的数学研究。规则网络过于理想化而无法表示现实中网络的复杂性,在20世纪60年代由Erdos和Renyi(1960)提出了随机网络。进入20世纪90年代,人们发现现实世界中绝大多数的网络既不是完全规则,也不是完全随机

几种神经网络模型及其应用

几种神经网络模型及其应用 摘要:本文介绍了径向基网络,支撑矢量机,小波神经网络,反馈神经网络这几种神经网络结构的基本概念与特点,并对它们在科研方面的具体应用做了一些介绍。 关键词:神经网络径向基网络支撑矢量机小波神经网络反馈神经网络Several neural network models and their application Abstract: This paper introduced the RBF networks, support vector machines, wavelet neural networks, feedback neural networks with their concepts and features, as well as their applications in scientific research field. Key words: neural networks RBF networks support vector machines wavelet neural networks feedback neural networks 2 引言 随着对神经网络理论的不断深入研究,其应用目前已经渗透到各个领域。并在智能控制,模式识别,计算机视觉,自适应滤波和信号处理,非线性优化,语音识别,传感技术与机器人,生物医学工程等方面取得了令人吃惊的成绩。本文介绍几种典型的神经网络,径向基神经网络,支撑矢量机,小波神经网络和反馈神经网络的概念及它们在科研中的一些具体应用。 1. 径向基网络 1.1 径向基网络的概念 径向基的理论最早由Hardy,Harder和Desmarais 等人提出。径向基函数(Radial Basis Function,RBF)神经网络,它的输出与连接权之间呈线性关系,因此可采用保证全局收敛的线性优化算法。径向基神经网络(RBFNN)是 3 层单元的神经网络,它是一种静态的神经网络,与函数逼近理论相吻合并且具有唯一的最佳逼近点。由于其结构简单且神经元的敏感区较小,因此可以广泛地应用于非线性函数的局部逼近中。主要影响其网络性能的参数有3 个:输出层权值向量,隐层神经元的中心以及隐层神经元的宽度(方差)。一般径向基网络的学习总是从网络的权值入手,然后逐步调整网络的其它参数,由于权值与神经元中心及宽度有着直接关系,一旦权值确定,其它两个参数的调整就相对困难。 其一般结构如下: 如图 1 所示,该网络由三层构成,各层含义如下: 第一层:输入层:输入层神经元只起连接作用。 第二层:隐含层:隐含层神经元的变换函数为高斯核. 第三层:输出层:它对输入模式的作用做出响应. 图 1. 径向基神经网络拓扑结构 其数学模型通常如下: 设网络的输入为x = ( x1 , x2 , ?, xH ) T,输入层神经元至隐含层第j 个神经元的中心矢 为vj = ( v1 j , v2 j , ?, vIj ) T (1 ≤j ≤H),隐含层第j 个神经元对应输入x的状态为:zj = φ= ‖x - vj ‖= exp Σx1 - vij ) 2 / (2σ2j ) ,其中σ(1≤j ≤H)为隐含层第j个神

小世界复杂网络模型研究

小世界复杂网络模型研究 摘要:复杂网络在工程技术、社会、政治、医药、经济、管理领域都有着潜在、广泛的应用。通过高级计算机网络课程学习,本文介绍了复杂网络研究历史应用,理论描述方法及阐述对几种网络模型的理解。 1复杂网络的发展及研究意义 1.1复杂网络的发展历程 现实世界中的许多系统都可以用复杂网络来描述,如社会网络中的科研合作网、信息网络中的万维网、电力网、航空网,生物网络中的代谢网与蛋白质网络。 由于现实世界网络的规模大,节点间相互作用复杂,其拓扑结构基本上未知或未曾探索。两百多年来,人们对描述真实系统拓扑结构的研究经历了三个阶段。在最初的一百多年里,科学家们认为真实系统要素之间的关系可以用一些规则的结构表示,例如二维平面上的欧几里德格网;从20世纪50年代末到90年代末,无明确设计原则的大规模网络主要用简单而易于被多数人接受的随机网络来描述,随机图的思想主宰复杂网络研究达四十年之久;直到最近几年,科学家们发现大量的真实网络既不是规则网络,也不是随机网络,而是具有与前两者皆不同的统计特性的网络,其中最有影响的是小世界网络和无尺度网络。这两种网络的发现,掀起了复杂网络的研究热潮。 2复杂网络的基本概念 2.1网络的定义 自随机图理论提出至今,在复杂网络领域提出了许多概念和术语。网络(Network)在数学上以图(Graph)来表示,图的研究最早起源于18世纪瑞士著名数学家Euler的哥尼斯堡七桥问题。复杂网络可以用图论的语言和符号精确简洁地加以描述。图论不仅为数学家和物理学家提供了描述网络的语言和研究的平台,而且其结论和技巧已经被广泛地移植到复杂网络的研究中。 网络的节点和边组成的集合。节点为系统元素,边为元素间的互相作用(关系)。若用图的方式表示网络,则可以将一个具体网络可抽象为一个由点集V和

神经网络应用实例

神经网络 在石灰窑炉的建模与控制中的应用神经网络应用广泛,尤其在系统建模与控制方面,都有很好应用。下面简要介绍神经网络在石灰窑炉的建模与控制中的应用,以便更具体地了解神经网络在实际应用中的具体问题和应用效果。 1 石灰窑炉的生产过程和数学模型 石灰窑炉是造纸厂中一个回收设备,它可以使生产过程中所用的化工原料循环使用,从而降低生产成本并减少环境污染。其工作原理和过程如图1所示,它是一个长长的金属圆柱体,其轴线和水平面稍稍倾斜,并能绕轴线旋转,所以又 CaCO(碳酸钙)泥桨由左端输入迴转窑,称为迴转窑。含有大约30%水分的 3 由于窑的坡度和旋转作用,泥桨在炉内从左向右慢慢下滑。而燃料油和空气由右端喷入燃烧,形成气流由右向左流动,以使泥桨干燥、加热并发生分解反应。迴转窑从左到右可分为干燥段、加热段、煅烧段和泠却段。最终生成的石灰由右端输出,而废气由左端排出。 图1石灰窑炉示意图 这是一个连续的生产过程,原料和燃料不断输入,而产品和废气不断输出。在生产过程中首先要保证产品质量,包括CaO的含量、粒度和多孔性等指标,因此必须使炉内有合适的温度分布,温度太低碳酸钙不能完全分解,会残留在产品中,温度过高又会造成生灰的多孔性能不好,费燃料又易损坏窑壁。但是在生产过程中原料成分、含水量、进料速度、燃油成分和炉窑转速等生产条件经常会发生变化,而且有些量和变化是无法实时量测的。在这种条件下,要做到稳定生产、高质量、低消耗和低污染,对自动控制提出了很高的要求。 以前曾有人分析窑炉内发生的物理-化学变化,并根据传热和传质过程来建立窑炉的数学模型,认为窑炉是一个分布参数的非线性动态系统,可以用二组偏

神经网络模型应用实例

BP 神经网络模型 近年来全球性的神经网络研究热潮的再度兴起,不仅仅是因为神经科学本身取得了巨大的进展.更主要的原因在于发展新型计算机和人工智能新途径的迫切需要.迄今为止在需要人工智能解决的许多问题中,人脑远比计算机聪明的多,要开创具有智能的新一代计算机,就必须了解人脑,研究人脑神经网络系统信息处理的机制.另一方面,基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径.它对传统的计算机结构和人工智能是一个有力的挑战,引起了各方面专家的极大关注. 目前,已发展了几十种神经网络,例如Hopficld 模型,Feldmann 等的连接型网络模型,Hinton 等的玻尔茨曼机模型,以及Rumelhart 等的多层感知机模型和Kohonen 的自组织网络模型等等。在这众多神经网络模型中,应用最广泛的是多层感知机神经网络。多层感知机神经网络的研究始于50年代,但一直进展不大。直到1985年,Rumelhart 等人提出了误差反向传递学习算法(即BP 算),实现了Minsky 的多层网络设想,如图34-1所示。 BP 算法不仅有输入层节点、输出层节点,还可有1个或多个隐含层节点。对于输入信号,要先向前传播到隐含层节点,经作用函数后,再把隐节点的输出信号传播到输出节点,最后给出输出结果。节点的作用的激励函数通常选取S 型函数,如 Q x e x f /11 )(-+= 式中Q 为调整激励函数形式的Sigmoid 参数。该算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。每一层神经元的状态只影响下一层神经元的状态。如果输出层得不到期望的输出,则转入反向传播,将误差信号沿原来的连接通道返回,通过修改各层神经元的权值,使得误差信号最小。 社含有n 个节点的任意网络,各节点之特性为Sigmoid 型。为简便起见,指定网络只有一个输出y ,任一节点i 的输出为O i ,并设有N 个样本(x k ,y k )(k =1,2,3,…,N ),对某一输入x k ,网络输出为y k 节点i 的输出为O ik ,节点j 的输入为net jk = ∑i ik ij O W 并将误差函数定义为∑=-=N k k k y y E 12 )(21

开源软件的复杂网络分析及建模

第4卷第3期 复杂系统与复杂性科学 Vol.4No.3 2007年9月 C OMP LEX SYSTE M S AND COM P LEX I TY SC I E NCE Sep.2007 文章编号:1672-3813(2007)03-0001-09 开源软件的复杂网络分析及建模 郑晓龙,曾大军,李慧倩,毛文吉,王飞跃,戴汝为 (中国科学院自动化研究所复杂系统与智能科学重点实验室,北京100080) 摘要:开源软件现在变得越来越复杂。把开源软件看作复杂网络并进行研究,有助 于更好地理解软件系统。同时,开源软件是一种较为复杂的人工系统,通过对它们 的研究也可以推动复杂网络理论的应用。以一种基于源代码包的L inux操作系 统———Gent oo L inux操作系统为研究对象,我们把该系统中的软件包抽象成节点, 软件包之间的依赖关系抽象成边,以此建立复杂网络,并对其进行了分析。发现已 有模型不能很好地描述与预测Gent oo网的演化过程,因此,提出了一种新的演化模型。在该模型中,网络现有节点连接新节点的概率不但与现有节点的度有关系,而且也受到现有节点“年龄”的影响。还通过计算机仿真实验把仿真数据与Gent oo真实数据进行了比较,结果显示,新模型更为适合Gent oo网。 关键词:复杂网络;Gent oo;聚集系数;度分布;模型 中图分类号:N94;TP393;TP31文献标识码:A Ana lyz i n g and M odeli n g O pen Source Software a s Co m plex Networks ZHENG Xiao2l ong,ZENG Da2jun,L I Hui2qian,MAO W en2ji,WANG Fei2yue,DA I Ru2wei (The Key Laborat ory of Comp lex Syste m s and I ntelligence Science,I nstitute of Aut omati on, Chinese Academy of Sciences,Beijing100080,China) Abstract:Soft w are syste m s including those based on open2s ource code are becom ing increasingly com2 p lex.Studying the m as comp lex net w orks can p r ovide quantifiable measures and useful insights fr om the point of vie w of s oft w are engineering.I n the mean while,as one of the most comp lex man2made artifacts, they p r ovide a fruitful app licati on domain of comp lex syste m s theory.I n this paper,we analyze one of the most popular L inux meta packages/distributi ons called the Gent oo syste m.I n our analysis,we model s oft2 ware packages as nodes and dependencies a mong the m as arcs.Our e mp irical study shows that the resul2 ting Gent oo net w ork can not be exp lained by existing random graph models.This motivates our work in devel op ing a ne w model in which ne w nodes are connected t o old nodes with p r obabilities that depend not only on the degrees of the old nodes but als o the“ages”of these nodes.Thr ough si m ulati on,we de mon2 strate that our model has better exp lanat ory power than the existing models. Key words:comp lex net w orks;Gent oo;cluster coefficient;degree distributi on;model 收稿日期:2007-08-23 基金项目:国家自然科学基金委基金(60621001,60573078);科技部973项目(2006CB705500,2004CB318103);中国科学院、国家外国专家局,创新团队国际合作伙伴计划(2F05N01) 作者简介:郑晓龙(1982-),男,安徽人,博士研究生,研究方向为复杂网络与数据挖掘。

人工神经网络应用实例

人工神经网络在蕨类植物生长中的应用 摘要:人工神经网络(ARTIFICIAL NEURAL NETWORK,简称ANN)是目前国际上一门发展迅速的前沿交叉学科。为了模拟大脑的基本特性,在现代神经科学研究的基础上,人们提出来人工神经网络的模型。根据此特点结合蕨类植物的生长过程进行了蕨类植物生长的模拟。结果表明,人工神经网络的模拟结果是完全符合蕨类植物的生长的,可有效的应用于蕨类植物的生长预测。 关键词:人工神经网络;蕨类植物;MATLAB应用 一人工神经网络的基本特征 1、并行分布处理:人工神经网络具有高度的并行结构和并行处理能力。这特别适于实时控制和动态控制。各组成部分同时参与运算,单个神经元的运算速度不高,但总体的处理速度极快。 2、非线性映射:人工神经网络具有固有的非线性特性,这源于其近似任意非线性映射(变换)能力。只有当神经元对所有输入信号的综合处理结果超过某一门限值后才输出一个信号。因此人工神经网络是一种具有高度非线性的超大规模连续时间动力学系统。 3、信息处理和信息存储合的集成:在神经网络中,知识与信息都等势分布贮存于网络内的各神经元,他分散地表示和存储于整个网络内的各神经元及其连线上,表现为神经元之间分布式的物理联系。作为神经元间连接键的突触,既是信号转换站,又是信息存储器。每个神经元及其连线只表示一部分信息,而不是一个完整具体概念。信息处理的结果反映在突触连接强度的变化上,神经网络只要求部分条件,甚至有节点断裂也不影响信息的完整性,具有鲁棒性和容错性。 4、具有联想存储功能:人的大脑是具有联想功能的。比如有人和你提起内蒙古,你就会联想起蓝天、白云和大草原。用人工神经网络的反馈网络就可以实现这种联想。神经网络能接受和处理模拟的、混沌的、模糊的和随机的信息。在处理自然语言理解、图像模式识别、景物理解、不完整信息的处理、智能机器人控制等方面具有优势。 5、具有自组织自学习能力:人工神经网络可以根据外界环境输入信息,改变突触连接强度,重新安排神经元的相互关系,从而达到自适应于环境变化的目的。 二人工神经网络的基本数学模型 神经元是神经网络操作的基本信息处理单位(图1)。神经元模型的三要素为: (1) 突触或联接,一般用,表尔神经元和神经元之间的联接强度,常称之为权值。 (2) 反映生物神经元时空整合功能的输入信号累加器。 图1 一个人工神经元(感知器)和一个生物神经元示意图 (3) 一个激活函数用于限制神经元输出(图2),可以是阶梯函数、线性或者是指数形式的

人工神经网络及其应用实例_毕业论文

人工神经网络及其应用实例人工神经网络是在现代神经科学研究成果基础上提出的一种抽 象数学模型,它以某种简化、抽象和模拟的方式,反映了大脑功能的 若干基本特征,但并非其逼真的描写。 人工神经网络可概括定义为:由大量简单元件广泛互连而成的复 杂网络系统。所谓简单元件,即人工神经元,是指它可用电子元件、 光学元件等模拟,仅起简单的输入输出变换y = σ (x)的作用。下图是 3 中常用的元件类型: 线性元件:y = 0.3x,可用线性代数法分析,但是功能有限,现在已不太常用。 2 1.5 1 0.5 -0.5 -1 -1.5 -2 -6 -4 -2 0 2 4 6 连续型非线性元件:y = tanh(x),便于解析性计算及器件模拟,是当前研究的主要元件之一。

离散型非线性元件: y = ? 2 1.5 1 0.5 0 -0.5 -1 -1.5 -2 -6 -4 -2 2 4 6 ?1, x ≥ 0 ?-1, x < 0 ,便于理论分析及阈值逻辑器件 实现,也是当前研究的主要元件之一。 2 1.5 1 0.5 0 -0.5 -1 -1.5 -2 -6 -4 -2 2 4 6

每一神经元有许多输入、输出键,各神经元之间以连接键(又称 突触)相连,它决定神经元之间的连接强度(突触强度)和性质(兴 奋或抑制),即决定神经元间相互作用的强弱和正负,共有三种类型: 兴奋型连接、抑制型连接、无连接。这样,N个神经元(一般N很大)构成一个相互影响的复杂网络系统,通过调整网络参数,可使人工神 经网络具有所需要的特定功能,即学习、训练或自组织过程。一个简 单的人工神经网络结构图如下所示: 上图中,左侧为输入层(输入层的神经元个数由输入的维度决定),右侧为输出层(输出层的神经元个数由输出的维度决定),输入层与 输出层之间即为隐层。 输入层节点上的神经元接收外部环境的输入模式,并由它传递给 相连隐层上的各个神经元。隐层是神经元网络的内部处理层,这些神 经元在网络内部构成中间层,不直接与外部输入、输出打交道。人工 神经网络所具有的模式变换能力主要体现在隐层的神经元上。输出层 用于产生神经网络的输出模式。 多层神经网络结构中有代表性的有前向网络(BP网络)模型、

计算方法在数学建模中的应用

计算方法在数学建模中的应用 王连堂 西北大学数学系 E-mail:wlt800@https://www.wendangku.net/doc/086462630.html,。

计算方法又称“数值分析”,是为各种数学问题的数值解答研究提供最有效的算法。计算方法在数学建模中有很广泛的应用,特别是处理具有大规模数据的数学建模问题。其中应用最多的是误差分析,数值逼近以及数值积分等。在历年的全国大学生数学建模竞赛(CUMCM)赛题之中,有很多都用到了计算方法,其中以数据拟合方法用得最多,其次就是数值积分方法。下面分别对这些方法进行介绍,并通过几个赛题来熟悉这些方法的具体应用。 计算方法在数学建模中的应用

数据拟合1、数据拟合 在科学试验的统计研究中,往往要从一组测定数据(x i , y i )(i =1,2,…,n )中求出自变量x 与因变量y 之间的近似函数关系式,而这些数据本身具有一定误差而且其数量可能很大,因此不能要求函数关系是满足所有的点,而只是要求其能反映这些实验数据的大体规律或趋势。 对于给定的一组数据(x i , y i ),求一个k 次多项式: , 2210k k x a x a x a a y ++++=L

数据拟合 应用最小二乘法,使 取最小。对上式各参变量求偏导数后,令其偏导数为0,就得到了以下线性方程组 从该线性方程组中求解出系数a j (j =1,2,…,k )之后,就可以写出拟合的多项式。 ,)]([),,,(12 2 21010∑=++++?=n i k i k i i i k x a x a x a a y a a a Q L L .,,2,1 ,)(1110k j x y x x a x a a j i n i i n i j i k i k i L L ==+++∑∑==

MATLAB数学建模6常用计算方法

常用计算方法 1.超越方程的求解 一超越方程为 x (2ln x – 3) -100 = 0 求超越方程的解。 [算法]方法一:用迭代算法。将方程改为 0100 2ln()3x x =- 其中x 0是一个初始值,由此计算终值x 。取最大误差为e = 10-4,当| x - x 0| > e 时,就用x 的 值换成x 0的值,重新进行计算;否则| x - x 0| < e 为止。 [程序]P1_1abs.m 如下。 %超越方程的迭代算法 clear %清除变量 x0=30; %初始值 xx=[]; %空向量 while 1 %无限循环 x=100/(2*log(x0)-3); %迭代运算 xx=[xx,x]; %连接结果 if length(xx)>1000,break ,end %如果项数太多则退出循环 if abs(x0-x)<1e-4,break ,end %当精度足够高时退出循环 x0=x; %替换初值 end %结束循环 figure %创建图形窗口 plot(xx,'.-','LineWidth',2,'MarkerSize',12)%画迭代线 grid on %加网格 fs=16; %字体大小 title('超越方程的迭代折线','FontSize',fs)%标题 xlabel('\itn','FontSize',fs) %x 标签 ylabel('\itx','FontSize',fs) %y 标签 text(length(xx),xx(end),num2str(xx(end)),'FontSize',fs)%显示结果 [图示]用下标作为自变量画迭代的折线。如P0_20_1图所示,当最大误差为10-4时,需要迭代19次才能达到精度,超越方程的解为27.539。 [算法]方法二:用求零函数和求解函数。将方程改为函数 100 ()2ln()3f x x x =-- MA TLAB 求零函数为fzero ,fzero 函数的格式之一是 x = fzero(f,x0) 其中,f 表示求解的函数文件,x0是估计值。fzero 函数的格式之二是 x = fzero(f,[x1,x2]) 其中,x1和x2表示零点的范围。

模型飞机各项计算公式

1、雷诺数Re=pvb/μ(空气密度p-kg/m^3;标准状态下为1.226,与气流相对速度v-m/s,翼型弦长b-m,黏度μ=0.0000178):雷诺数的大小决定该翼型所做机翼的性能,如边界层是湍流边界层还是层流边界层,普通翼型的极限雷诺数(边界层从层流变为湍流)大约是50000,雷诺数还决定了机翼的与来流迎角(攻角)范围,在不失速的情况下,同一翼型,同一表面粗糙程度,同展弦比,同平面形状的机翼,雷诺数越大,则不失速攻角的范围越大,《《重点!通过观察风洞实验所得曲线,在雷诺数大于50000的情况下,两翼型雷诺数相差几万但升力系数曲线基本重合,也就是说,模友在选择翼型时在雷诺数大于50000时,计算出最大雷诺数(v 取最大值),然后直接用最大雷诺数的那个翼型数据计算即可,不同的是雷诺数大的助力系数要小一些,由此结论还能得出雷诺数大于50000时,翼型升力性能与速度的改变和翼型弦长的大小关系微小,在航模上可忽略。》》 2、升力计算:Y=1/2V^2pSCl(升力Y-单位N,气流相对速度V-m/s,空气密度P-kg/^3;,S翼面积-m^2,Cl-翼型的升力系数)改公式计算的是翼型理想升力,即在展弦比为无穷大时,不受翼尖涡流影响时的升力,升力系数代翼型数据,设计航模时应该对其进行修改,后面会讲到。 3、阻力计算:D=1/2V^2PSCd(阻力D-单位N,Cd-阻力系数,其它与升力计算相同)实际情况下机翼的阻力为翼型理想阻力+涡流诱导阻力,该公式计算的是翼型理想阻力,阻力系数代翼型数据。 4、涡流诱导阻力:D=1/2V^2PSCdi,(D为诱导阻力,Cdi为诱导阻力系数——Cdi=Cl^2/3.142A,展弦比A后面再详细介绍,Cdi计算公式中升力系数用翼型数据),非圆形或梯形机翼须乘以修正系数(1.05-1.1)圆形或梯形部分越多修正系数越小。 5、展弦比:A=L^2/S(L翼展,S翼面积,计算比值时L与S用同一单位,L厘米则S 用cm^2)展弦比大则不失速迎角范围小,小则反之,因为小展弦比时翼尖涡流大产生抑制边界层与机翼分力的作用力大。 6、翼尖涡流产生原因:由于上下表面有压强差,且机翼不是无限长,所以机翼下的气体会绕过翼尖流向上表面。安装翼梢小翼可有效减少涡流带来的影响,减少诱导阻力,提升相同迎角下的升力。 7、零升力迎角与绝对迎角:对称翼型的零升力迎角就是翼弦与来流间夹角为0°,所以绝对迎角同上,而非对称翼型在翼弦与来流迎角为0°时仍有升力产生,所以其绝对迎角为:迎角-0升力迎角(这类翼型的0升力迎角一般为负数),0升力迎角可从翼型数据表中查得,用画图法也渴求得大致0升力迎角,在翼型中弧线上找翼型最厚处所对应的点,与后缘那点连线,这条线叫0升力弦,当它与来流夹角为0时,不对称翼型不产生升力,绝对迎角在修正升力系数时有重要作用。 8、诱导迎角:由于翼尖涡流的存在,会使机翼的实际迎角变小,变小的角度叫诱导迎角,计算公式为18.2Cl/A(单位同上)Cl升力系数取翼型的升力系数。 9、下洗角:翼尖涡流造成下洗,计算公式为36.5Cl/A(升力系数代翼型的升力系数) 10、下洗速及对尾翼的影响:尾翼在主翼后面,若再主翼下洗流范围内,由于下洗流速为与空气相对流速的90%左右,且具有下洗角,则尾翼为负迎角,与空气相对速度为90%左右,

BP神经网络步骤及应用实例

1、数据归一化 2、数据分类,主要包括打乱数据顺序,抽取正常训练用数据、变量数据、测试数据 3、建立神经网络,包括设置多少层网络(一般3层以内既可以,每层的节点数(具体节点数,尚无科学的模型和公式方法确定,可采用试凑法,但输出层的节点数应和需要输出的量个数相等),设置隐含层的传输函数等。关于网络具体建立使用方法,在后几节的例子中将会说到。 4、指定训练参数进行训练,这步非常重要,在例子中,将详细进行说明 5、完成训练后,就可以调用训练结果,输入测试数据,进行测试 6、数据进行反归一化 7、误差分析、结果预测或分类,作图等 数据归一化问题 归一化的意义: 首先说一下,在工程应用领域中,应用BP网络的好坏最关键的仍然是输入特征选择和训练样本集的准备,若样本集代表性差、矛盾样本多、数据归一化存在问题,那么,使用多复杂的综合算法、多精致的网络结构,建立起来的模型预测效果不会多好。若想取得实际有价值的应用效果,从最基础的数据整理工作做起吧,会少走弯路的。 归一化是为了加快训练网络的收敛性,具体做法是: 1 把数变为(0,1)之间的小数 主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。 2 把有量纲表达式变为无量纲表达式 归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量 比如,复数阻抗可以归一化书写:Z = R + jωL = R(1 + jωL/R) ,复数部分变成了纯数量了,没有量纲。另外,微波之中也就是电路分析、信号系统、电磁波传输等,有很多运算都可以如此处理,既保证了运算的便捷,又能凸现出物理量的本质含义。 神经网络归一化方法: 由于采集的各数据单位不一致,因而须对数据进行[-1,1]归一化处理,归一化方法主要有如下几种,供大家参考: 1、线性函数转换,表达式如下:复制内容到剪贴板代 码:y=(x-MinValue)/(MaxValue-MinValue)说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。 2、对数函数转换,表达式如下:复制内容到剪贴板代码:y=log10(x)说明:以

公司估值的常用模型方法

绝对估值法(折现方法) 1.DDM模型(Dividend discount model /股利折现模型) 2.DCF /Discount Cash Flow /折现现金流模型) (1)FCFE ( Free cash flow for the equity equity /股权自由现金流模型)模型 (2)FCFF模型( Free cash flow for the firm firm /公司自由现金流模型)DDM模型 V代表普通股的内在价值, Dt为普通股第t期支付的股息或红利,r为贴现率对股息增长率的不同假定,股息贴现模型可以分为 :零增长模型、不变增长模型(高顿增长模型)、二阶段股利增长模型(H模型)、三阶段股利增长模型和多元增长模型等形式。 最为基础的模型;红利折现是内在价值最严格的定义; DCF法大量借鉴了DDM 的一些逻辑和计算方法(基于同样的假设/相同的限制)。 1. DDM DDM模型模型法(Dividend discount model / Dividend discount model / 股利折现模型股利折现模型) DDM模型 2. DDM DDM模型的适用分红多且稳定的公司,非周期性行业; 3. DDM DDM模型的不适用分红很少或者不稳定公司,周期性行业; DDM模型在大陆基本不适用; 大陆股市的行业结构及上市公司资金饥渴决定,分红比例不高,分红的比例与数量不具有稳定性,难以对股利增长率做出预测。 DCF 模型 2.DCF /Discount Cash Flow /折现现金流模型) DCF估值法为最严谨的对企业和股票估值的方法,原则上该模型适用于任何类型的公司。 自由现金流替代股利,更科学、不易受人为影响。 当全部股权自由现金流用于股息支付时, FCFE模型与DDM模型并无区别;但总体而言,股息不等同于股权自由现金流,时高时低,原因有四: 稳定性要求(不确定未来是否有能力支付高股息); 未来投资的需要(预计未来资本支出/融资的不便与昂贵);

BP神经网络模型应用实例

第1节基本原理简介 近年来全球性的神经网络研究热潮的再度兴起,不仅仅是因为神经科学本身取得了巨大的进展.更主要的原因在于发展新型计算机和人工智能新途径的迫切需要.迄今为止在需要人工智能解决的许多问题中,人脑远比计算机聪明的多,要开创具有智能的新一代计算机,就必须了解人脑,研究人脑神经网络系统信息处理的机制.另一方面,基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径.它对传统的计算机结构和人工智能是一个有力的挑战,引起了各方面专家的极大关注. 目前,已发展了几十种神经网络,例如Hopficld 模型,Feldmann等的连接型网络模型,Hinton等的玻尔茨曼机模型,以及Rumelhart等的多层感知机模型和Kohonen的自组织网络模型等等。在这众多神经网络模型中,应用最广泛的是多层感知机神经网络。多层感知机神经网络的研究始于50年代,但一直进展不大。直到1985年,Rumelhart等人提出了误差反向传递学习算法(即BP算),实现了Minsky的多层网络设想,如图34-1所示。

BP 算法不仅有输入层节点、输出层节点,还可有1个或多个隐含层节点。对于输入信号,要先向前传播到隐含层节点,经作用函数后,再把隐节点的输出信号传播到输出节点,最后给出输出结果。节点的作用的激励函数通常选取S 型函数,如 式中Q 为调整激励函数形式的Sigmoid 参数。该算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。每一层神经元的状态只影响下一层神经 元的状态。如果输出层得不到期望的输出,则转入反

相关文档
相关文档 最新文档