文档库 最新最全的文档下载
当前位置:文档库 › 基于BP神经网络的基因模型

基于BP神经网络的基因模型

基于BP神经网络的基因模型
基于BP神经网络的基因模型

题目:基因模型

目录

摘要: (2)

关键词: (3)

问题重述: (3)

问题分析: (4)

符号说明: (5)

问题一 (6)

神经网络模型 (6)

BP神经网络的训练策略及结果 (8)

确定BP网络的结构 (9)

1)隐层数的确定: (9)

2)BP网络常用传递函数: (9)

3)每层节点数的确定: (10)

4)误差的选取 (10)

神经网络模型训练过程 (11)

训练结果 (14)

问题二 (15)

模型的评价: (18)

1 / 25

模型的推广: (18)

摘要:

问题一是一个判别问题,我们首先采用神经网络模型,建立具有输入层,隐蔽层,输出层三层的BP神经网络模型,根据经验公式和不断地实验得到的数目,得出输入层与隐蔽层之间有26个神经元,输出层有两个神经元。我们有两个目标函数:一个是正常人基因指标,一个是癌症患者基因指标,这样就建成了简单的三层自动反馈的神经网络模型。我们利用它会不断学习,基因之间的连接强度不断地加强,并且不断的往前反馈,从而使网络模型自动的不断调整而使之更智能化。前二十组是癌症患者的基因值,中间二十组是健康者的基因值,把四十组基因值输入神经网络模型的输入层,通过它自身自动学习和自动反馈的特点,建立一个具有识别正常与癌症的基因值的模型,然后通过把待测的后二十组数据输入,观察输出层的输出值,调整学习的步数,分别得到收敛程度不同的结果。

问题二是一个归类的问题。我们采用模糊聚类分析的方法,先用切比雪夫方法求出这些原始数据的相关系数,构成模糊相关矩阵,再使之满足模糊相关矩阵的相关性,自反性,对称性,使之构成模糊

2 / 25

等价矩阵,然后我们尽可能采用精确地截距值进行分类,从而画出模糊动态聚类图。

关键词:神经网络模型模糊聚类分析模糊动态聚类图

问题重述:

文件给出了一个114个基因, 60个人的基因表达水平的样本. 其中前20个是癌症病人的基因表达水平的样本(其中还可能有子类), 其后的是20个正常人的基因表达信息样本, 其余的20个是待检测的样本(未知它们是否正常).

(1).试设法找出描述癌症与正常样本在基因表达水平上的区别, 建立数学模型,及识别方法,去预测待检测样本是癌症还是正常样本.

这是一个判别的问题。已知两个目标函数的基因值,让我们根据已知的数据判别待测样本的类型,根据神经网络能够在已知数据的不断地学习和反馈,自己就可以建立一个智能的神经网络,这样我们就可以输入待测样本的数据进行自动判别了。

(2).设计图示(可视化) 方法,使得在你的数学模型下, 尽量清楚地表现癌症与正常样本在基因表达水平上的区别, 以及癌症样本中是否有子类.

这是一个分类问题。在后面二十个待测样本进行分类,由于数据特征不是特别的明显,无法用一般的方法进行判别,所以我们会采用模糊聚类分析,建立模糊等价矩阵,选取不同的截取进行分类,进而能够解出题目。

3 / 25

问题分析:

题目给出60个人的人均114个的基因表达水平的样本.其中前20个是癌症病人的基因表达水平的样本(其中还可能有子类), 其后的是20个正常人的基因

表达信息样本, 其余的20个是待检测的样本(未知它们是否正常),这是一个预测和归类的问题。

问题一是一个归类问题,我们采用神经网络模型,通过它不断调整,学习,存储的特征,而且无须事前揭示描述这种映射关系的数学方程,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。

问题二采用模糊聚类分析模型,60个人分成三组,采用相关系数建立模糊相似矩阵,然后用传递闭包法进行聚类,这样就可以把最后一组分出组别类型。

问题二让我们表现癌症与正常样本在基因表达水平上的区别, 以及癌症样

本中是否有子类.最基本的方法就是采用线性回归和数据拟合的方式来表现他们的区别。在问题一中,已经采用了时序模型,所以我们更可以用已经预测的数据和现有的数据进行拟合和比较。在分析癌症样本中是否有子类,我们可以用模糊聚类分析,对样本的114个原始数据进行聚类。

4 / 25

符号说明:

5 / 25

相关文档