当前位置：文档库 › 进化树软件MEGA最新6.06说明书

进化树软件MEGA最新6.06说明书

第一步：打开软件

下面介绍菜单的使用：

Data菜单：

Creat a new ：创建一个新的数据比对文件，也就是说当我们比对完一组后，想接着比对另一组，那么使用它就可以不用退出直接把数据文件导入；

Open ：打开先前已经比对并保存好的文件，它包含两个子菜单：retive sequence from file 和saved aligment session ；

Close: 关闭当前的比对数据文件；

Save session ：保存当前比对结果，可以给比对的结果一个文件名；

Export alignment ：将当前的序列比对结果输出到指定文件，有两种输入格式可供选

择：MGTA 和FASTA.

DNA sequence ：使用它来选择输入的数据DNA 序列，这里需要说明的是如果你输入的数据是氨基酸序列的话，比对窗口只显示一个标签，若是DNA 序列的话则显示两个标签，一个是DNA 序列的，另一个是氨基酸序列的。

Protein sequences ：选择输入的氨基酸序列，选择后，所以的位点就被当作氨基酸残

基位点来对待。

Translate/untranslate ：只有比对的序列是编码蛋白的DNA序列的时候才可用。它可以根据指定的遗传密码表将DNA 序列翻译成特定的氨基酸序列。

Select genetic code table ：使用它将编码蛋白的DNA 翻译成特定的蛋白序列。

R everse complement ：将选择的一整行的DNA 序列变为与之互补配对碱基序列。Exit alignment explorer ：退出序列比对的资源管理窗口

Edit 菜单：

使用这个菜单可以对我们的比对序列进行想要的一些编辑工作具体为

Undo：撤销上一步操作；

Copy：复制；Cut：剪切；Paste：粘贴；这三个操作都可以只针对一个碱基或

氨基酸残基也可以是一段甚至是整个序列；

Delete：从比对表格中删除一段序列；

Delete gaps：去掉序列中的空缺；

Insert blank sequence：重新插入一空行；标签和序列都是空的；

Insert sequence from file ：从已保存的文件中插入新的序列；

Select sites ：选择

一列序列，与点击比对表上方的灰白空格作用类似；

Select sequence：选择一行序列，与点击比对表格左侧的标签名作用类似；Select all：全选；

Allow base editing ：只读保护，只有选择后才能对序列进行编辑操作，否则

所以的序列为只读格式，不能进行任何编辑操作。

Search 菜单：

用来快捷查找序列中的标记未定或者目的碱基或残基。

Find motif ：输入你想要查看的一小段序列。找到后会以黄色标出；

Find next ：在序列的下游查找目的序列片段；

Find preious ：在序列的上有查找目的序列片段；

Find marked sites ：查找标记位点；

Highlight motif ：突出标记已经选择的位点。

Web 菜单：

这个菜单提供一个链接Genbank 的入口，可以在网上直接做Blast 搜索。当手上没有准备好要比对的序列时，可以直接去网上搜索。

Query gene banks ：开启NCBI 的主页；

Do blast search: 开启NCBI BLAST 主页；

Show browser ：开启网页浏览器。

Sequencer 菜单：

此菜单下只有一个子菜单：edit sequencer file ，用来打开一个打开文件对话框，此对话框可以打开一个sequencer data file ，一旦打开，这个文件就在trace

data file viewer/editor 的对话框中展示出来。这个编辑窗口允许你查看和编辑automatd DNA sequencer 产生的trace data 。它可以阅读和编辑ABI 和Staden 格式文件并且序列可以直接被导入到序列比对窗口或被上传到网页浏览器做blast 搜

索。

Display 菜单：

这个菜单相对简单，主要用来调整工具栏。

Toolbars ：工具栏菜单，它包含一些子菜单，选择后就会出现在比对的窗口

中；

Use colors ：将不同的位点以不同的颜色显示；

Background color ：选择后位点的显示与位点一样的背景颜色；

Font ：字体对话框，通过选择来调整窗口中的序列字符的大小。

Alignment 菜单

Mark/unmark site:在比对的表格中标记或者不标记一个单一位点，一次每

条序列只能被标记一个位点，不同序列间的位点你可以选择同一列的，也

可以是错开的，要根据自己的目的进行选择。选择标记后的序列可以使用alignmarked sites 进行比对分析。

Align marked sites: 比对标记的序列，在这里如果在两个或多个序列间标

记了不在一列的位点重新比对后会出现空格。

Unmarked all sites ：把所以标记的位点去标记；

Delete gap-only site ：去掉序同是空格的一列；这在多序列比对前很有用。

Auto-fill gaps ：使用空格补齐不同长度的序列。

建树：

1）下载数据

2）初步聚类：

3）建树

进化树的构建另一种方式：MEGA软件构建系统发育树

摘要：以白色念珠菌属下面的十个种的18s RNA 为例，构建系统发育树来说明MEGA软件的使用方法。

1背景简介

1.1 MEGA（分子进化遗传分析）

MEGA 的全称是Molecular Evolutionary Genetics Analysis。MEGA is an integrated tool for automatic and manual sequence alignment, inferring phylogenetic trees, mining web-based databases, estimating rates of molecular evolution, and testing evolutionary

hypotheses. MEGA 可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。MEGA 还可以通过网络（NCBI）进行序列的比对和数据的搜索。

最新版本：MEGA 5.1 Beta (软件开发者建议其结果不用于发表文章)

建议下载版本：MEGA 5.05 for Windows and Mac OS。

MEGA 5 has been tested on the following Microsoft Windows? operating systems: Windows 95/98, NT, 2000, XP, Vista, version 7, Linux and Mac OS [1].

MEGA 5.05 可免费下载，只需输入名字及有效邮箱，下载链接会发送至邮箱，点击可下载。

1.2 系统发育树定义

系统发育树（英文：Phylogenetic tree）又称为演化树（evolutionary tree），是表明被认为具有共同祖先的各物种间演化关系的树。是一种亲缘分支分类方法（cladogram）。在树中，每个节点代表其各分支的最近共同祖先，而节点间的线段长度对应演化距离（如估计的演化时间）

1.3 系统发育树的分类

根据有根和无根来区分：树可分为有根树和无根树两类。有根树是具有方向的树，根据系统发生树可推断出物种的起源包含唯一的节点，将其作为树中所有物种的最近共同祖先。最常用的确定树根的方法是使用一个或多个无可争议的同源物种作为外群（英文outgroup），这个外群要足够近，以提供足够的信息，但又不能太近以至于和树中的种类相混。把有根树去掉根即成为无根树。一棵无根树在没有其他信息（外群）或假设（如假设最大枝长为根）时不能确定其树根。无根树是没有方向的，其中线段的两个演化方向都有可能。

基于单个同源基因差异构建的系统发生数应称之为基因树。因为这种树代表的仅仅是单个基因的进化历史。而不是它所在物种的进化历史。物种树一般最好是从多个基因数据的分析中得到。例如一项关于植物进化的研究中，用了100个不同的基因来构建物种树，因为进化是发生在生物体种群水平上的，而不是发生在个体水平上的，虽然表面上不需要更多的数据，但实际上还是有必要的。基因树和物种树之间的差异是很重要的，如果只用等位基因来构建物种数，那许多人人和大猩猩就会分到一起，而不是和其他人分到一起。1.4 构建方法

要构建一个进化树（phyligenetic tree）。构建进化树的算法主要分为两类：独立元素法（discrete character methods）和距离依靠法（distance methods）。所谓独立

元素法是指进化树的拓扑形状是由序列上的每个状态决定的，而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法（Maximum Parsimony methods）和最大可能性法（Maximum Likelihood methods）；距离依靠法包括除权配对法（UPGMAM）和邻位相连法（Neighbor-joining）。

2 蛋白质序列分析使用方法

2.1 打开网址https://www.wendangku.net/doc/4115609770.html,/protein/，将菌名输入到protein后面的框内，点Search 键，选择一个搜索结果点击进入

2.2 将搜索出来的结果选择send to下拉箭头内的选项，Analysis Tool和BLAST,选择好后点击Submit 进行搜索

2.3进入BLAST页面，点击页面最下面的BLAST按钮，进行blast ,如图所示：

2.4 从结果中选择10个蛋白质序列，进行复制，粘贴到TXT文档内，然后将TXT文档后缀名改为FASTA

2.5 将保存好的，以Fasta做后缀的序列打开

2.6 点击菜单栏内的Alignment选项，选择Align by ClustalW选项。

2.7 弹出如下图对话框,选择OK键，对数据进行处理

经过一段时间的数据处理，数据处理完成如下图所示：

2.8 选择菜单栏中Data选项中的Save Session选项进行保存。

再选择Export Alignment中的MEGA Format和FASTA format 进行保存。

2.9 选择菜单栏中的 Analysis 选项中的 Phylogeny 中的 Construct/Test Maximum Likelihood Tree 选项进行数据处理。

如何做系统进化树

大家好：我在此介绍几个进化树分析及其相关软件的使用和应用范围。这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN （LINUX）。在介绍软件之前，我先简要地叙述一下有关进化树分析的一些方法学问题。进化树也称种系树，英文名叫“Phyligenetic tree”。对于一个完整的进化树分析需要以下几个步骤：⑴要对所分析的多序列目标进行排列（To align sequences）。做ALIGNMENT的软件很多，最经常使用的有CLUSTALX和CLUSTALW，前者是在WINDOW下的而后者是在DOS下的。⑵要构建一个进化树（To reconstrut phyligenetic tree）。构建进化树的算法主要分为两类：独立元素法（discrete character methods）和距离依靠法（distance methods）。所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的（例如：一个序列上可能包含很多的酶切位点，而每个酶切位点的存在与否是由几个碱基的状态决定的，也就是说一个序列碱基的状态决定着它的酶切位点状态，当多个序列进行进化树分析时，进化树的拓扑形状也就由这些碱基的状态决定了）。而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法（Maximum Parsimony methods）和最大可能性法（Maximum Likelihood methods）；距离依靠法包括除权配对法（UPGMAM）和邻位相连法（Neighbor-joining）。⑶对进化树进行评估。主要采用Bootstraping法。进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法，那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。一般来说，最大简约性法适用于符合以下条件的多序列：i 所要比较的序列的碱基差别小，ii 对于序列上的每一个碱基有近似相等的变异率，iii 没有过多的颠换/转换的倾向，iv 所检验的序列的碱基数目较多（大于几千个碱基）；用最大可能性法分析序列则不需以上的诸多条件，但是此种方法计算极其耗时。如果分析的序列较多，有可能要花上几天的时间才能计算完毕。UPGMAM（Unweighted pair group method with arithmetic mean）假设在进化过程中所有核苷酸/氨基酸都有相同的变异率，也就

乳酸菌系统进化树

Lactobacillus.plantarum 204Lactobacillus.pentosus Lactobacillus.paraplantarum 575Lactobacillus.collinoides Lactobacillus.brevis Lactobacillus.farciminis Lactobacillus.alimentarius Lactobacillus.paralimentarius Lactobacillus.kimchii Lactobacillus.sanfranciscensis Lactobacillus.lindneri Lactobacillus.fructivorans Lactobacillus.hilgardii Lactobacillus.parakefiri Lactobacillus.buchneri Lactobacillus.parabuchneri Lactobacillus.kefiri Lactobacillus.kunkeei P.selangorensis Lactobacillus.perolens Lactobacillus.algidus Lactobacillus.mali Lactobacillus.nagelii Lactobacillus.murinus Lactobacillus.animalis Lactobacillus.ruminus Lactobacillus.equi Lactobacillus.agilis Lactobacillus.cypricasei Lactobacillus.acidipiscis Lactobacillus.salivarius Lactobacillus.salicinius Lactobacillus.aviarius Lactobacillus.araffinosus Lactobacillus.coryniformis Lactobacillus.bifermentans Lactobacillus.sakei Lactobacillus.curvatus Lactobacillus.sharpeae Lactobacillus.manihotivorans Lactobacillus.rhamnosus Lactobacillus.zeae Lactobacillus.casei Lactobacillus.panis Lactobacillus.frumenti Lactobacillus.oris Lactobacillus.vaginalis Lactobacillus.pontis Lactobacillus.reuteri Lactobacillus.colehominis Lactobacillus.mucosae Lactobacillus.fermentum Lactobacillus.amylophilus Lactobacillus.johnsonii Lactobacillus.gasseri Lactobacillus.iners Lactobacillus.jensenii Lactobacillus.fornicalis Lactobacillus.psittaci https://www.wendangku.net/doc/4115609770.html,ctis Lactobacillus.delbrueckii Lactobacillus.bulgaricus Lactobacillus.acetotolerans Lactobacillus.hamsteri Lactobacillus.amylolyticus Lactobacillus.intestinalis Lactobacillus.gallinarum Lactobacillus.helveticus Lactobacillus.acidophilus Lactobacillus.crispatus Lactobacillus.amylovorus Lactobacillus.fructosus B.subtilis 99579999 99 704924 98 90 79 999999859996949999 9955 99 85746473999985 999445 404332 67 89 7599 998475999972 6599 5799 52 4798 92 97 91853836481621 59 49 3943 358829 37 12 16 0.01

Mega的使用以及进化树的绘制

1.MEGA构建系统进化树的步骤 2.CLUSTALX进行序列比对 1.MEGA构建系统进化树的步骤 1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件，注意：所有序列的方向都要保持一致( 5’-3’)。如图： 2. 打开MEGA软件，选择"Alignment" - "Alignment Explorer/CLUSTAL"，在对话框中选择Retrieve sequences from a file, 然后点OK，找到准备好的序列文件并打开，如图：。 3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐，对齐过程需要一段时间，对齐完成后，最好将序列两端切齐，选择两端不齐的部分，

单击右键，选择delete即可，如图：。 4. 关闭当前窗口，关闭的时候会提示两次否保存，第一次无所谓，保存不保存都可以，第二次一定要保存，保存的文件格式是.meg。根据提示输入Title，然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。最后出现一个对话框询问是否打开，选择Yes，如图：。 5. 回到MEGA主窗口，在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”，打开一个窗口，里面有很多参数可以设

置，如何设置这些参数请参考详细的MEGA说明书，不会设置就暂且使用默认值，不要修改，点击下面的Compute按钮，系统进化树就画出来了，如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”，

运用mega5构建系统发生进化树.

1．准备序列文件准备fasta格式序列文件（fasta格式：大于号>后紧跟序列名，换行后是序列。举例如下）。每条序列可以单独为一个文件，也可以把所有序列放在同一文件内。核酸序列： >sequence1_name CCTGGCTCAGGATGAACGCT 氨基酸序列： >sequence2_name MQSPINSFKKALAEGRTQIGF 2．多序列比对打开MEGA 5，点击Align，选择Edit/Build Alignment，选择Create a new alignment，点击OK。

这时需要选择序列类型，核酸（DNA）或氨基酸（Protein）。选择之后，在弹出的窗口中直接Ctrl + V粘贴序列（如果所有序列在同一个文件中，即可全选序列，复制）。也可以：点击Edit，选择Insert Sequence From File，选择序列文件（可多选）。

序列文件加载之后，呈蓝色背景（为选中状态）。点击按钮，选择Align DNA （如果是氨基酸序列，则会出现Align Protein）。弹出的窗口中设置比对参数，一般都是采用默认参数即可。点击OK，开始多序列比对。

比对完成后，呈现以下状态。这时需要截齐两端含有---的序列：选中含有---的序列，按键Delete删除（注意：两端都需要截齐）。截齐之后，保存文件为：filename.mas

3．构建系统进化树多序列比对窗口，点击Data，选择Phylogenetic Analysis，弹出窗口询问：所用序列是否编码蛋白质，根据实际情况选择Yes或No。此时，多序列比对文件就激活了，可以返回MEGA 5主界面建树了。

MEGA构建系统进化树的步骤(以MEGA7为例)

MEGA构建系统进化树的步骤（以MEGA7为例）本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。研究某个基因的进化，是用它的DNA序列，还是翻译后的蛋白质序列呢？序列的选取要遵循以下原则：1）如果DNA序列的两两间的一致度≥70%，选用DNA 序列。因为，如果DNA序列都如此相似，它的蛋白质会相似到看不出区别，这对构建系统发生树是不利的。所以这种情况下应该选用DNA序列，而不选蛋白质序列。2）如果DNA序列的两两间的一致度≤70%，DNA序列和蛋白质序列都可以选用。 1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件，注意：所有序列的方向都要保持一致( 5’-3’)。想要做系统发生树先要做多序列比对，然后把多序列比对的结果提交给建树软件进行建树，所以在用MEGA建树时可以输入一个已经比对好的多序列比对，也可以输入一条原始序列，让MEGA先来做多序列比对，再建树（一般我们都是原始序列）。所以我们以后者为例。 2.打开MEGA软件，选择主窗口的”File”→“Open A File”→找到并打开fasta文件，这时会询问以何种方式打开，我们是原始序列，需要先进行多序列比对，所以选择“Align”。如果是比对好的多序列比对可以直接选择“Analyze”。 3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对（MEGA提供了ClustalW和Muscle两种多序列比对方法，这里选择熟悉的ClustalW），弹出窗口询问“Nothing selected for alignment，Select all？”选择“OK”。 4. 之后，弹出多序列比对参数设置窗口。这个窗口和EMBL在线多序列比对一样，可以设置替换记分矩阵、不同的空位罚分（罚分填写的是正数，计算时按负数计算）等参数。MEGA的所有默认参数都是经过反复考量设置的，这保证了MEGA傻瓜机全自动档的品质，所以当你无从下手，或者没有什么特别要求的时候，直接点击“OK”，接受这些默认参数，开始多序列比对。

进化树软件MEGA最新6.06说明书

第一步：打开软件下面介绍菜单的使用： Data菜单： Creat a new ：创建一个新的数据比对文件，也就是说当我们比对完一组后，想接着比对另一组，那么使用它就可以不用退出直接把数据文件导入； Open ：打开先前已经比对并保存好的文件，它包含两个子菜单：retive sequence from file 和saved aligment session ； Close: 关闭当前的比对数据文件；

Save session ：保存当前比对结果，可以给比对的结果一个文件名； Export alignment ：将当前的序列比对结果输出到指定文件，有两种输入格式可供选择：MGTA 和FASTA. DNA sequence ：使用它来选择输入的数据DNA 序列，这里需要说明的是如果你输入的数据是氨基酸序列的话，比对窗口只显示一个标签，若是DNA 序列的话则显示两个标签，一个是DNA 序列的，另一个是氨基酸序列的。 Protein sequences ：选择输入的氨基酸序列，选择后，所以的位点就被当作氨基酸残基位点来对待。 Translate/untranslate ：只有比对的序列是编码蛋白的DNA序列的时候才可用。它可以根据指定的遗传密码表将DNA 序列翻译成特定的氨基酸序列。 Select genetic code table ：使用它将编码蛋白的DNA 翻译成特定的蛋白序列。 R everse complement ：将选择的一整行的DNA 序列变为与之互补配对碱基序列。Exit alignment explorer ：退出序列比对的资源管理窗口 Edit 菜单：使用这个菜单可以对我们的比对序列进行想要的一些编辑工作具体为 Undo：撤销上一步操作； Copy：复制；Cut：剪切；Paste：粘贴；这三个操作都可以只针对一个碱基或氨基酸残基也可以是一段甚至是整个序列； Delete：从比对表格中删除一段序列； Delete gaps：去掉序列中的空缺； Insert blank sequence：重新插入一空行；标签和序列都是空的； Insert sequence from file ：从已保存的文件中插入新的序列；

构建系统进化树的方法步骤

构建系统进化树的方法步骤 1. 建树前的准备工作 1.1 相似序列的获得——BLAST BLAST是目前常用的数据库搜索程序，它是Basic Local Alignment Search Tool的缩写，意为“基本局部相似性比对搜索工具”(Altschul et al.,1990[62];1997[63])。国际著名生物信息中心都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段，并作为内核向两端延伸，以找出尽可能长的相似序列片段。首先登录到提供BLAST服务的常用网站，比如国内的CBI、美国的NCBI、欧洲的EBI和日本的DDBJ。这些网站提供的BLAST服务在界面上差不多，但所用的程序有所差异。它们都有一个大的文本框，用于粘贴需要搜索的序列。把序列以FASTA格式(即第一行为说明行，以“>”符号开始，后面是序列的名称、说明等，其中“>”是必需的，名称及说明等可以是任意形式，换行之后是序列)粘贴到那个大的文本框，选择合适的BLAST程序和数据库，就可以开始搜索了。如果是DNA序列，一般选择BLASTN搜索DNA数据库。这里以NCBI为例。登录NCBI主页-点击BLAST-点击Nucleotide-nucleotide BLAST (blastn)-在Search文本框中粘贴检测序列-点击BLAST!-点击Format-得到result of BLAST。 BLASTN结果如何分析(参数意义)： >gi|28171832|gb|AY155203.1| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, complete sequence Score = 2020 bits (1019), Expect = 0.0 Identities = 1382/1497 (92%), Gaps = 8/1497 (0%) Strand = Plus / Plus Query: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt 60 |||||||||||||||||||||||||||||||||||||||||| ||||||||| ||||| Sbjct: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt 58 Query: 61 actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc 120 || ||||||||||||||||||||||||||||||| | |||||| ||||||||||||| Sbjct: 59 acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc 118 Score ：指的是提交的序列和搜索出的序列之间的分值，越高说明越相似；

用MEGA构建进化树

如何用MEGＡ构建进化树ＭEGA3、１就是一个关于序列分析以及比较统计得工具包,其中包括有距离建树法与MP建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验，还能联机得Ｗeb数据库检索。下载后可直接使用,主要包括几个方面得功能软件:i)DNA与蛋白质序列数据得分析软件。ii)序列数据转变成距离数据后,对距离数据分析得软件。iii)对基因频率与连续得元素分析得软件。iv)把序列得每个碱基/氨基酸独立瞧待(碱基/氨基酸只有0与１得状态)时，对序列进行分析得软件。v）绘制与修改进化树得软件，进行网上ｂlasｔ搜索。用MEGA构建进化树有以下步骤: 1、16S rＤNA测序与参考序列选取从环境中分离到单克隆，去重复后扩增16S rDNA序列并测序,然后与数据库比对,找到相似度最高得几个序列，确定一下您分离得细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定您分离得到得就就是Blast到得那个,然后找一到两个同科得,再找一到两个同目得,再找一到两个同纲得细菌，把序列全部下下来,以FSATA形式整合在TXT文档中,如 >TS１ GCＡGTCGAACGAＴGAAＧCCCAGＣTTGCＴGGGTGGA TTＡGTGGCGＡＡCGGGTＧAGTAＡCACGＴGGGTGＡTCTＧCCCTGCACTＴＣＧGＧATAAGＣＣTＧＧGAAＡＣＴＧＧGTCTＡATACCGGＡTAGGACCTCGGGA TGCAＴGＴTCＣGGGGTGGＡAAGGTTTＴCCＧＧＴGCＡGGATGGＧＣC ＞gi｜１1757２706|gb|EF0２8１2４、1| Rｈｏｄｏcoccus ｓp、Atｌ25 16S ｒibosｏmal ＲNＡgene，partｉal sｅqueｎce CGAＴTAGＡGTTTGＡTCＣTGＧCＴCＡＧGACGＡＡCＧＣTＧGCGＧCGTGCTTＡＡCACATGCAAGTCGＡACＧＡTＧＡＡGＣCCＡGＣTTGCＴGGＧTGGAＴTAGＴGＧCＧAACGGGTGＡＧTAACACGTＧGGTGA TCTGCＣCTＧCＡＣTTCGGGAＴAAGCCTGＧGAＡＡCＴGGＧTCTAAＴACCＧGＡT ＞TS2 ＴGCAAＧTＣGＡＧＣGAATGGA TTAAGAGＣTTGＣTCTＴＡＴGAAGTTAGＣGGCGGA ＣGGGTＧAＧTAAＣACGTＧGGＴＡＡCCTＧCCＣATＡＡGACTＧGGAＴAAＣTＣCGG ＧAAACCGGＧGCTAATACCGGAＴAACAＴTTTGAACTGCＡTGGＴＴCＧAAAＴTＧＡＡAGＧCGGＣTTＣGGCTＧTＣACT >gi｜5６383044|eｍb|AＪ８０9498、1｜Baｃillus ｃereus partｉaｌ16S rＲNA gene, stｒaiｎＴMW 2、３83 ＧA TGAＡCGCTGGCＧGCGTGCCＴAATACＡTGCAAＧTCGAGCGAＡTGGATTAAGＡＧCTTGCTCTTＡＴＧAＡＧＴTAGＣＧGCGGＡCGGGTＧＡGＴAACAＣGＴGGGTAACCＴGCＣCＡTAAＧACＴＧGGA TＡAＣＴCCGＧGAＡＡCCGGＧGCTAA TＡCCＧGATAＡCA TTTTGAACYGCA TＧGＴTＣ…………………………、 …………………………、参考序列选择有几个原则：a,不选非培养(ｕnclutuｒeｄ)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属得前提下,优先选择１６S rDNA全长测序或全基因组测序得种；d,每个种属选择一个参考序列,如果自己得序列中同一属得较多,可适当选择两个参考序列。 2、序列比对

MEGA构建系统进化树的步骤(以MEGA7为例)教学文案

M E G A构建系统进化树的步骤(以M E G A7为例)

MEGA构建系统进化树的步骤（以MEGA7为例）本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。研究某个基因的进化，是用它的DNA序列，还是翻译后的蛋白质序列呢？序列的选取要遵循以下原则：1）如果DNA序列的两两间的一致度≥70%，选用DNA序列。因为，如果DNA序列都如此相似，它的蛋白质会相似到看不出区别，这对构建系统发生树是不利的。所以这种情况下应该选用DNA序列，而不选蛋白质序列。2）如果DNA 序列的两两间的一致度≤70%，DNA序列和蛋白质序列都可以选用。 1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件，注意：所有序列的方向都要保持一致 ( 5’-3’)。想要做系统发生树先要做多序列比对，然后把多序列比对的结果提交给建树软件进行建树，所以在用MEGA建树时可以输入一个已经比对好的多序列比对，也可以输入一条原始序列，让MEGA先来做多序列比对，再建树（一般我们都是原始序列）。所以我们以后者为例。 2.打开MEGA软件，选择主窗口的”File”→“Open A File”→找到并打开fasta文件，这时会询问以何种方式打开，我们是原始序列，需要先进行多序列比对，所以选择“Align”。如果是比对好的多序列比对可以直接选择“Analyze”。 3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对（MEGA提供了ClustalW和Muscle两种多序列比对方法，这

一步一步教你如何做系统进化树

一步一步教你如何做系统进化树在此介绍几个进化树分析及其相关软件的使用和应用范围。这几个软件分别是PHYLIP 、PUZZLE 、PAUP 、TREEVIEW 、CLUSTALX 和PHYLO-WIN （LINUX ）。在介绍软件之前，我先简要地叙述一下有关进化树分析的一些方法学问题。进化树也称种系树，英文名叫“Phyligenetic tree ”。对于一个完整的进化树分析需要以下几个步骤：⑴ 要对所分析的多序列目标进行排列（To align sequences ）。做ALIGNMENT 的软件很多，最经常使用的有CLUSTALX 和CLUSTALW ，前者是在WINDOW 下的而后者是在DOS 下的。⑵ 要构建一个进化树（To reconstrut phyligenetic tree ）。构建进化树的算法主要分为两类：独立元素法（discrete character methods ）和距离依靠法（distance methods ）。所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的（例如：一个序列上可能包含很多的酶切位点，而每个酶切位点的存在与否是由几个碱基的状态决定的，也就是说一个序列碱基的状态决定着它的酶切位点状态，当多个序列进行进化树分析时，进化树的拓扑形状也就由这些碱基的状态决定了）。而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法（Maximum Parsimony methods ）和最大可能性法（Maximum Likelihood methods ）；距离依靠法包括除权配对法（UPGMAM ）和邻位相连法（Neighbor-joining ）。⑶ 对进化树进行评估。主要采用Bootstraping 法。进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法，那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。一般来说，最大简约性法适用于符合以下条件的多序列：i 所要比较的序列的碱基差别小，ii 对于序列上的每一个碱基有近似相等的变异率，iii 没有过多的颠换/转换的倾向，iv 所检验的序列的碱基数目较多（大于几千个碱基）；用最大可能性法分析序列则不需以上的诸多条件，但是此种方法计算极其耗时。如果分析的序列较多，有可能要花上几天的时间才能计算完毕。UPGMAM （Unweighted pair group method with arithmetic mean ）假设在进化过程中所有核苷酸/氨基酸都有相同的变异率，也就是存在着一个分子钟。这种算法得到的进化树相对来说不是很准确，现在已经很少使用。邻位相连法是一个经常被使用的算法，它构建的进化树相对准确，而且计算快捷。其缺点是序列上的所有位点都被同等对待，而且，所分析的序列的进化距离不能太大。另外，需要特别指出的是对于一些特定多序列对象来说可能没有任何一个现存算法非常适合它。最好是我们来发展一个更好的算法来解决它。但无疑这是非常难的。我想如果有人能建立这样一个算法的话，那他（她）完全可以在生物秀-专心做生物 w w w .b b i o o .c o m

用MEGA作进化树[2]

用MEGA2做进化树的步骤(图示) 1、打开程序如下图所示： 2、MEGA2只能打开meg格式的文件，但是它可以把其他格式的多序列比对文件转换过来，我们在这里用aln格式（Clustal的输出文件）转换meg文件。点File:Convert to MEGA Format...打开转换文件对话框如下图所示：

3、选择文件和转换文件对话框，选择aln文件，点OK 如下图所示： 4、转换好的meg文件，点存盘保存meg文件，meg文件会和aln文件保存在同一个目录如下图所示： 5、关闭转换窗口，回到主窗口，现在点面板上的“Click me to activate a data file”打开刚才的meg 文件如下图所示：

6、选择meg文件，点“打开” 如下图所示： 7、程序会自动识别序列的类型，如果识别错误，请手工选择数据类型。然后点OK就行了如下图所示：

8、数据输入之后的样子，窗口下面有序列文件名和类型如下图所示： 9、现在终于可以开始做Bootstrap验证和进化树了，MEGA的主要功能就是做Bootstrap验证的进化树分析，Bootstrap验证是对进化树进行统计验证的一种方法，可以作为进化树可靠性的一个度量。各种算法虽然不同，但是操作方法基本一致，我们在此以UPGMA方法为例进行演示。点下图所示的菜单项。如下图所示：

10、...会弹出如下的对话框，在此你可以选择计算参数。如下图所示： 11、Distance Options标签页中的Models可以下拉，其中有若干个计算距离的方法可以选择，在此默认泊松校验(Poisson Correction)作为计算距离的方法。如下图所示：

构建系统进化树的详细步骤

构建系统进化树的详细步骤 1. 建树前的准备工作 1.1 相似序列的获得——BLAST BLAST是目前常用的数据库搜索程序，它是Basic Local Alignment Search Tool 的缩写，意为“基本局部相似性比对搜索工具”(Altschul et al.,1990[62];1997[63])。国际著名生物信息中心都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段，并作为核向两端延伸，以找出尽可能长的相似序列片段。首先登录到提供BLAST服务的常用，比如国的CBI、美国的NCBI、欧洲的EBI和日本的DDBJ。这些提供的BLAST服务在界面上差不多，但所用的程序有所差异。它们都有一个大的文本框，用于粘贴需要搜索的序列。把序列以FASTA格式(即第一行为说明行，以“>”符号开始，后面是序列的名称、说明等，其中“>”是必需的，名称及说明等可以是任意形式，换行之后是序列)粘贴到那个大的文本框，选择合适的BLAST程序和数据库，就可以开始搜索了。如果是DNA序列，一般选择BLASTN搜索DNA数据库。这里以NCBI为例。登录NCBI主页-点击BLAST-点击Nucleotide-nucleotide BLAST (blastn)-在Search文本框中粘贴检测序列-点击BLAST!-点击Format-得到result of BLAST。 BLASTN结果如何分析(参数意义): >gi|28171832|gb|AY155203.1| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, complete sequence Score = 2020 bits (1019), Expect = 0.0 Identities = 1382/1497 (92%), Gaps = 8/1497 (0%) Strand = Plus / Plus

用MEGA构建进化树

如何用MEGA构建进化树 MEGA3.1是一个关于序列分析以及比较统计的工具包，其中包括有距离建树法和MP 建树法；可自动或手动进行序列比对，推断进化树，估算分子进化率，进行进化假设测验，还能联机的Web数据库检索。下载后可直接使用，主要包括几个方面的功能软件：i)DNA 和蛋白质序列数据的分析软件。ii)序列数据转变成距离数据后，对距离数据分析的软件。iii)对基因频率和连续的元素分析的软件。iv)把序列的每个碱基/氨基酸独立看待（碱基/氨基酸只有0和1的状态）时，对序列进行分析的软件。v)绘制和修改进化树的软件，进行网上blast搜索。用MEGA构建进化树有以下步骤： 1. 16S rDNA测序和参考序列选取从环境中分离到单克隆，去重复后扩增16S rDNA序列并测序，然后与数据库https://www.wendangku.net/doc/4115609770.html,/blast/Blast.cgi比对，找到相似度最高的几个序列，确定一下你分离的细菌大约属于哪个科哪个属，如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个，然后找一到两个同科的，再找一到两个同目的，再找一到两个同纲的细菌，把序列全部下下来，以FSATA形式整合在TXT文档中，如 >TS1 GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC >gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T >TS2 TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT >gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383 GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTA TGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC …………………………. …………………………. 参考序列选择有几个原则：a，不选非培养(unclutured)微生物为参比；b，所选参考序列要正确，里面无错误碱基；c，在保证同属的前提下，优先选择16S rDNA全长测序或全基因组测序的种；d，每个种属选择一个参考序列，如果自己的序列中同一属的较多，可适当选择两个参考序列。

怎样使用MEGA建立进化树

怎样使用MEGAt 立进化树如何使用MEGA4.0#立进化树 1、首先是双击软件打开如下图所示 |M| ijaKMr 3 valj 141 Mrhr ArgrwricQt iVvta “qplii ：护忏冲 i 二客H - I 号筍需.廿星"L IF M ■ H 、- | II ■ DKi -Mjrsrze: H r? r-r r ^c>az^ LCS 2、现在是处于DNA 序列，而我们要做蛋白质的进化树的话，就如下操作

M4. Aligmr>&nl Explof頁 H L lQnmt*Ft ji Edit m e祁 3、接下来我们要进行序列的输入，点击左边那个红箭头，贝U出现下面的窗口

刚M4： Alfgnment Explorer 匚;日屯EJrt S?ar di Aflgmnenl Wfrb $e<)□ d | D ◎日「蹇輻酋1 41象 Protein S^quer匚弊 1 |主曲色"匕色丄 4、然后右击sequenee 1,修改名字，如改成DPV Frotejn Sequence? 5、然后从Word里复制蛋白质序列，然后在下面的位置粘贴 G 辱Copf PTCtfiT X CU, 書 f sterna 6则可出现如下图的序列了 □ Q CW1C 3 iRWfl Wq^ri[ V ^i>n irequ^Ki 幷册枷? 1話皿讥曲佰i" —喇?ct Mgeirc 惟 ■ sy

7、然后点击窗口上的保存图标保存 8、重复从3开始，直到你的序列输入完 9、序列输入元后进行最后的保存，方法如下垂邑trit 5|讨之斗和"1 of op?r * dow 亠 P TOUMT 1

系统进化树视频教程-多序列比对教程等

所有视频内容和编号： 001-1系统进化树构建序列文件格式说明（1080P） 001-2 MEGA软件构建邻接树(NJ树) （1080P） 001-3 MEGA软件构建最大简约树(MP树) （1080P） 001-4 MEGA软件构建最大似然树(ML树) （1080P） 001-5 MEGA软件构建UPGMA树（1080P） 001-6 MEGA软件计算遗传距离和导出Excel（1080P） 001-7 MEGA软件分析序列特征-信息位点变异位点等（1080P） 001-8 MEGA软件对序列饱和性检验和作图（1080P） 001-9 MEGA软件最序列分组并计算组间和组内遗传距离（1080P） 001-10 MEGA软件对树图置根修改字体和字号等（1080P） 002-1 贝叶斯法Mrbayes构建系统进化树教程视频（1080P） 002-2 PAUP软件构建最大似然（ML）树教程 002-3 Mrbayes贝叶斯建树(MrMTgui模型计算)视频教程（1080P） 002-4 贝叶斯不收敛问题的解决办法（1080P） 002-5 PAUP软件构建最大似然（ML）树教程（1080P） 002-6 PAUP软件构建简约树（MP）树教程（1080P） 002-7 PAUP软件构建邻接树（NJ）树教程（1080P） 003-1 MAFFT多序列比对教程 003-2 Jmodeltest模型计算方法与说明 003-3 primer5引物设计 003-4 Photoshop图片排版（期刊格式） 003-4 primer5引物设计（加酶切位点）（1080P） 004-1 多基因序列快速联合（拼接）与格式转换-软件SequenceMatrix（1080P） 004-2 多基因序列快速联合（拼接）详细版-SequenceMatrix（1080P） 004-3 贝叶斯多基因片段联合分区建树（分区设定模型）（1080P） 005-1 MEGA软件美化树图置根等内容补充 005-2 如何编辑贝叶斯或PAUP（ML）树图（PDF格式）的名称、字体、分枝等并输出图片格式 005-3 MEGA软件修改树图标尺显示分枝长度自举值显示方式等设置（1080P）

使用mega6做进化树

假如你要对比你所测序列E的序列与其他物质的亲缘关系，步骤如下：一，首先要先把你获得E的序列去NCBI网站进行比对，步骤如下： 1.登录NCBI网站https://https://www.wendangku.net/doc/4115609770.html,/ 2.找到右侧的BLAST，点进去； 3.找到页面下方的这个图标，点Nucleotide BLAST 4.将测得的序列全部粘贴到页面上的这个框里：

5.找到页面最下方的Algorithm parameters，在最下面的BLAST旁边勾选 “Show XXXX”后点击BLAST 6.然后就会弹出另一个页面，你就得耐心等待了，因为它在比对，比对好后就会出现这样一个界面：

7.然后往下拉，就看到好多序列的结果，可以选择所有的序列下载，也可以选择你想要的序列来下载（All/None可全选或都不选），选好后点击“GenBank”。 8.把所有的序列都勾选后，点右上角的“send”

9.出现这个框格，File-FASTA按框格里选择好点Create File就可以批量下载内含你所选的序列的“fasta”格式的文件； 11改好后打开，把自己的序列按“>名称+序列”的格式紧接在已下好的序列后面，添加好后再把后缀改回“fasta”,便可进行下一步

8. 3 12.双击fasta文件，由MEGA6.0打开，如图 13.单击W图标中的“Align DNA”,会提醒你选择序列，单击确定即可，如下图

14.比对后的序列如下图。 15.然后我们需要把“*”号之外的序列全部删除，只留下"*"标注的序列，保存，保存后得到的是“mas”格式文件

系统进化树的这些知识

系统进化树的这些知识，你都Get了吗？系统进化树（Phylogenetic tree，又称为系统发生树/系统发育树/系统演化树/进化树等），是用来表示物种间亲缘关系远近的树状结构图。在系统进化树中，物种按照亲缘关系远近被安放在树状结构的不同位置，因而，进化树可以简单地表示生物的进化过程和亲缘关系。自达尔文时期，很多生物学家就希望用一棵树的形式描述地球上所有生命的进化历程。早期的系统发育研究主要基于生物的表型特征，通过表型比较来研究物种之间的进化关系，然而，利用表型特征进行系统发育分析存在很大的局限性，1965[1]年，Linus Pauling等提出了分子进化理论，基于分子特性（DNA、RNA和蛋白质分子），推断物种之间的系统发生关系，由于核苷酸和氨基酸序列中含有生物进化历史的全部信息，因此利用该方法构建的系统进化树更为准确。图1 系统进化树理论上，一个DNA序列在物种形成或者基因复制时，会分成两个子序列，因而系统进化树是一般是二叉树，由许多节点和分支构成。根据位置的不同，节点分为外部节点和内部节点，外部节点代表最终分类，可以是物种、群体，或者DNA、RAN、蛋白质等，内部节点表示该分支可能的祖先节点，不同节点间的连线则称为分支。根据是否指定根节点，将系统发育树分为有根树和无根树。有根树绘制过程中需要引入外群，因而具有一个根节点，作为树中所有物种（样本）的共同祖先节点，可以判断演化方向，反映分类单元间的进化关系，外群与进化树中其他物种（样本）的亲缘关系不宜太近，也不能太远，一般构建种内不同品种/亚种间的进化树，外群应选择同属内其他物种，构建属内不同种间的进化树，外群应选择科内其他属物种。无根树绘制过程中并未引入外群，因而没有根节点，无法判断演化方向，只能表明不同单元之间的分类关系。

Mega的使用以及进化树的绘制

MEGA构建系统进化树的步骤 1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件，注意：所有序列的方向都要保持一致( 5’-3’)。如图： 2. 打开MEGA软件，选择"Alignment" - "Alignment Explorer/CLUSTAL"，在对话框中选择Retrieve sequences from a file, 然后点OK，找到准备好的序列文件并打开，如图：。 3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐，对齐过程需要一段时间，对齐完成后，最好将序列两端切齐，选择两端不齐的部分，单击右键，选择delete即可，如图：。

4. 关闭当前窗口，关闭的时候会提示两次否保存，第一次无所谓，保存不保存都可以，第二次一定要保存，保存的文件格式是.meg。根据提示输入Title，然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。最后出现一个对话框询问是否打开，选择Yes，如图：。 5. 回到MEGA主窗口，在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”，打开一个窗口，里面有很多参数可以设置，如何设置这些参数请参考详细的MEGA说明书，不会设置就暂且使用默认值，

不要修改，点击下面的Compute按钮，系统进化树就画出来了，如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”，