如何构建系统发育树
无论是基于距离的系统发生树重建方法,还是基于特征的系统发生树重建方法,都不能保证一定能够得到一棵描述比对序列进化历史的真实的树。
一般地,对于某个数据集,如果用一种方法能推断出正确的系统发生关系,则用其它流行的方法也能得到较好的结果。但是,如果模拟数据集中序列的变化很大,或不同的分支变化速率不同,则没有一种方法是十分可靠的。
扩展资料:
系统树是一种分支图(英文cladogram)。在树中,每个节点代表其各分支的近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)。
系统发生树有时也称系统树图,它是由一系列节点和分支组成的。其中每一个节点代表一个分类单元,分支末端的节点对应 一个基因或者生物体。与外部节点对应,内部节点代表一个推断出的共同祖先。系统发生树结构的基本信息在计算机程序中常常用一组嵌套的圆括号表示,成为newick格式。
参考资料来源:百度百科-系统发生树
1. 准备序列文件
准备fasta格式序列文件(fasta格式:大于号>后紧跟序列名,换行后是序列。举例如下)。每条序列可以单独为一个文件,也可以把所有序列放在同一文件内。
核酸序列:
>sequence1_name
CCTGGCTCAGGATGAACGCT
氨基酸序列:
>sequence2_name
MQSPINSFKKALAEGRTQIGF
2. 多序列比对
打开MEGA 5,点击Align,选择Edit/Build Alignment,选择Create a new alignment,点击OK。
这时需要选择序列类型,核酸(DNA)或氨基酸(Protein)
选择之后,在弹出的窗口中直接Ctrl + V粘贴序列(如果所有序列在同一个文件中,即可全选序列,复制)。也可以:点击Edit,选择Insert Sequence From File,选择序列文件(可多选)。
序列文件加载之后,呈蓝色背景(为选中状态)。点击按钮 ,选择Align DNA(如果是氨基酸序列,则会出现Align Protein)。弹出的窗口中设置比对参数,一般都是采用默认参数即可。点击OK,开始多序列比对。
比对完成后,呈现以下状态。
这时需要截齐两端含有---的序列:选中含有---的序列,按键Delete删除(注意:两端都需要截齐)。截齐之后,保存文件为:filename.mas
↓
3. 构建系统进化树
多序列比对窗口,点击Data,选择Phylogenetic Analysis,弹出窗口询问:所用序列是否编码蛋白质,根据实际情况选择Yes或No。此时,多序列比对文件就激活了,可以返回MEGA 5主界面建树了。
EGA 5主界面。点击Phylogeny,选择Construct/Test Neighbor-Joining Tree…弹出的对话框询问:是否使用当前激活的数据,选择Yes。这时弹出建树参数设置对话框,更改No. of Bootstrap Replications为1000,其他参数默认即可,点击Compute。
这里解释一下,Construct/Test Maximum Likelihood Tree…(ML)或Construct/Test Neighbor-Joining Tree…(NJ)或Construct/Test Minimum-Evolution Tree…(ME)为三种不同的建树方法,NJ方法最常用。
建树完成,效果如下所示。注意,要点击Bootstrap consensus tree查看树形。保存文件为filename.mts(可以用MEGA 5打开)。
2018-12-23
将克隆扩增测序得到的基因进行测序。
2、NCBI上做BL AST
http://www.ncbi.nlm.nih.gov/blast/Blast.cgi
比对找到相似度最高的几个基因,将这几个基因的序列(FASTA格式文件)下载下来,或点击GENBANK登录号,复制FSATA格式,整合在一个*.TXT文档中。
3、比对序列,比对结果转化为*.MEG格式
用MEGA 5.0的CLUSTALW做多序列联配,比对结果用*.MEG格式保存。或者用CLUSTAL X软件进行比对,比对结果保存为*.ALN,再用MEGA 5.0转化为* MEG格式。
4、构建系统进化树
打开保存的*.MEG格式文件,选择邻接法构建系统发育进化树。