如何构建系统发育树

 我来答
小c学长
高粉答主

2020-04-22 · 分享及时的休闲、娱乐信息。
小c学长
采纳数:172 获赞数:49921

向TA提问 私信TA
展开全部

无论是基于距离的系统发生树重建方法,还是基于特征的系统发生树重建方法,都不能保证一定能够得到一棵描述比对序列进化历史的真实的树。

一般地,对于某个数据集,如果用一种方法能推断出正确的系统发生关系,则用其它流行的方法也能得到较好的结果。但是,如果模拟数据集中序列的变化很大,或不同的分支变化速率不同,则没有一种方法是十分可靠的。

扩展资料:

系统树是一种分支图(英文cladogram)。在树中,每个节点代表其各分支的近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)。

系统发生树有时也称系统树图,它是由一系列节点和分支组成的。其中每一个节点代表一个分类单元,分支末端的节点对应 一个基因或者生物体。与外部节点对应,内部节点代表一个推断出的共同祖先。系统发生树结构的基本信息在计算机程序中常常用一组嵌套的圆括号表示,成为newick格式。

参考资料来源:百度百科-系统发生树

待記憶荒蕪
推荐于2017-10-11 · TA获得超过9918个赞
知道大有可为答主
回答量:1409
采纳率:84%
帮助的人:265万
展开全部

1. 准备序列文件

准备fasta格式序列文件(fasta格式:大于号>后紧跟序列名,换行后是序列。举例如下)。每条序列可以单独为一个文件,也可以把所有序列放在同一文件内。

核酸序列:

>sequence1_name

CCTGGCTCAGGATGAACGCT

氨基酸序列:

>sequence2_name

MQSPINSFKKALAEGRTQIGF

2. 多序列比对

打开MEGA 5,点击Align,选择Edit/Build Alignment,选择Create a new alignment,点击OK。

 →

这时需要选择序列类型,核酸(DNA)或氨基酸(Protein)

选择之后,在弹出的窗口中直接Ctrl + V粘贴序列(如果所有序列在同一个文件中,即可全选序列,复制)。也可以:点击Edit,选择Insert Sequence From File,选择序列文件(可多选)。

序列文件加载之后,呈蓝色背景(为选中状态)。点击按钮 ,选择Align DNA(如果是氨基酸序列,则会出现Align Protein)。弹出的窗口中设置比对参数,一般都是采用默认参数即可。点击OK,开始多序列比对。

比对完成后,呈现以下状态。

这时需要截齐两端含有---的序列:选中含有---的序列,按键Delete删除(注意:两端都需要截齐)。截齐之后,保存文件为:filename.mas

3. 构建系统进化树

多序列比对窗口,点击Data,选择Phylogenetic Analysis,弹出窗口询问:所用序列是否编码蛋白质,根据实际情况选择Yes或No。此时,多序列比对文件就激活了,可以返回MEGA 5主界面建树了。

EGA 5主界面。点击Phylogeny,选择Construct/Test Neighbor-Joining Tree…弹出的对话框询问:是否使用当前激活的数据,选择Yes。这时弹出建树参数设置对话框,更改No. of Bootstrap Replications为1000,其他参数默认即可,点击Compute。

这里解释一下,Construct/Test Maximum Likelihood Tree…(ML)或Construct/Test Neighbor-Joining Tree…(NJ)或Construct/Test Minimum-Evolution Tree…(ME)为三种不同的建树方法,NJ方法最常用。

建树完成,效果如下所示。注意,要点击Bootstrap consensus tree查看树形。保存文件为filename.mts(可以用MEGA 5打开)。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
光辉278wex
推荐于2017-09-10 · 超过64用户采纳过TA的回答
知道答主
回答量:112
采纳率:0%
帮助的人:149万
展开全部
构建系统发育树需要注意的几个问题 1 相似与同源的区别:只有当序列是从一个祖先进化分歧而来时,它们才是同源的。 2 序列和片段可能会彼此相似,但是有些相似却不是因为进化关系或者生物学功能相近的缘故,序列组成特异或者含有片段重复也许是最明显的例子;再就是非特异性序列相似。 3 系统发育树法:物种间的相似性和差异性可以被用来推断进化关系。 4 自然界中的分类系统是武断的,也就是说,没有一个标准的差异衡量方法来定义种、属、科或者目。 5 枝长可以用来表示类间的真实进化距离。 6 重要的是理解系统发育分析中的计算能力的限制。任何构树的实验目的基本上就是从许多不正确的树中挑选正确的树。 7 没有一种方法能够保证一颗系统发育树一定代表了真实进化途径。然而,有些方法可以检测系统发育树检测的可靠性。第一,如果用不同方法构建树能得到同样的结果,这可以很好的证明该树是可信的;第二,数据可以被重新取样,来检测他们统计上的重要性。 分子进化研究的基本方法对于进化研究,主要通过构建系统发育过程有助于通过物种间隐含的种系关系揭示进化动力的实质。 表型的(phenetic)和遗传的(cladistic)数据有着明显差异。Sneath和Sokal(1973)将表型性关系定义为根据物体一组表型性状所获得的相似性,而遗传性关系含有祖先的信息,因而可用于研究进化的途径。这两种关系可用于系统进化树(phylogenetictree)或树状图(dendrogram)来表示。表型分枝图(phenogram)和进化分枝图(cladogram)两个术语已用于表示分别根据表型性的和遗传性的关系所建立的关系树。进化分枝图可以显示事件或类群间的进化时间,而表型分枝图则不需要时间概念。文献中,更多地是使用“系统进化树”一词来表示进化的途径,另外还有系统发育树、物种树(speciestree)、基因树等等一些相同或含义略有差异的名称. 系统进化树分有根(rooted)和无根(unrooted)树。有根树反映了树上物种或基因的时间顺序,而无根树只反映分类单元之间的距离而不涉及谁是谁的祖先问题。用于构建系统进化树的数据有二种类型:一种是特征数据(characterdata),它提供了基因、个体、群体或物种的信息;二是距离数据(distancedata)或相似性数据(similaritydata),它涉及的则是成对基因、个体、群体或物种的信息。距离数据可由特征数据计算获得,但反过来则不行。这些数据可以矩阵的形式表达。距离矩阵(distancematrix)是在计算得到的距离数据基础上获得的,距离的计算总体上是要依据一定的遗传模型,并能够表示出两个分类单位间的变化量。系统进化树的构建质量依赖于距离估算的准确性。
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
匿名用户
2018-12-23
展开全部
1、获得序列
将克隆扩增测序得到的基因进行测序。
2、NCBI上做BL AST
http://www.ncbi.nlm.nih.gov/blast/Blast.cgi
比对找到相似度最高的几个基因,将这几个基因的序列(FASTA格式文件)下载下来,或点击GENBANK登录号,复制FSATA格式,整合在一个*.TXT文档中。
3、比对序列,比对结果转化为*.MEG格式
用MEGA 5.0的CLUSTALW做多序列联配,比对结果用*.MEG格式保存。或者用CLUSTAL X软件进行比对,比对结果保存为*.ALN,再用MEGA 5.0转化为* MEG格式。
4、构建系统进化树
打开保存的*.MEG格式文件,选择邻接法构建系统发育进化树。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式