生物学中构建进化树的意义是什么?
按DNA或蛋白质序列构建树,一般归为谱系发育研究,其中建树是非常关键的一部分。 建树的基本目的,是理清手上一把序列之间的相互关系,这和聚类任何其它东西都很类似,最直观的做法就是两两比较,按某种定义算出距离,然后按距离远近把它们排个序。这是建树的基本方法之一,距离法,基本就是聚类方法。这种类型的树可以说体现的只是序列间的相似程度。 但是建树还有另外两种方法:最大似然法和贝叶斯法。这两种方法与聚类有什么不同呢?个人认为关键在于,一般的聚类是基于一系列静态的特征,而谱系发育中考虑的是随时间变化的一系列特征,具体到DNA和蛋白质序列,就是DNA碱基对或蛋白质对间的相互替代速率。 比如具体来说,两条序列ACTTG,ACTTT,在距离法中,我们所考虑的差别就是它们仅相差一个碱基。但如果使用另外两种方法,首先我们需要定义一个碱基突变的模型,然后考虑时间问题,意思就是比如假设这两条序列进化的时间很短,那么它们其中一个是由另一个直接突变而来的概率就比较大,也就是说它们更有可能亲缘关系很近,但如果它们的进化时间非常长,那么情况就复杂得多,因为有可能不只发生了一次突变,甚至它们有可能是由两条不相关的序列分别突变而来,也就是说它们的亲缘关系不见得很近。 所以在这类树上所体现的并非只是相似度,而每一条枝长实际上是突变速率与时间的乘积。当模型进一步复杂化,考虑DNA突变的不同方式,点突变,重组,水平基因转移等等,不同进化机制,如有无选择压力,再考虑到空间分布,区域隔离等等因素后,所获得的信息就更加丰富多样。
2024-11-30 广告