进化树构建方法的选取
比较几种主要的构树方法,一般情况下,若有合适的 分子进化模型 可供选择,用 最大似然法(ML) 构树获得的结果较好;对于 近缘物种序列 ,通常情况下使用 最大简约法(MP) ;而对于 远缘物种序列 ,一般使用 邻接法(NJ)或最大似然法(ML) 。对于 相似度很低的序列 ,邻接法往往出现长枝吸引(branch attraction)现象,有时严重干扰进化树的构建。对于各种方法重建进化树的准确性,Hall (2005)认为 贝叶斯法 最好,其次是 最大似然法(ML) ,然后是 最大简约法(MP) 。其实如果 序列的相似性较高 ,各种方法都会得到不错的结果,模型间的 差别也不大 。邻接法和最大似然法是需要选择模型的。蛋白质序列和DNA序列的模型选择是不同的。 蛋白质序列 的构树模型一般选择 Poissoncorrection(泊松修正) ,而 核酸序列 的构树模型一般选择 Kimura2-parameter (Kimura一2参数) 。如果对各种模型的理解并不深入,最好不要使用其他复杂的模型。参数的设置推荐使用缺省的参数。
NJ法
它的特点是重建的树相对准确,假设少,计算速度快,只得到一棵树。其缺点主要表现在将序列上的所有位点同等对待,且所分析序列的进化距离不能太大。故NJ法适用于进化距离不大,信息位点少的短序列。
MP法
适用于序列残基差别小,具有近似变异率,包含信息位点比较多的长序列。
ML法
在进化模型选择合理的情况下,ML法是与进化事实吻合最好的建树算法。其缺点是计算强度非常大,极为耗时。