如何分析进化树?

 我来答
青柠姑娘17
2022-06-13 · TA获得超过1.2万个赞
知道大有可为答主
回答量:6421
采纳率:100%
帮助的人:36万
展开全部
(可能存在错误和疏漏。只是个自己折腾的笔记)

虽然只能说初窥门径,但还是挺有意思的。从进化树中,能看出一种血清型(细到ST型)的形成、不同血清型间基因的相似性,可以根据分支对某种血清型进行有理有据的归类。也可以根据时间轴(具体时空进化树怎么跑?),能追究到某次疫情爆发当时是哪支clade干的;甚至可以根据某株菌在进化树中的位置,大致估计出它的一些特性,比如对人或动物的易感性对抗菌药物的耐受性等等。

源自  Comparative genomic analysis reveals high intra-serovar plasticity within Salmonella Napoli isolated in 2005–2017  一文。

沙门菌血清型可被分为伤寒和非伤寒(NTS)。前者通常由伤寒(S. Typhi)和副伤寒(S. Paratyphi)组成,是感染人类的特有血清型,能引发fever;后者则存在于各种动物中。

沙门菌那不勒斯血清型(S. Napoli)也是一种NTS非伤寒,但遗传因素表明它与伤寒血清型有密切关系,也感染人类,主要来自人源和环境,但其基因库(reservoir)和传染途径均未确定——因为其基因组高度多样性高遗传变异性,阻碍了对特定特征的识别,这些特征可以解释对特定环境/动物宿主的适应及其毒力潜力。

1.S. Napoli的高遗传变异性 ;

2.一套复杂的血清型内系统发育结构;

3.证实了S. Napoli和伤寒的基因相似性——发育树根据ST型聚类。

4.Moreover, two major subclades of S. Napoli can be clearly identified, with ST-474 being biphyletic . 还可以清楚地识别S. Napoli的两个主要亚支,其中ST-474是双系分类。

5.那不勒斯沙门氏菌比其他非伤寒血清型携带较少的SPI( Salmonella Pathogenicity Islands)和ARGs(antimicrobial resistance genes),也很少带质粒

6. 发现了S. Napoli的第二例extended-spectrum β–lactamases (ESBLs),和首例multidrug resistant (MDR),都采自人源。

总之:提供了那不勒斯沙门氏菌基因组可塑性的证据,突出了与伤寒血清型的基因组相似性和非伤寒血清型的典型基因组特征,支持了在不同的生态位(包括肠道和非肠道)生存的可能性。水平获得的ARG和MDR图谱引发了人们的担忧:人类环境对这种病原体可能会施加选择性压力。(Our results provide evidence of genomic plasticity of S. Napoli, highlighting genomic similarity with typhoidal serovars and genomic features typical of non-typhoidal serovars, supporting the possibility of survival in different niches, both enteric and non-enteric. Presence of horizontally acquired ARGs and MDR profiles rises concerns regarding possible selective pressure exerted by human environment on this pathogen.)

1.聚类为什么按ST型?

2.什么是亚分支(subclades)?

3.什么是双系分类(biphyletic)?

4.什么是基因组可塑性( genomic plasticity)?

从进化树来看,S. Napoli的样本总是集中在一个群体中,只有极少的样本与其他群体序列混合,似乎是一个单系亚支,从而证明S. Napoli不会与其他血清型发生重组。它是分支A的一部分,接下来即对分支A下游血清型进行分析。

S. Napoli亚树与伤寒沙门氏菌和甲型副伤寒沙门氏菌基因组聚在一起,在包含所有非伤寒血清型的聚类群中,形成了一个明显的分支。

S.Napoli的系统发育表明,序列主要按ST聚类;有趣的是,有两个主要分支都包含属于ST-474的基因组。因此,这个ST似乎是 两系分类 的(问题3)——它可能是所有其他已识别的ST的共同ST祖先。

可以摘一段文中发育树时间线分析:Then, around 2000, one of these clones diverged into ST-2019/ST- 2095 clone. From ST-2019, more recently, the ST-2008 and ST-2101 emerged. From the second clone of ST-474, ST-1637 and ST-1853 diverged in the period 2003–2008.

具体怎么计算出时间与克隆进化的对应关系,涉及到的计算过于复杂就暂时不分析了反正照一篇文章我也看不出来emmmmmmm....

1.ST型:文中发现ST型和菌株来源有一定的关系。显著关联性用生物统计学方法进行计算后确认。(2,000个重复的模拟p值计数数据的费舍尔精确检验,双面:p值=0.0004998。待我回头翻生统书...)

ST-2095与人类源显著关联,而ST-2019和ST-1637与环境源显著关联。(基于2000个重复的模拟p值计数数据的Fisher精确检验,经Bonferroni多次比较校正后,双面分别为:p值:9.13e-05,p值:2.92e-05)

因此环境,特别是地表水,可能在那不勒斯沙门氏菌的扩散中发挥重要作用。

(Interestingly, ST-1637 and ST-2019, found to be associated to environmental sources, were the only STs showing a high number of genes coding for cell motility proteins, as well as sensor proteins(细胞运动蛋白和传感器蛋白). These features might be favoring the ability of these STs to sense the surrounding environment and eventually activated motility mechanisms in response to different stimuli(刺激).) (一个ST型和菌株来源关联性的可靠解释)

2.聚类:系统发育聚类和分离来源之间没有直接关系。

3.ARG:血清型与含有获得性ARG的基因组数目之间存在显著且强烈的关联(皮尔逊卡方检验,p值<2.2e-16,Cramer‘s V=0.649)。

4.质粒:S. Napoli的质粒复制子可分为H(IncHI2A)、I(IncI1)、F(IncFII、IncFIB)、X(IncX),以及ColRNAI和Col440l,其中以IncFII质粒复制子最常见。 所有携带ARGs的S.Napoli基因组在同一基因组区域还显示IncI、IncF或IncH质粒复制子,这表明ARGs可能是通过水平基因转移获得的。 (All the S. Napoli genomes carrying ARGs showed also IncI, IncF or IncH plasmid replicons in the same genomic region, thus suggesting that ARGs could have been acquired by horizontal gene transfer.)

5.血清型与带有质粒复制子的分离物数量有很强的相关性。(皮尔逊χ2检验Pearson’s Chisquared test,p值<2.2e-16,Cramer‘s V=0.56.)

6.许多不同的基因组可能与抗菌剂杀生剂和金属耐受性一致,这样的模式表明S.Napoli可能不太适应在杀菌剂或金属富集的环境中生存,如耕作环境。这样的推测与我们的采样频率以及以前的研究是一致的——很少在家养或饲养的动物中发现S.Napoli。

7.收集的五个耐药菌株中有四个是人类来源的,考虑到质粒复制子的上下文存在,ARGs定位可能来自质粒来源。(In addition to that, four out of five resistant isolates in our collection are of human origin, and with ARGs location of conceivably plasmidic origin, given the contextual presence of plasmid replicons.不太确定,大致意思是质粒携带这些ARGs?) 只有少数在人类宿主中循环的S.Napoli克隆可能受到选择性压力,从而水平获得ARG。

8 .blaCTX-M-15 决定簇与F型质粒(IncFII、IncFIB)和IncI1质粒广泛相关,它们现在被认为是传播超广谱β-内酰胺酶(ESBLs)的主要载体之一。 多重耐药也与我们样本中发现的IncHI2质粒有关 ,其中磺胺类、四环素类、氨基糖苷类和链霉素类耐药基因也是常见的编码基因。有趣的是,IncHI2质粒在22°C到30°C的温度范围内通过接合表现出最佳的转移,因此表明 抗药性可能在环境中传播 。

S.Napoli血清型的高度多样性可能支持其对不同选择压力条件的 高度适应性 :野生环境到人类环境——野生环境里的菌株加强了传感和移动性,但分离株仍然是敏感的;人类环境里的菌株获得了质粒和抗菌素耐药性,这可能成为它们的优势。

之前提出的问题:

1.聚类为什么按ST型?

并非是按照ST型聚类,只是聚类结果表明聚类和ST型的关系。

2.什么是亚分支(subclades)?

3.什么是双系分类(biphyletic)?(polyphyletic)

4.什么是基因组可塑性( genomic plasticity)?

    百度一下:e.g. E.coli基因组中还包含有许多插入序列,如λ-噬菌体片段和一些其他特殊组分的片段,这些插入的片段都是由基因的水平转移和基因重组而形成的,由此表明了基因组具有可塑性。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式