高通量测序介绍
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(“Next-generation” sequencing),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的 分析成为可能,所以又被称为深度测序(deep sequencing)。
发展历程
第一代测序:20世纪80年代中期
传统的化学降解法、双 脱氧链终止法以及在它们的 基础上发展来的测序技术统 称为第一代测序。它在分子 生物学研究中发挥过重要的 作用,如人类基因组计划
第二代测序:2005年开始
主要包括罗氏454公司的454测序技术、Illumina公司的Solexa测序技术和 Life Technologies公司的Ion Torrent测序技术 。第二代测序技术最显著的特征是高通量,一次能对几十万到几百万条DNA分子进行序列测序
第三代测序:2008年开始
第三代DNA测序技术是以单分子测序为特点,如Helico BioScience公司的单分子测序仪,以及正在研制的太平洋生物科学公司的单分子实时DNA测序技术和牛津纳米孔技术公司的纳米孔单分子测序技术等
目前常说的高通量测序是指用第二代测序技术来进行测序
第三代测序技术(单分子测下),读长较长,错误率较高,成本较高。
NGS测试平台比较
常用名词解释
Reads: 高通量测序平台产生的序列标签就称为reads
Ref: 参考基因组序列
测序深度:测序得到的总碱基数与待测基因组大小的比值。
覆盖度:测序获得的序列占整个基因组的比例。
SNP:单核苷酸位点变异
个体间基因组DNA序列同一位置单个核苷酸变异(替代、插入或缺失)所引起的多态性。不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差别的现象。人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性(SNP:single nucleotide polymorphism)的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。SNP是研究人类家族和动植物品系遗传变异的重要依据。
SNV:
在研究肿瘤基因组时,相对于正常组织,肿瘤中特异的单核苷酸变异是一种体细胞突变(somatic mutation),称做SNV(single nucleotide variants)
INDEL :
基因组小片段(<50bp)插入(INsertion)或缺失(DELetion)
CNV(Copy Number Variation,CNV):拷贝数据变异
基因结构变异(StructuralVariant,SV)的重要组成部分,由基因组发生重排而导致,一般指长度为1 kb以上的基因组大片段的拷贝数增加(gain)或者减少(loss)。如图A为loss , B为gain 。
SV(structure variation):结构变异
指在染色体上发生了大片段的变异。主要包括染色体大片段的插入(如图a)和缺失(如图b),染色体内部的某块区域发生翻转颠换(如图d,e),两条染色体之间发生重组(如图f)等。虽然SVs的数量远低于SNVs和indel,但SV影响的碱基更多。文献表明,多达13%的碱基受SV变化的影响。SV与疾病风险和表型变异高度相关。