超2亿个缺失的人类基因组首次破译,这意味着什么?
在高中生物教材当中讲到:人类基因组计划1990年启动,并已于2003年完成。但是实际当中并不准确,因为当时只完成了 对92% 的人类基因组进行了测序,而这剩下的 8% 的人类基因组 由于其复杂性,多年来一直困扰着科学家。这 8% 的基因组并没有因为缺乏重要性而被忽视,而是因为技术限制。高精度长读长测序终于消除了这一技术障碍,能够对整个人类基因组的基因组变异进行全面研究,预计这将推动人类基因组健康和疾病的未来发现。
由新序列填补的空白包括五条人类染色体的整个短臂,并覆盖了基因组中一些最复杂的区域,包括染色体末端的端粒和在细胞分裂过程中协调复制染色体分离的着丝粒中高度重复的 DNA 序列。T2T-CHM13 还揭示了以前未检测到的节段重复,即在基因组中复制的长段 DNA,并且部分 DNA 已知在进化和疾病中发挥重要作用。
为补全人类基因组图谱缺失的8%,研究人员为人体染色体和基因基本化学结构约2亿碱基对测序。最后的完整图谱由30.55亿个碱基对(构成染色体和人类基因的单位)序列和19969个蛋白质编码基因组成。
在这些基因中,研究人员发现了大约2000个新基因,其中大多数已禁用,但115个可能仍处于活动状态。研究人员还发现了大约200万个额外的基因变异,其中622处存在于与医学相关的基因中。
在应用场景不断拓宽,测序能力进一步加强的共同促进作用下,全球基因测序行业市场规模将不断增长,中国基因行业市场规模虽然与全球头部企业差距较大,但是在国内市场中仍然占据较大的优势,未来要想提高国际市场份额,还需进一步加强技术研发,未来发展具有巨大的想象空间。