DNA指纹图谱的产生的原理
2016-05-24
1.1 高变异DNA 序列的发现
1980 年,Wyman 和 White 在进行人体DNA 基因文库的研究中,筛选到一个随机DNA 片
段,以其为探针进行RFLPs 分析,检测到8 个等位基因,平均杂合率超过75%,因此推测该
位点的多态性来源于DNA 重排而非碱基突变,这是人类基因组中发现的第一个高变区(hyper
variable regions,简称HVRs)。此后,人们在人类基因组中又陆续发现了其他一些高变区,
如α-珠蛋白基因(Higgs 等 1981,1986)、胰岛素基因(Bell 等 1982)、脂蛋白基因(Knott
等 1986)、D-Ha-ras 癌基因(Capon 等 1983)、Zata-珠蛋白基因(Goodbourm 等 1983)等基
因的侧翼及肌红蛋白基因(Weller 等1984)的第一个内含子区域,都含有这种HVRs。这些高
变区的共同特点为:都是由一短序列(即重复单位)首尾相连、多次重复而成,其多态性来源
于重复单位的重复次数不同。同一高变区的这些重复单位还具有高度的保守性,但因重复单位
的重复数目不同,形成了众多的等位基因。这些高变区后来被叫做小卫星(minisatellite)
(Jeffreys 等 1985a),有的人又称其为可变数目串联重复序列(variable number of tandem
repeat,简称VNTR)(Nakmura 等1987)。在小卫星DNA 内,重复单位数目的高度变异是由于不
等交换所造成的,换言之,即在有丝分裂时的姊妹染色单体(sister chromatids)或减数分裂
时的同源染色体间互换所致。有时候,发现DNA 链架突变的发生频率高于点突变,其频率为每
世代每千个核苷酸对在10- 5~10- 2。虽然不等互换导致重复单位数目增加或减少,但不同重复
的形成却是由于点突变造成的。此外,基因转换(gene conversion)与重组似乎在同源性的维
持上扮演着重要的角色。在DNA 复制期间的滑动复制(slippage)是重复单位内简单序列 (1~
4 个核苷酸对)演化的机制(Wolf 等 1989)。故有丝分裂或减数分裂时不等互换、基因转换及
滑动复制,均足以导致重复单位间同源性的维持及重复单位数目的变化。
大多数重复序列单位共有一个约 10~15 个核苷酸对的核心序列(core sequence),此核心
序列高度地保留于相关的小卫星DNA 家族中,它是重组信号,可能是真核生物DNA 重组交换的
热点,可促进小卫星DNA 的不等交换(Jeffreys 等 1985a;Wyman 等 1990)。核心序列是重
复单位间序列相似的基础。在小卫星DNA 区域内,同源染色体可能有不同数目的重复单位,利用
限制性内切酶可产生DNA 指纹。由此可见,串联重复序列的高度变异性与其特殊的结构密切相关。
然而,基因组中此类串联重复序列的真实生物学功能至今仍不清楚。
1.2 DNA 指纹图谱的发现
1985 年,英国来斯特大学遗传系的Jeffreys(1985a)及其同事在《Nature》杂志上报道了他们
对人体基因组高变区的突破性研究。他们用肌红蛋白基因第一个内含子中的串联重复序列(重复单位
长33bp)作探针,从人的基因文库中筛选出8 个含有串联重复序列(小卫星)的重组克隆。经序列
分析,发现每个克隆都含有一个长0.2~2.0kb、由重复单位重复3~29 次组成的小卫星DNA。尽管这
8 个小卫星的重复单位的长度(16~64bp)和序列不完全相同,但都含有一段相同的核心序列,其碱
基顺序为 GGGCAGGAA。他们用 16bp 重复单位(主要为核心序列)重复29 次而成的小卫星33.15
做探针,与人基因组酶切片段进行Southern 杂交,在低严谨条件下杂交产生由10 多条带组成的杂交
图谱,不同个体杂交图谱上带的位置是千差万别的。随后他们用另外一个小卫星探针33.6 进行测试,
获得了类似的图谱。这种杂交图谱就像人的指纹一样因人而异,因而Jeffreys(1985b)等人称之为
DNA 指纹图谱(DNA finger print),又名遗传指纹图谱(genetic finger print)。产生DNA 指纹图
谱的过程就叫做DNA 指纹分析(DNA finger printing)。
1.3 DNA 指纹图谱的特点
DNA 指纹图谱具有以下3 个基本特点:
(1)多位点性:基因组中存在着上千个小卫星位点,某些位点的小卫星重复单位含有相同或相
似的核心序列。在一定的杂交条件下,一个小卫星探针可以同时与十几个甚至几十个小卫星位点上的
等位基因杂交。一般来说,一个DNA 指纹探针(又称多位点探针)产生的某个个体DNA 指纹图谱由
10~20 多条肉眼可分辨的图带组成。由于大部分杂合小卫星位点,仅一个等位基因出现在图谱的可
分辨区内(两个等位基因由于重复单位、重复次数不同,在长度上差异很大),因而每条可分辨图带
代表一个位点。很多的研究表明,个体DNA 指纹图谱中的带很少成对连锁遗传,所代表的位点广泛地
分布于整个基因组中(Burke 等1987;Hiu 等1985)。一个传统的RFLPs 探针一次只能检测一个特异
性位点的变异性,所产生的图谱一般由l~2 条带组成,仅代表一个位点。因此两者比较而言,DNA
指纹图谱更能全面地反映基因组的变异性。
(2)高变异性:DNA 指纹图谱的变异性由两个因素所决定,一是可分辨的图带数,二是每条
带在群体中出现的频率。DNA 指纹图谱反映的是基因组中高变区,由多个位点上的等位基因所组
成的图谱必然具有很高的变异性。DNA 指纹图谱在个体或群体之间表现出高度的变异性,即不同
的个体或群体有不同的DNA 指纹图谱。一般选用任何一种识别4 个碱基的限制性内切酶,这种变
异性就能表现出来。Jeffreys 等 (1985b)对人的DNA 指纹图谱的研究表明,DNA 指纹图谱中的
大部分谱带都以杂合状态存在,平均杂合率大于70%,某些大片段的杂合率甚至高达100%。用
探针33.15 进行DNA 指纹分析时,发现两个无血缘关系的个体具有相同DNA 指纹图谱的概率仅为
3× 10-11;而将探针33.15 和33.6 产生的DNA 指纹图谱综合起来分析时,则这种概率为5×10-19,
可见DNA 指纹图谱具有高度的个体特异性。但是,同卵双胞胎的DNA 指纹图谱是相同的,因其有
完全相同的基因组(Hiu 等1985)。值得注意的是,由于琼脂糖凝胶电泳分辨率的限制,DNA 指纹
图谱大片段区域的变异性往往很高,而小片段区域的变异性则很低,因此在实际操作时往往将
小于 2kb 的小片段跑出胶外或不作统计。
(3)简单而稳定的遗传性:Jeffreys 等(1985a)通过家系分析表明,DNA 指纹图谱中
的谱带能够稳定地从上一代遗传给下一代。子代DNA 指纹图谱中的每一条带都能在其双亲之
一的图带中找到,而产生新带的概率(由基因突变产生)仅在0.001~0.004 之间。DNA 指纹
图谱中的杂合带遵守盂德尔遗传规律,双亲的各图带平均传递给50%的子代。DNA 指纹图谱
还具有体细胞稳定性,即用同一个体的不同组织如血液、肌肉、毛发、精液等的DNA 做出的
DNA 指纹图谱是一致的(Gill 等1985),但组织细胞的病变或组织特异性碱基甲基化可导致
个别图带的不同。
1.4 DNA 指纹图谱的应用
由于DNA 指纹图谱具有多位点性、高变异性、简单而稳定的遗传性,因而自其诞生就引起
了人们的重视,表现出巨大的实用价值。DNA 指纹图谱的高变异性和体细胞稳定性可用于鉴定
个体,这对法医学上鉴别犯罪分子和确定个体间的血缘关系极有价值(Jeffreys 等1985b,
1985c)。如我国公安部利用DNA 指纹图谱已侦破数百例疑难案件。其简单的遗传性可用来鉴定
亲子关系,其多位点性可用来检测目标基因组的病变及治疗等过程中的改变情况。1987 年
Burke、Jeffreys 和Wetton 等报道了用人源核心序列小卫星探针33.6 和33.15 检测到哺乳动
物到鸟类、爬行动物、两栖动物、鱼、昆虫等的高变异小卫星,产生具有个体特异性或类群特
异性的DNA 指纹图谱。1988 年,Dallas 用人源小卫星探针33.6 获得了水稻的DNA 指纹图谱。
随后,美国华盛顿大学生物系Nybom 等人对果树植物的DNA 指纹图谱进行了大量的研究。1989
年,Braithwaite 和Manners 首次将人源小卫星探针33.6 和33.15 用作真菌的DNA 指纹分析
获得了成功,从而进一步证明DNA 指纹技术具有广泛的适用性。这些发现使DNA 指纹图谱成为
研究动植物群体遗传结构、生态与进化、分类等很有价值的遗传标记。
1.5 DNA 指纹图谱的研究进展
1.5.1 DNA 指纹分析的探针
两个最早的DNA 指纹探针是1985 年Jeffreys 及其同事所发现的人源小卫星探针33.6 和
33.15(Jeffreys 等 1985a)。1987 年,Vassart 等发现无外源DNA 片段的细菌噬菌体M13 本
身就能够作为一个DNA 指纹探针检测出人和动物基因组中的高变异小卫星DNA,其有效序列
是蛋白质 Ⅲ 编码区内的两个小卫星序列。从此,M13 便也成为各种动植物重要的DNA 指纹探
针(Gatei 等 1991;Kuhnlein 等 1989)。另一个在人和动物上广泛应用的 DNA 指纹探针是
3´HVR(Jarman 等 1986),它来源于人α-珠蛋白的3´端的一个高度重复区。以上4 个小卫星
探针的重复单位的序列结构如下所示:
33.6(AGGGCTGGAGG)3
33.15(AGAGGTGGGCAGGTGG)
M13(GAGGGTGGNGGNTCT)
3´HVR(GNGGGGNACAG)
从迄今已有的报道来看,在DNA 指纹分析中用得最多的多位点小卫星探针为33.6、
33.15、M13 及3´HVR。此外,人们还从某些动物的基因组中分离克隆了一些小卫星DNA 用
作DNA 指纹探针。如牛的小卫星探针PSRC-7( Plante 等 1991)和猪的小卫星探针pS35
(Coppieters 等 1990)。人工合成的简单重复序列微卫星探针也广泛地用于DNA 指纹分析,
如(GTG)5 、(TG)8、(AT)8、(TCC)5 、(GACA)4。从基因组中分离克隆的微卫星DNA 指纹
探针有PGB725 (牛)(Kashi 等 1990)和 R18.1 (猪)(Haberfield 等 1991)。 孟安明
(1993)发现,任何一个动物个体的基因组总DNA 可标记作为DNA 指纹探针(基因组探针),
在该个体所属物种及其他相关物种上产生具有个体特异性的杂交图谱。以基因组探针进行
DNA 指纹分析不需通过复杂的操作来获得探针DNA,有利于DNA 指纹技术的推广。
1.5.2 DNA 指纹图谱的重要发展
DNA 指纹图谱的重要发展是微卫星DNA 指纹图谱。微卫星(microsatellite)是由2~6 个核苷
酸组成的重复单位串联排列而成的DNA 序列。据估计,在真核生物基因组每10kb 的DNA 序列中至
少有一个微卫星(Tautz 1989),如人体基因组中仅二核苷酸串联重复的微卫星就多达 50 000~
100 000 个。大多数微卫星的长度小于 200bp,但也有更长的微卫星。微卫星不同于小卫星,它们
广泛分布于很多结构基因的内含子、基因间隔区甚至调控序列中(Tautz 等 1984;Weising 1989;
Ishii 等 1985)。早在1974 年,Skinner 等就在寄居蟹(hermit crab)基因组中发现了微卫星DNA,
当时叫做简单串联重复序列(simple tandem repeat)。Singh 等人在1980 年发现蛇的W 性染色体
上也存在着这种序列,它是由GATA/GACA 重复单位组成的。以后的研究表明,在真核生物甚至原
核生物的基因组中都普遍存在这种序列(Jones 等 1981;Tautz 等 1986)。直到1986 年,Ali 等
人首次用合成的GATA/GACA 寡聚核苷酸作探针用于人的DNA 指纹分析,成功地开创了利用微卫星
DNA 探针进行DNA 指纹分析这一新的领域。微卫星探针易于合成,可直接与固定在干胶中的DNA 片
段杂交,所检测的位点普遍具有高度的变异性。1988 年,Schafer 等人进一步发展了这门技术,使
寡聚核苷酸(微卫星)分析技术又一次得到了完善。迄今为止,合成的各种寡聚核苷酸(微卫星)
已成功地应用于人和近百种动植物的DNA 指纹分析(Buitkamp 等 1991a,1991b;Schafer 等
1988;May 等 1991;Nuraburg 等 1989;Hubert 等 1990;Lonn 等1992;Biermerth 等 1992;
Caetano-Anolles 等 1991)。从已有的报道来看,适用范围广、变异性高的微卫星探针主要有
(GTG)n、(GT)n、(GATA)n、(GACA)n、(GAG)n 等(Buitkamp 等1991a,1991b)。
1.5.3 PCR 在DNA 指纹分析中的应用
PCR 是一种在体外大量扩增DNA 的方法。在法医研究上,由于所检验的材料量(如血斑、
精斑、发梢)极微,因此很难获得常规Southern 杂交所需的DNA 量,利用PCR 就可以解决这
一问题。Jeffreys 等(1988)根据多个小卫星的已知侧翼序列来合成引物(每个小卫星两个
引物)。先以极微量( 甚至单个细胞 )的人类基因组DNA 为模板进行体外扩增(产物可长达
10kb),然后再用这些小卫星的混合探针进行Southern 杂交,得到了可以重复做出的具有高度
变异性的DNA 指纹图谱。
1.5.4 单位点高变异性小卫星和微卫星探针的开发
DNA 指纹图谱虽然具有很多的优点,但并非完整无缺。第一,DNA 指纹图谱中每一个个
所含图带数很多,给统计分析带来了许多麻烦。例如,在比较个体之间的DNA 指纹图谱时,
如果某两条带的位置相差很小,那么就很难判断它们是否来自同一位点上的同一等位基因,也
许是由于实验操作过程中凝胶变形等引起的误差影响了分析结果的准确性。第二,DNA 指纹
图带的分辨率很难提高,特别是较小的DNA 片段因难以分开而呈现很低的变异性;长度相差
不大的DNA 片段无法通过电泳分开。第三,DNA 指纹图谱不能区分杂合体和纯合体。在进行
DNA 指纹图谱统计分析时,人们假定图中每一条带分别代表不同的位点,但实际上,如果某
一位点是杂合的,那么此位点在DNA 指纹图谱上会拥有两条带,也就是说在DNA 指纹图谱上
应有两条带代表同一个杂合位点上的不同等位基因。因此,有时以DNA 指纹图谱分析得到的
结果与真实情况也会有所不同。第四,对于某一个位点来说,往往只有一个等位基因出现在
DNA 指纹图谱上,因此无法根据DNA 指纹图谱确定个体在该位点上的基因型。为了克服DNA 指
纹图谱的上述缺点,人们已开始重视单位点探针的开发。所谓单位点探针,是指只是特异性
与某一位点上的等位基因杂交的探针。由于真核基因组中的小卫星和微卫星位点普遍具有高
度的变异性,因此它们是高变异单位点探针的重要来源。基因组中的小卫星位点有数千个,
微卫星位点更达数十万个,通过用现有的多位点小卫星和微卫星探针筛选基因文库,可以得
到众多的高变异单位点探针。迄今为止,国外一些单位已从猪、马、鸡、牛等的基因组中分
离、克隆了数百个小卫星和微卫星探针,这些探针将是构建有关畜禽基因图谱的基础。
1.5.5 其他方面的进展
双向电泳(two-dimensional electrophoresis)的应用,使 DNA 指纹图谱的容量大大增
加(Uitterlinden 等 1989)。变性凝胶电泳可以更有效地分辨等位基因(Uitterlinden 等
1989);电极反转电泳(field inversion gel electrophoresis)提高了 DNA 指纹图谱中大
片段的分辨率(Fowler 等 1988)。由于DNA 指纹图谱在实验技术和统计方法上一直处于不断
的改进之中,因此我们深信在不远的将来,DNA 指纹分析技术必将在医学、畜牧业、农业乃至
整个生物领域得到更加广泛的应用。