SSR的重复序列
生物的基因组中,特别是高等生物的基因组中含有大量的重复序列,根据重复序列在基因组中的分布形式可将其分为串联重复序列(Tandem Repeats Sequence,TRS)和散布重复序列(Dispersed Repeats Sequence,DRS)。其中,串联重复序列是由相关的重复单位首尾相连、成串排列而成的。发现的串联重复序列主要有两类:一类是由功能基因组成的(如rRNA和组蛋白基因);另一类是由无功能的序列组成的。 根据重复序列的重复单位的长度,可将串联重复序列分为卫星DNA、微卫星DNA、小卫星 DNA等。微卫星DNA又叫简单重复序列(Simple Sequence Repeat,SSR),指的是基因组中由1-6个核苷酸组成的基本单位重复多次构成的一段DNA,广泛分布于基因组的不同位置,长度一般在200 bp以下。研究表明,微卫星在真核生物的基因组中的含量非常丰富,而且常常是随机分布于核DNA中。在植物中通过对拟南芥、玉米、水稻、小麦等的研究表明微卫星在植物中也很丰富,均匀分布于整个植物基因组中,但不同植物中微卫星出现的频率变化是非常大的,如在主要的农作物中两种最普遍的二核苷酸重复单位(AC)n和(GA)n在水稻、小麦、玉米、烟草中的数量分布频率是不同的。在小麦中估计有3000个(AC)n序列重复和约6000个(GA)n序列重复,两个重复之间的距离平均分别为704 kb、440 kb,而在水稻中,(AC)n序列重复约有1000个左右,(GA)n 重复约有2000个,重复之间的平均距离分别为450 kb、225 kb。
另外在植物中也发现一些三核苷酸和四核苷酸的重复,其中最常见的是(AAG)n、(AAT)n。在单子叶和双子叶植物中SSR数量和分布也有差异,平均分别为64.6 kb和21.2 kb中有一个SSR。研究还发现,单核苷酸及二核苷酸重复类型的SSR主要位于非编码区,而有部分三核苷酸类型位于编码区。另外在叶绿体基因组中,也报道了一些微卫星,以A/T序列重复为主。研究发现,微卫星中重复单位的数目存在高度变异,这些变异表现为微卫星数目的整倍性变异或重复单位序列中的序列有可能不完全相同,因而造成多个位点的多态性。如果能够将这些变异揭示出来,就能发现不同的SSR在不同的种甚至不同个体间的多态性,基于这一想法,人们发展了SSR标记。SSR标记又称为序列标签微卫星位点(sequence tagged microsatellite site),简写为STMS,是目前最常用的微卫星标记之一。由于基因组中某一特定的微卫星的侧翼序列通常都是保守性较强的单一序列,因而可以将微卫星侧翼的DNA片段克隆、测序,然后根据微卫星的侧翼序列就可以人工合成引物进行PCR扩增,从而将单个微卫星位点扩增出来。由于单个微卫星位点重复单元在数量上的变异,个体的扩增产物在长度上的变化就产生长度的多态性,这一多态性称为简单序列重复长度多态性(Simple Sequence length polymorphism,SSLP),每一扩增位点就代表了这一位点的一对等位基因。由于SSR重复数目变化很大,所以SSR标记能揭示比RFLP高得多的多态性,这就是SSR标记的原理。与其它分子标记相比,SSR标记具有以下优点:①数量丰富,覆盖整个基因组,揭示的多态性高;②具有多等位基因的特性,提供的信息量高;③以孟德尔方式遗传,呈共显性;④每个位点由设计的引物顺序决定,便于不同的实验室相互交流合作开发引物。因而该技术已广泛用于遗传图谱的构建、目标基因的标定、指纹图的绘制等研究中。但应看到,SSR标记的建立首先要对微卫星侧翼序列进行克隆、测序、人工设计合成引物以及标记的定位、作图等基础性研究,因而其开发费用相当高,各个实验室必须进行合作才能开发更多的标记。由于SSR标记具有较大的应用价值,且种属特异性较强,在一些主要的农作物中SSR标记研究都进行了合作,共同进行STMS引物的开发。 简单重复序(Simple Sequence Repeat,SSR)
简单重复序(SSR)也称微卫星DNA,其串联重复的核心序列为1一6 bp,其中最常见是双核苷酸重复,即(CA) n和(TG) n每个微卫星DNA的核心序列结构相同,重复单位数目10一60个,其高度多态性主要来源于串联数目的不同。SSR标记的基本原理:根据微卫星序列两端互补序列设计引物,通过PCR反应扩增微卫星片段,由于核心序列串联重复数目不同,因而能够用PCR的方法扩增出不同长度的PCR产物,将扩增产物进行凝胶电泳,根据分离片段的大小决定基因型并计算等位基因频率。在真核生物中,存在许多2-5bp简单重复序列,称为“微卫星DNA”其两端的序列高度保守,可设计双引物进行PCR扩增,揭示其多态性。
SSR具有以下一些优点:(l)一般检测到的是一个单一的多等位基因位点;⑵微卫星呈共显性遗传,故可鉴别杂合子和纯合子;⑶所需DNA量少。显然,在采用SSR技术分析微卫星DNA多态性时必须知道重复序列两端的DNA序列的信息。如不能直接从DNA数据库查寻则首先必须对其进行测序。 复合型(compound)。指2个或2个以上的串联核心序列由3个或3个以上的连续的非重复碱基分隔开,但这种连续性的核心序列重复数不少于5。如:ATATATATATATATGGGATATATATATATA
3种类型中完全型是SSR标记中应用较多的一种类型。 SSR在植物基因组中的分布SSR广泛分布于各种真核生物的基因组中,大约每隔10~50kb就存在一个SSR。哺乳动物中的SSR的数量大约为植物中的5~6倍。在植物中,平均23.3kb就有一个SSR;双子叶植物中的SSR数量大于单子叶植物,前者两个SSR之间的平均间距为21.2kb,后者为64.6kb;核DNA中的SSR数量多于细胞质DNA中的SSR,绝大多数单碱基重复型及2碱基重复型SSR存在于非编码区,3碱基重复型多位于编码区。 借鉴其他近缘种序列。
通过筛选文库、测序开发自己的SSR引物。
通过核酸数据库查询,从已有序列中搜寻包括SSR的序列并设计引物。 提取DNA;PCR扩增;电泳及显色;电泳胶板带型的照相、记录;数据分析处理。
其中,PCR产物分离的电泳方法主要有:高浓度琼脂糖电泳(4%胶只能分辨4-6bp差异);变性聚丙烯酰胺序列胶电泳;非变性聚丙烯酰胺凝胶电泳。
由于扩增的片段短(一般小于300bp),基因间的差异小(一般为几个bp),故通常使用分辨率高的聚丙烯酰胺凝胶电泳。在程序上,变性胶虽然比非变性胶麻烦些,但考虑到在非变性胶上会出现人为假象—异源双链分子,比如导致SSR杂合子中出现3-4条带,而不是正常的2条带,从而干扰等位位点统计,因此我们建议在SSR分析中均采用变性胶电泳。
PCR扩增产物显色方法有:同位素放射性自显影法;荧光染料标记法;溴化乙锭(EB)显色法;银染法(多用此法) 。