各位大虾,请问在NCBI上怎么找到一个基因的外显子和内含子?
事实上,在NCBI有很多种办法可以确定某个基因的外显子或者内含子,当然还有UTR区域。今天我们来介绍NCBI的其中一个使用软件Splign来在NCBI上找到一个基因的外显子和内含子。操作步骤如下:
1.在Gene数据库,填入基因名HNF-4,我一般的话习惯叫Symbol,每个基因都有个Symbol,即基因名。
2.我们来mouse的HNF4基因来作为今天的例子。Symbol会随着版本的升级而变化,当然,以前使用过的基因名也会保留着。而Symbol会对应一个GeneID,无论Symbol如何改变,GeneID是唯一的。这个ID是非常重要的。在这个页面,我们将看到HNF4基因的结构图,从图中给出的信息可以看出,HNF4基因有10个外显子。蓝色部分是UTR区,显示在5’端有一小段序列和3’端有一大段序列是UTR。
3.在HNF-4基因的RefSeq区域,我们将可以看到这个基因的参考序列,有mRNA和基因组的。这个区域不一定每个基因都有。NM_开头的序列都是参考序列。
4.接下来我们进入Splign的online界面,你可以通过mRNA和基因组的Accession或是它们Fasta格式的序列进行对比,要注意基因组的序列不要太长。推荐直接在下拉框选项里选择,一般常用的生物都在。
5.结果一目了然,10个外显子,而且还显示mRNA以及对应的基因组比对的序列,并且还可以知道某个外显子在mRNA序列上的区域。就连UTR区的序列也知道了。
然后输入ABL[sym] ,代表你是在查找ABL为缩写符号的基因
就会得到
http://www.ncbi.nlm.nih.gov/gene/?term=ABL[sym]
第一个就是人类ABL基因,再点开,得到
http://www.ncbi.nlm.nih.gov/gene/25
该基因位于第9号染色体130713881..130887675。
下拉到第三栏灰色条“Genomic regions, transcripts, and products”,点击偏右侧的,Go to nucleotide: 最后那个GenBank
得到
http://www.ncbi.nlm.nih.gov/nuccore/NC_000009.12?report=genbank&from=130713881&to=130887675
向下拉,你会看到 gene 1..173795就是说该基因全长
然后是mRNA, 你会看到有11段数值,这就是该基因11个外显子的位置。同理,CDs,就是11个外显子的编码区域了。
具体的序列,你在下面根据数值段就可以得到了。
谢谢你的回答,我还想了解如果我想要知道这个基因ABL的2号内含子,请问该怎么找?
同样的,在最后一步找到第二和第三外显子之间的序列就是2号内含子了。
使用NCBI查找基因序列教程