vcf文件说明

 我来答
一袭可爱风1718
2022-06-23 · TA获得超过1.2万个赞
知道大有可为答主
回答量:6139
采纳率:99%
帮助的人:33万
展开全部

1. 什么是VCF
CVF是用于描述SNP,INDEL和SV结果的文本文件。做过DNA重测序,群体遗传进化,BSA,GWAS等项目的人都会遇到VCF文件,这个文件记录了所有样品基因组中所有位置变异(主要包括SNP和InDel)信息。后续几乎所有的分析内容都是基于此文件,比如进化树分析、群体结构分析、PCA分析、GWAS关联分析等等。

官方说明: http://www.internationalgenome.org/wiki/Analysis/vcf4.0/

下面是一个典型VCF文件的示例(部分):

2. 整体说明信息(Meta-information lines)

VCF文件分为两部分内容:以“#”开头的 注释 部分;没有“#”开头的 主体 部分。去掉了头部的注释行,只留下了代表每一行意义的注释行。

VCF文件的开头是整体注释信息,通常以##作为起始,其后一般接以FILTER,INFO,FORMAT等字样。例如:

3. Variation

FORMAT [9] 和 R01 [10]:这两行合起来提供了’R01(某个基因名)′这个sample的基因型的信息。’NA12878′代表这该名称的样品,是由BAM文件中的@RG下的 SM 标签决定的。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式