什么是VCF?
1个回答
展开全部
什么是VCF文件:全称“The variant call format”,变体调用格式,是一种用于存储DNA多态性数据如snp、插入、删除和结构变体和丰富注释的通用格式。
什么是VCFtools:VCFtools是一个软件套件,它实现了处理VCF文件的各种工具,包括验证、合并、比较,还提供了一个通用的Perl API。
VCF格式:由标题部分(header)和数据部分(Body)组成。标头包含任意数量的元信息行,每一行都以字符' ## '开头,用TAB键分隔开的字段定义行(field definition line)以单个' # '字符开头。元信息头行提供了数据部分中使用的标记和注释的标准化描述。
字段定义行(field definition line)强制有八个列,相应的数据列代表
染色体 chromosome (CHROM);
基于1的位置开始的变体 a 1-based position of the start of the variant (POS);
变体的惟一标识符 unique identifiers of the variant (ID);
参考等位基因 the reference allele(REF);
替代非引用等位基因的逗号分隔列表 a comma separated list of alternate non-reference alleles(ALT);
phred-scaled质量分数 a phred-scaled quality score(QUAL);
网站过滤信息site filtering information (FILTER);
一个额外的分号分隔的列表和用户可扩展的注释 a semicolon separated list of additional, user extensible annotation (INFO)。
GT,genotype,基因型,将等位基因编码为数字:0表示参考等位基因,1表示ALT列中列出的第一个等位基因,2表示ALT列中列出的第二个等位基因,以此类推。等位基因的数量表明样本的倍性,而分隔符表明相对于其他数据线,等位基因是阶段性的(' | ')还是非阶段性的(' / ')。
PS, phase set,表明具有相同PS值的基因型等位基因排列顺序相同。
DP,读取深度。
GL,genotype likelihoods,给定REF和ALT字段中定义的等位基因集,所有可能的基因型的基因型可能性。
GQ, genotype quality,在位点变异的情况下,基因型调用错误的概率。
什么是VCFtools:VCFtools是一个软件套件,它实现了处理VCF文件的各种工具,包括验证、合并、比较,还提供了一个通用的Perl API。
VCF格式:由标题部分(header)和数据部分(Body)组成。标头包含任意数量的元信息行,每一行都以字符' ## '开头,用TAB键分隔开的字段定义行(field definition line)以单个' # '字符开头。元信息头行提供了数据部分中使用的标记和注释的标准化描述。
字段定义行(field definition line)强制有八个列,相应的数据列代表
染色体 chromosome (CHROM);
基于1的位置开始的变体 a 1-based position of the start of the variant (POS);
变体的惟一标识符 unique identifiers of the variant (ID);
参考等位基因 the reference allele(REF);
替代非引用等位基因的逗号分隔列表 a comma separated list of alternate non-reference alleles(ALT);
phred-scaled质量分数 a phred-scaled quality score(QUAL);
网站过滤信息site filtering information (FILTER);
一个额外的分号分隔的列表和用户可扩展的注释 a semicolon separated list of additional, user extensible annotation (INFO)。
GT,genotype,基因型,将等位基因编码为数字:0表示参考等位基因,1表示ALT列中列出的第一个等位基因,2表示ALT列中列出的第二个等位基因,以此类推。等位基因的数量表明样本的倍性,而分隔符表明相对于其他数据线,等位基因是阶段性的(' | ')还是非阶段性的(' / ')。
PS, phase set,表明具有相同PS值的基因型等位基因排列顺序相同。
DP,读取深度。
GL,genotype likelihoods,给定REF和ALT字段中定义的等位基因集,所有可能的基因型的基因型可能性。
GQ, genotype quality,在位点变异的情况下,基因型调用错误的概率。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询