如何在linux下安装TopHat软件
1个回答
推荐于2016-04-15 · 知道合伙人数码行家
huanglenzhi
知道合伙人数码行家
向TA提问 私信TA
知道合伙人数码行家
采纳数:117538
获赞数:517193
长期从事计算机组装,维护,网络组建及管理。对计算机硬件、操作系统安装、典型网络设备具有详细认知。
向TA提问 私信TA
关注
展开全部
安装
最简单的安装方法,注意版本
下载Bowtie、TopHat、Cufflinks的二进制发布包,解压到相同的目录
下载samtools,make,将生成的可执行samtools程序也cp到同一个目录
增加该目录到PATH
参数与使用
Usage: tophat [options]* <index_base>
<reads1_1[,...,readsN_1]> [reads1_2,...readsN_2]
-o 输出目录,默认值为 “./tophat_out”。
–solexa-quals/solexa1.3-quals 质量编码,关于质量编码格式请参考《FastQ格式介绍》
-p 线程数,默认值为单线程1.,可以使用多线程
-G/–GTFSupply TopHat with a set of gene model annotations and/or known
transcripts, as a GTF 2.2 or GFF3 formatted file.指定已有转录本信息
–no-novel-juncs 不查找新的可变剪切
-r
比对时两成对引物间的距离中值。比如说,如果你的插入片段有300bp,而每个引物有50bp,那么r值就应该是200=(300+50*2)/2。没有默认值,如果是末端配对比对时这个值是必须的。
–mate-std-dev 末端配对时中间插入片段的长度的标准差,默认值为20bp
paired-end数据应该如何做
paired end reads是好还是坏,好又好在哪里?如何从结果中体现,如何同一批paired-end reads 使用paired-end
参数与不适用差别在哪里?
READS文件
paired end的reads必须放在不同的两个文件中,文件名必须按照*_1, *_2的规范成对出现,Mixing paired- and
single- end reads together is not supported.不要将paired-end的数据与single end
reads放到一起进行处理。
设置-R参数
大多数情况,使用默认值就可以了,TopHat允许一定量的偏差,TopHat在多个地方使用到这个值,比如当寻找剪切位点与fusion break
point。同时在生成报告的最后阶段选择最佳的alignment时,用到这个信息。可以先用少量的数据进行比对,在比对结果的SAM结果中,对于paired
reads,第九列是插入片段的大概长度,可以用这个数值减去两倍的read的长度,就可以得到实际的-r参数需要设置的大小,如果值太大应该小心,只有比对上同一个外显子的情况具有意义。
控制结果的参数
–no-discordant For paired reads, report only concordant
mappings.对于成对的读取,只报告一致的映射。
–no-mixed For paired reads, only report read alignments if both reads in a
pair can be mapped (by default, if TopHat cannot find a concordant 和谐 or
discordant 不和谐 alignment for both reads in a pair, it will find and report
alignments for each read separately分别; this option disables that
behavior).
结果读取
paired-end reads,两个reads可以相互验证,这样可以有效的出去许多假阳性的拼接,增加结果的准确性。
最简单的安装方法,注意版本
下载Bowtie、TopHat、Cufflinks的二进制发布包,解压到相同的目录
下载samtools,make,将生成的可执行samtools程序也cp到同一个目录
增加该目录到PATH
参数与使用
Usage: tophat [options]* <index_base>
<reads1_1[,...,readsN_1]> [reads1_2,...readsN_2]
-o 输出目录,默认值为 “./tophat_out”。
–solexa-quals/solexa1.3-quals 质量编码,关于质量编码格式请参考《FastQ格式介绍》
-p 线程数,默认值为单线程1.,可以使用多线程
-G/–GTFSupply TopHat with a set of gene model annotations and/or known
transcripts, as a GTF 2.2 or GFF3 formatted file.指定已有转录本信息
–no-novel-juncs 不查找新的可变剪切
-r
比对时两成对引物间的距离中值。比如说,如果你的插入片段有300bp,而每个引物有50bp,那么r值就应该是200=(300+50*2)/2。没有默认值,如果是末端配对比对时这个值是必须的。
–mate-std-dev 末端配对时中间插入片段的长度的标准差,默认值为20bp
paired-end数据应该如何做
paired end reads是好还是坏,好又好在哪里?如何从结果中体现,如何同一批paired-end reads 使用paired-end
参数与不适用差别在哪里?
READS文件
paired end的reads必须放在不同的两个文件中,文件名必须按照*_1, *_2的规范成对出现,Mixing paired- and
single- end reads together is not supported.不要将paired-end的数据与single end
reads放到一起进行处理。
设置-R参数
大多数情况,使用默认值就可以了,TopHat允许一定量的偏差,TopHat在多个地方使用到这个值,比如当寻找剪切位点与fusion break
point。同时在生成报告的最后阶段选择最佳的alignment时,用到这个信息。可以先用少量的数据进行比对,在比对结果的SAM结果中,对于paired
reads,第九列是插入片段的大概长度,可以用这个数值减去两倍的read的长度,就可以得到实际的-r参数需要设置的大小,如果值太大应该小心,只有比对上同一个外显子的情况具有意义。
控制结果的参数
–no-discordant For paired reads, report only concordant
mappings.对于成对的读取,只报告一致的映射。
–no-mixed For paired reads, only report read alignments if both reads in a
pair can be mapped (by default, if TopHat cannot find a concordant 和谐 or
discordant 不和谐 alignment for both reads in a pair, it will find and report
alignments for each read separately分别; this option disables that
behavior).
结果读取
paired-end reads,两个reads可以相互验证,这样可以有效的出去许多假阳性的拼接,增加结果的准确性。
力控科技
2024-08-19 广告
2024-08-19 广告
ForceSCADA是力控科技信创产品的重要组成部分,具备完全自主知识产权,支持部署在Linux桌面版、服务器版、嵌入式等系统架构下。使用ForceSCADA可以搭建创新性高、扩展性佳、融合度强的SCADA平台,进而构建高效、智能化的监控中...
点击进入详情页
本回答由力控科技提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |