最近在试着练习一篇文章《Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks》,使用的文章所用的ncbi的数据,通过tophat 比对 cufflinks组装 cuffmerge 合并转录本之后。
进行到分析差异时,
命令cuffdiff -o diff_out -b genome.fa -p 8 –L C1,C2 -u merged_asm/merged.gtf\./C1_R1_thout/accepted_hits.bam,./C1_R2_thout/accepted_hits.bam,./C1_R3_thout/accepted_hits.bam \
./C2_R1_thout/accepted_hits.bam,./C2_R3_thout/accepted_hits.bam,./C2_R2_thout/accepted_hits.bam
在集群服务器中,运行第一阶段就用了7个小时还没运行完,我将之kill,通过查阅资料说是运行时间过长要加一个参数 --max-bundle-frags 其默认值为500000,我缩小至50000,[size=13]([/size][size=13] [/size]cuffdiff帮助文档中原文--max-bundle-frags maximum fragments allowed in a bundle before skipping [ default: 500000 ])
所得数据与原文数据产生了很大的差异,label C2 在表达量分析中基本为0,
我得到的图
[attach]241[/attach][attach]242[/attach]
文章的图
[attach]243[/attach]
我想找到其中原因,是不是我设的[size=13]--max-bundle-frags太小了???在前边几步未出现error,当然这一步改参数前后也未出现error,在集群服务器中我也看不到我进行至哪一步我结束的进程,用过的大佬或跟我出现过同样问题的能否帮助我找到问题,非常感谢。[/size]
阅读全文
收起全文