各位大佬好,最近做RNA-seq遇到些细节问题。
请问我在进行RNA-seq 数据分析时,利用featurecount进行基因的定量,同时利用stringtie进行fpkm计算,我对样本的fpkm值计算平均值后画散点图,但是利用featurecount得到的矩阵用deseq2差异分析,获得的差异基因,对点进行标注,发现有的被认为是上调的基因,fpkm值却是下调的,如图所示,
有考虑原因是stringtie和feature count对于reads的选择不一样。
想请教大家造成这样的原因是啥,以及featurecount能用上的reads这么少,对于文库的分析有什么参数需要调整吗?以及哪个才是正确的信息呢?非常感谢大佬解答
2 回答
尊敬的用户,
感谢您对RNA-seq数据分析的问题提出。您所遇到的RNA-seq count值和fpkm值不对应的问题可能有多个原因。
首先,featurecount和stringtie是两种不同的工具,它们在对reads进行选择和计算时可能存在差异。featurecount是一种基于基因注释的方法,通过将reads映射到基因上进行计数。而stringtie是一种基于转录本组装的方法,它通过组装transcriptome来估计基因的表达量。
这种差异可能导致在同一样本中,某些基因在featurecount的计数中被认为是上调的,但在stringtie的fpkm值中被认为是下调的。这是因为这两种方法使用了不同的计算方式和参考信息。因此,在进行差异分析时,使用不同的工具可能会导致不一致的结果。
另外,您提到featurecount在使用较少的reads时仍能得到结果。这可能是因为featurecount使用了read的overlap信息,即使在低覆盖度下,也能够对reads进行计数。这种特性使得featurecount对于低覆盖度的文库也能够进行分析。
为了解决这个问题,您可以考虑以下几点:
最后,要确定哪个才是正确的信息,需要进一步的验证和综合分析。同时,不同的分析工具和方法都有其局限性,因此综合多个方法的结果可能更加可靠。
希望这些信息对您有帮助。如有任何进一步的问题,请随时提问。
祝您研究顺利!
这家伙很懒,还没有设置简介