RNA-seq count值和fpkm值不对应

2: 关注

4195: 浏览

RNASeq数据处理

各位大佬好，最近做RNA-seq遇到些细节问题。

请问我在进行RNA-seq 数据分析时，利用featurecount进行基因的定量，同时利用stringtie进行fpkm计算，我对样本的fpkm值计算平均值后画散点图，但是利用featurecount得到的矩阵用deseq2差异分析，获得的差异基因，对点进行标注，发现有的被认为是上调的基因，fpkm值却是下调的，如图所示，

有考虑原因是stringtie和feature count对于reads的选择不一样。

想请教大家造成这样的原因是啥，以及featurecount能用上的reads这么少，对于文库的分析有什么参数需要调整吗？以及哪个才是正确的信息呢？非常感谢大佬解答

好问题 0 评论收藏举报

查看全部 2 个回答

chatGPT机器人机器人用户来自于: IANA
2023-07-20 23:30

尊敬的用户，

感谢您对RNA-seq数据分析的问题提出。您所遇到的RNA-seq count值和fpkm值不对应的问题可能有多个原因。

首先，featurecount和stringtie是两种不同的工具，它们在对reads进行选择和计算时可能存在差异。featurecount是一种基于基因注释的方法，通过将reads映射到基因上进行计数。而stringtie是一种基于转录本组装的方法，它通过组装transcriptome来估计基因的表达量。

这种差异可能导致在同一样本中，某些基因在featurecount的计数中被认为是上调的，但在stringtie的fpkm值中被认为是下调的。这是因为这两种方法使用了不同的计算方式和参考信息。因此，在进行差异分析时，使用不同的工具可能会导致不一致的结果。

另外，您提到featurecount在使用较少的reads时仍能得到结果。这可能是因为featurecount使用了read的overlap信息，即使在低覆盖度下，也能够对reads进行计数。这种特性使得featurecount对于低覆盖度的文库也能够进行分析。

为了解决这个问题，您可以考虑以下几点：

检查数据处理的流程和参数设置是否正确。确保两种工具使用的参考基因组和注释文件一致。
尝试使用其他的基因定量和表达量计算工具，比如HTSeq和Cufflinks等，以验证结果的一致性。
对于差异分析，建议使用一种统一的方法进行，确保使用相同的工具和参数进行分析，以获得一致的结果。
注意在解读差异分析结果时，综合考虑其他的生物学信息，比如基因功能、调控网络等，避免仅仅依赖表达量的变化。

最后，要确定哪个才是正确的信息，需要进一步的验证和综合分析。同时，不同的分析工具和方法都有其局限性，因此综合多个方法的结果可能更加可靠。

希望这些信息对您有帮助。如有任何进一步的问题，请随时提问。

祝您研究顺利！

赞同 0 0评论

关于作者

: yanrushuang 注册会员
这家伙很懒，还没有设置简介

0: 回答

0: 文章

1: 问题

问题动态

发布时间: 2023-07-20 23:26

更新时间: 2023-08-15 17:18

关注人数: 2 人关注