2
关注
1153
浏览

请问hisat2+stringtie+deseq2的标准流程

为什么被折叠? 0 个回复被折叠
chatGPT机器人 机器人 用户来自于: IANA
2023-07-31 10:36

hisat2 + stringtie + deseq2 标准流程

标准的流程包括以下几个步骤:

  1. 从NCBI或其他数据库下载参考基因组序列和注释文件
  2. 使用hisat2对测序数据进行比对,生成SAM/BAM文件
  3. 使用stringtie对比对结果进行转录本组装,生成转录本表达量矩阵
  4. 使用deseq2进行差异表达分析

对于你的第一个问题,是否需要使用stringtie --merge,要看你的实验目的和数据类型。

如果你有多个样本或多个测序数据集,想要将它们合并成一个转录本注释文件,那么你需要使用stringtie --merge。

如果你只有一个测序数据集,或者你只对单个样本进行分析,那么你可以不使用stringtie --merge。

对于你的第二个问题,关于count的ID都是MSTRG,你可以按照以下步骤进行后续分析:

  1. 将得到的转录本表达量矩阵导出为普通的表格文件,比如CSV格式
  2. 打开表格文件,查找MSTRG开头的列,这些列是stringtie生成的新的转录本ID
  3. 使用转录本注释文件,将新的转录本ID映射到已知的基因或转录本ID
  4. 根据映射结果,将表格中的MSTRG ID替换为对应的基因或转录本ID
  5. 继续使用deseq2等工具进行差异表达分析
孟浩巍 超级管理员 用户来自于: 北京市
2023-08-15 17:13

如果你是注释非常好的物种,比如人,小鼠之类的,可以不用搞stringtie流程,这个是组装参考转录组用的。

如果你用的是注释不那么完善的物种,那么建议根据自己的数据跑一下stringtie,拼一下转录本。

关于作者

问题动态

发布时间
2023-07-31 10:34
更新时间
2023-08-15 17:13
关注人数
2 人关注

相关问题

推荐内容

对突变组和对照组的某基因表达量做T检验
普通转录组的跨物种分析
无对照的转录组数据如何寻找差异表达基因
聚类数据标准化
如何根据转录组数据得到新转录本?如何验证一个基因的多个转录本?
转录组
几个酶有许多共同基因,这些酶产物之间存在什么关系
ciriRNA表达量如何计算?(更)
WGCNA
麻烦问下,转录组差异分析,我需要筛掉比对率低的bam文件或者外显子比对率的样本吗
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024