该问题已被锁定!
2
关注
1627
浏览

pseudobulk分析

为什么被折叠? 0 个回复被折叠
前台管理员 用户来自于: 北京市
2023-06-06 11:11

各类差异比较算法算法,包括DESeq2、EdgeR等,在进行差异比较的时候,都对数据进行标准化处理,一般是用librarySize进行归一。你在实际操作的时候,注意阅读帮助文档,看不同软件对数据矩阵的要求是什么。

chatGPT机器人 机器人 用户来自于: IANA
2023-06-06 10:09
回答:

1.在进行pseudobulk分析时,对单个样本中该细胞类型的细胞数是有要求的,因为pseudobulk是将单细胞数据进行合并,得到一个假想的bulk样本。如果该细胞类型的细胞数过少,会影响pseudobulk的准确性。

2.在进行差异分析时,对counts数据的处理方案会影响结果。对counts数据进行平均是一种比较合理的方法,但是有些情况下细胞总数差异很大,此时进行加和可能更为合适。不过,在使用edgeR等差异分析工具时,会自动校正这个问题。

3.在对pseudobulk数据进行降维聚类时,利用标化后的data数据更为合理。因为标准化后的数据可以消除不同样本之间的批次效应,使得数据更具可比性。

liuzj039 注册会员 用户来自于: 广东省
2023-06-06 10:27

加和和平均在做差异表达分析的时候没有区别。以Deseq2为例,它实际上会假设至少百分之五十的基因是不差异表达的,也就是说会通过raw count的中位数标准化一次。EdgeR的预处理会有些区别,可以看原始文章。

 

降维聚类一般是PCA,PCA看你用什么做了,一般都不会用Raw count,VST或者scale后的CPM都可以。不过我印象里Theis他们组有一篇文章是说做PCA时,用CPM的话如果不scale可以保留一些更有趣的信息,虽然PCA一般应该保持各个维度的尺度近似。

关于作者

kkWang 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-06-06 10:02
更新时间
2023-06-06 11:11
关注人数
2 人关注

相关问题

SMRT三代测序Blasr结果coverage的分析以及可视化?
普通转录组的跨物种分析
群体进化,重测序,选择分析
分析CRISPR 高通量筛选数据
麻烦问下,转录组差异分析,我需要筛掉比对率低的bam文件或者外显子比对率的样本吗
噬菌体比较基因组分析流程
人工智能技术目前在生信分析中有哪些应用?
转录组和代谢组联合分析的方法有那些?
在riboseq分析中,如何对没有起始密码子和终止密码子的转录本进行三碱基准确性分析?
生存分析KM-plot交叉问题

推荐内容

​单细胞RNA-seq,如何计算不同cluster之间的相关性
单细胞转录因子
单细胞RNA-seq分析流程
使用seurat包,导出特定cluster的细胞-基因counts矩阵。初始数据命名为pbmc
samtools view筛选cellranger比对结果
空转bin_size
单细胞——小鼠T细胞注释的markers
seurat包,如何调节大热图左侧的基因字体大小
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024