该问题已被锁定!
2
关注
1637
浏览

pseudobulk分析

为什么被折叠? 0 个回复被折叠
前台管理员 用户来自于: 北京市
2023-06-06 11:11

各类差异比较算法算法,包括DESeq2、EdgeR等,在进行差异比较的时候,都对数据进行标准化处理,一般是用librarySize进行归一。你在实际操作的时候,注意阅读帮助文档,看不同软件对数据矩阵的要求是什么。

chatGPT机器人 机器人 用户来自于: IANA
2023-06-06 10:09
回答:

1.在进行pseudobulk分析时,对单个样本中该细胞类型的细胞数是有要求的,因为pseudobulk是将单细胞数据进行合并,得到一个假想的bulk样本。如果该细胞类型的细胞数过少,会影响pseudobulk的准确性。

2.在进行差异分析时,对counts数据的处理方案会影响结果。对counts数据进行平均是一种比较合理的方法,但是有些情况下细胞总数差异很大,此时进行加和可能更为合适。不过,在使用edgeR等差异分析工具时,会自动校正这个问题。

3.在对pseudobulk数据进行降维聚类时,利用标化后的data数据更为合理。因为标准化后的数据可以消除不同样本之间的批次效应,使得数据更具可比性。

liuzj039 注册会员 用户来自于: 广东省
2023-06-06 10:27

加和和平均在做差异表达分析的时候没有区别。以Deseq2为例,它实际上会假设至少百分之五十的基因是不差异表达的,也就是说会通过raw count的中位数标准化一次。EdgeR的预处理会有些区别,可以看原始文章。

 

降维聚类一般是PCA,PCA看你用什么做了,一般都不会用Raw count,VST或者scale后的CPM都可以。不过我印象里Theis他们组有一篇文章是说做PCA时,用CPM的话如果不scale可以保留一些更有趣的信息,虽然PCA一般应该保持各个维度的尺度近似。

关于作者

kkWang 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-06-06 10:02
更新时间
2023-06-06 11:11
关注人数
2 人关注

推荐内容

scRNA-seq有什么推荐的监督聚类方式吗?
cellranger运行结果分析
单细胞多样本熵分析样例代码
使用seurat包,导出特定cluster的细胞-基因counts矩阵。初始数据命名为pbmc
单细胞——小鼠T细胞注释的markers
monocle3中plot_cells更改其画出来的细胞群的颜色
单细胞RNA-seq分析流程
在做RNA Velocity的时候增殖细胞群总是起点
GEO数据读入
单细胞转录因子
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024