该问题已被锁定!
2
关注
1498
浏览

pseudobulk分析

为什么被折叠? 0 个回复被折叠
前台管理员 用户来自于: 北京市
2023-06-06 11:11

各类差异比较算法算法,包括DESeq2、EdgeR等,在进行差异比较的时候,都对数据进行标准化处理,一般是用librarySize进行归一。你在实际操作的时候,注意阅读帮助文档,看不同软件对数据矩阵的要求是什么。

chatGPT机器人 机器人 用户来自于: IANA
2023-06-06 10:09
回答:

1.在进行pseudobulk分析时,对单个样本中该细胞类型的细胞数是有要求的,因为pseudobulk是将单细胞数据进行合并,得到一个假想的bulk样本。如果该细胞类型的细胞数过少,会影响pseudobulk的准确性。

2.在进行差异分析时,对counts数据的处理方案会影响结果。对counts数据进行平均是一种比较合理的方法,但是有些情况下细胞总数差异很大,此时进行加和可能更为合适。不过,在使用edgeR等差异分析工具时,会自动校正这个问题。

3.在对pseudobulk数据进行降维聚类时,利用标化后的data数据更为合理。因为标准化后的数据可以消除不同样本之间的批次效应,使得数据更具可比性。

liuzj039 注册会员 用户来自于: 广东省
2023-06-06 10:27

加和和平均在做差异表达分析的时候没有区别。以Deseq2为例,它实际上会假设至少百分之五十的基因是不差异表达的,也就是说会通过raw count的中位数标准化一次。EdgeR的预处理会有些区别,可以看原始文章。

 

降维聚类一般是PCA,PCA看你用什么做了,一般都不会用Raw count,VST或者scale后的CPM都可以。不过我印象里Theis他们组有一篇文章是说做PCA时,用CPM的话如果不scale可以保留一些更有趣的信息,虽然PCA一般应该保持各个维度的尺度近似。

关于作者

kkWang 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-06-06 10:02
更新时间
2023-06-06 11:11
关注人数
2 人关注

相关问题

WES数据下游分析和可视化结果展示
关于ceRNA网络构建的后续分析有哪些?
微生物群体分析中 adonis, anosim 问题
如何针对affy表达谱芯片计算结果分析不同样本之间是否表达差异
怎么对基因启动子含有什么元件进行分析
转录组和代谢组联合分析的方法有那些?
ATAC-seq与RNA-seq的联合分析
蛋白保守序列分析
chipseq分析,利用deeptools的computeMatrix reference-point画样本的peak center信号图
关于cox回归分析问题

推荐内容

seurat中如何通过坐标/细胞名删掉细胞
空转bin_size
如何使用seqtk按照比例随机提取单细胞数据?
单细胞转录因子
seurat包,如何调节大热图左侧的基因字体大小
harmony整合样本前需要分别预处理吗?
单细胞多样本熵分析样例代码
单细胞分析中在umap聚类(seurat, scanpy)有调整群位置的参数吗?
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024