该问题已被锁定!
2
关注
4299
浏览

pseudobulk分析

为什么被折叠? 0 个回复被折叠
前台管理员 用户来自于: 北京市
2023-06-06 11:11

各类差异比较算法算法,包括DESeq2、EdgeR等,在进行差异比较的时候,都对数据进行标准化处理,一般是用librarySize进行归一。你在实际操作的时候,注意阅读帮助文档,看不同软件对数据矩阵的要求是什么。

chatGPT机器人 机器人 用户来自于: IANA
2023-06-06 10:09
回答:

1.在进行pseudobulk分析时,对单个样本中该细胞类型的细胞数是有要求的,因为pseudobulk是将单细胞数据进行合并,得到一个假想的bulk样本。如果该细胞类型的细胞数过少,会影响pseudobulk的准确性。

2.在进行差异分析时,对counts数据的处理方案会影响结果。对counts数据进行平均是一种比较合理的方法,但是有些情况下细胞总数差异很大,此时进行加和可能更为合适。不过,在使用edgeR等差异分析工具时,会自动校正这个问题。

3.在对pseudobulk数据进行降维聚类时,利用标化后的data数据更为合理。因为标准化后的数据可以消除不同样本之间的批次效应,使得数据更具可比性。

liuzj039 注册会员 用户来自于: 广东省
2023-06-06 10:27

加和和平均在做差异表达分析的时候没有区别。以Deseq2为例,它实际上会假设至少百分之五十的基因是不差异表达的,也就是说会通过raw count的中位数标准化一次。EdgeR的预处理会有些区别,可以看原始文章。

 

降维聚类一般是PCA,PCA看你用什么做了,一般都不会用Raw count,VST或者scale后的CPM都可以。不过我印象里Theis他们组有一篇文章是说做PCA时,用CPM的话如果不scale可以保留一些更有趣的信息,虽然PCA一般应该保持各个维度的尺度近似。

关于作者

kkWang 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-06-06 10:02
更新时间
2023-06-06 11:11
关注人数
2 人关注

相关问题

RNA-seq分析,rlog需要生物学重复才行?有别的Normalization方法吗?
16s rRNA分析中的标准化
WES数据下游分析和可视化结果展示
微生物群体分析中 adonis, anosim 问题
在riboseq分析中,如何对没有起始密码子和终止密码子的转录本进行三碱基准确性分析?
蛋白保守序列分析
关于生存分析的问题
信号通路特征基因集的查询?用于作ssGSEA分析。
GWAS和WGS的选择消除分析有什么区别呀?
使用lapa进行APA分析

推荐内容

空转bin_size
GEO数据读入
monocle3中plot_cells更改其画出来的细胞群的颜色
单细胞——小鼠T细胞注释的markers
运行harmony后counts数变成小数
在做RNA Velocity的时候增殖细胞群总是起点
请教多个scRNA样本整合问题
单细胞多样本熵分析样例代码
用scanpy做单细胞分析,如何去除周期细胞的影响
All Rights Reserved Powered BY WeCenter V4.1.0 © 2026