该问题已被锁定!
2
关注
1623
浏览

pseudobulk分析

为什么被折叠? 0 个回复被折叠
前台管理员 用户来自于: 北京市
2023-06-06 11:11

各类差异比较算法算法,包括DESeq2、EdgeR等,在进行差异比较的时候,都对数据进行标准化处理,一般是用librarySize进行归一。你在实际操作的时候,注意阅读帮助文档,看不同软件对数据矩阵的要求是什么。

chatGPT机器人 机器人 用户来自于: IANA
2023-06-06 10:09
回答:

1.在进行pseudobulk分析时,对单个样本中该细胞类型的细胞数是有要求的,因为pseudobulk是将单细胞数据进行合并,得到一个假想的bulk样本。如果该细胞类型的细胞数过少,会影响pseudobulk的准确性。

2.在进行差异分析时,对counts数据的处理方案会影响结果。对counts数据进行平均是一种比较合理的方法,但是有些情况下细胞总数差异很大,此时进行加和可能更为合适。不过,在使用edgeR等差异分析工具时,会自动校正这个问题。

3.在对pseudobulk数据进行降维聚类时,利用标化后的data数据更为合理。因为标准化后的数据可以消除不同样本之间的批次效应,使得数据更具可比性。

liuzj039 注册会员 用户来自于: 广东省
2023-06-06 10:27

加和和平均在做差异表达分析的时候没有区别。以Deseq2为例,它实际上会假设至少百分之五十的基因是不差异表达的,也就是说会通过raw count的中位数标准化一次。EdgeR的预处理会有些区别,可以看原始文章。

 

降维聚类一般是PCA,PCA看你用什么做了,一般都不会用Raw count,VST或者scale后的CPM都可以。不过我印象里Theis他们组有一篇文章是说做PCA时,用CPM的话如果不scale可以保留一些更有趣的信息,虽然PCA一般应该保持各个维度的尺度近似。

关于作者

kkWang 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-06-06 10:02
更新时间
2023-06-06 11:11
关注人数
2 人关注

相关问题

生信常见的分析目标有哪些呢?
SMRT三代测序Blasr结果coverage的分析以及可视化?
甲基化分析
用GWAS筛选受选择基因,样本数量不够,请问可以用选择消除分析吗
RNA-seq差异分析
cox单因素分析问题
信号通路特征基因集的查询?用于作ssGSEA分析。
普通转录组的跨物种分析
关于ceRNA网络构建的后续分析有哪些?
ROSE包 分析Super Enhancer

推荐内容

你好chatGPT,可以提供包含双细胞去除的单细胞分析完整流程吗?
运行harmony后counts数变成小数
空转bin_size
单细胞seurat对象的基因过滤
单细胞——小鼠T细胞注释的markers
空转bin_size
如何使用seqtk按照比例随机提取单细胞数据?
请教多个scRNA样本整合问题
单细胞分析中在umap聚类(seurat, scanpy)有调整群位置的参数吗?
单细胞RNA-seq分析流程
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024