去除批次效应选定靶标细胞群后如何进行亚群分析？

2: 关注

4135: 浏览

去除批次效应选定靶标细胞群后如何进行亚群分析？

去除批次效应过程：对不同样品间的相对表达量（logCPM）进行平移校正，批次效应校正后（integrated）只剩下2000个HVG，及其对应的data（logCPM）和scale.data（中心化data）。再进行亚群分析的时候，该采用什么策略呢？

策略1：沿用大群的2000个HVGs，调整PC和resolution，进行分群。
困惑的问题：2000个HVGs并不是目标细胞群中差异变化的基因。细胞亚群分析特征基因分析的时候，如果使用FindAllmaker函数，对原始RNA count进行分析，细胞群特征显示很差。

策略2：亚群分析的时候不考虑批次效应，从头进行Normalize，HVG筛选，scale化分析，聚类。（这种是否可行？获得的亚群是否过于散乱？）

策略3：将目标细胞群作为整体，再以样本为单位进行批次效应校正，聚类和分群？（这个看起来似乎比较科学）

好问题 0 评论收藏举报

2 回答

孟浩巍超级管理员用户来自于: 北京市
2023-09-05 15:30

分群之前不建议做scale，scale的目的主要是统一量纲，然后把方差影响缩小；

一般分群都是要用类似harmony的方法进行整合，整合后主要是为了画图；最后在分群找marker gene的时候还是要用raw count去找。

具体找marker gene的时候，如果是一些成熟体系分群，比如血液的PBMC，已经有非常好的reference，你就照着reference分即可；哪怕是没有很好的reference，都这个年代了，大概率你也不会是第一个搞某个体系分群的人，主要还是要结合过往单细胞的数据去参考；一种极特殊的情况，就是确实之前没人做过你这个单细胞体系的分群，这个时候你主要就应该以以往流式细胞分选分细胞类型的文献为主。

所以，绘图和找marker不是一步的，是两步。

赞同 2 2评论

chatGPT机器人机器人用户来自于: IANA
2023-09-05 09:55

作为生物学家或生物信息学家，针对去除批次效应选定靶标细胞群后的亚群分析问题，我建议采用策略3：将目标细胞群作为整体，再以样本为单位进行批次效应校正、聚类和分群。这个策略看起来比较科学的原因是，我们希望去除批次效应后的数据能够更准确地反映靶标细胞群的特征。将目标细胞群作为整体进行批次效应校正，可以保证在校正过程中不会丢失目标细胞群的特征信号。然后，再以样本为单位进行批次效应校正后的数据进行聚类和分群分析，可以更好地揭示细胞亚群之间的相似性和差异性。具体步骤可以按照以下流程进行： 1. 基于原始RNA count数据进行批次效应校正。可以使用一些常见的批次效应校正方法，如ComBat、SVA等。校正后的数据保留目标细胞群，并确保批次效应被减少。 2. 对校正后的数据进行HVG筛选。根据校正后的数据计算基于差异表达的基因分散度，选择表达变异较大的基因作为HVGs。这些HVGs将帮助我们更好地区分不同亚群。 3. 对HVGs进行数据scale化。对HVGs进行中心化处理，使得每个基因在样本间的表达差异被归一化。 4. 进行聚类和分群分析。可以使用常见的聚类算法，如K-means、hierarchical clustering等。在聚类过程中，根据样本间的相似性将细胞分为不同的亚群。在此过程中，可以根据需要调整聚类参数，如PC和resolution，以获得更好的亚群分辨率。通过以上步骤，我们可以基于去除批次效应后的数据对目标细胞群进行亚群分析。这样的分析策略可以更好地保留目标细胞群的特征，并揭示不同亚群间的差异和相似性。

赞同 0 0评论

关于作者

: m_c101dc02f446cf5872a522aeb243f264 注册会员
这家伙很懒，还没有设置简介

0: 回答

0: 文章

3: 问题

问题动态

发布时间: 2023-09-05 09:53

更新时间: 2023-09-05 15:30

关注人数: 2 人关注