去除批次效应选定靶标细胞群后如何进行亚群分析？

2: 关注

3738: 浏览

去除批次效应选定靶标细胞群后如何进行亚群分析？

去除批次效应过程：对不同样品间的相对表达量（logCPM）进行平移校正，批次效应校正后（integrated）只剩下2000个HVG，及其对应的data（logCPM）和scale.data（中心化data）。再进行亚群分析的时候，该采用什么策略呢？

策略1：沿用大群的2000个HVGs，调整PC和resolution，进行分群。
困惑的问题：2000个HVGs并不是目标细胞群中差异变化的基因。细胞亚群分析特征基因分析的时候，如果使用FindAllmaker函数，对原始RNA count进行分析，细胞群特征显示很差。

策略2：亚群分析的时候不考虑批次效应，从头进行Normalize，HVG筛选，scale化分析，聚类。（这种是否可行？获得的亚群是否过于散乱？）

策略3：将目标细胞群作为整体，再以样本为单位进行批次效应校正，聚类和分群？（这个看起来似乎比较科学）

好问题 0 评论收藏举报

查看全部 2 个回答

chatGPT机器人机器人用户来自于: IANA
2023-09-05 09:55

作为生物学家或生物信息学家，针对去除批次效应选定靶标细胞群后的亚群分析问题，我建议采用策略3：将目标细胞群作为整体，再以样本为单位进行批次效应校正、聚类和分群。这个策略看起来比较科学的原因是，我们希望去除批次效应后的数据能够更准确地反映靶标细胞群的特征。将目标细胞群作为整体进行批次效应校正，可以保证在校正过程中不会丢失目标细胞群的特征信号。然后，再以样本为单位进行批次效应校正后的数据进行聚类和分群分析，可以更好地揭示细胞亚群之间的相似性和差异性。具体步骤可以按照以下流程进行： 1. 基于原始RNA count数据进行批次效应校正。可以使用一些常见的批次效应校正方法，如ComBat、SVA等。校正后的数据保留目标细胞群，并确保批次效应被减少。 2. 对校正后的数据进行HVG筛选。根据校正后的数据计算基于差异表达的基因分散度，选择表达变异较大的基因作为HVGs。这些HVGs将帮助我们更好地区分不同亚群。 3. 对HVGs进行数据scale化。对HVGs进行中心化处理，使得每个基因在样本间的表达差异被归一化。 4. 进行聚类和分群分析。可以使用常见的聚类算法，如K-means、hierarchical clustering等。在聚类过程中，根据样本间的相似性将细胞分为不同的亚群。在此过程中，可以根据需要调整聚类参数，如PC和resolution，以获得更好的亚群分辨率。通过以上步骤，我们可以基于去除批次效应后的数据对目标细胞群进行亚群分析。这样的分析策略可以更好地保留目标细胞群的特征，并揭示不同亚群间的差异和相似性。

赞同 0 0评论

关于作者

: m_c101dc02f446cf5872a522aeb243f264 注册会员
这家伙很懒，还没有设置简介

0: 回答

0: 文章

3: 问题

问题动态

发布时间: 2023-09-05 09:53

更新时间: 2023-09-05 15:30

关注人数: 2 人关注