去除批次效应过程:对不同样品间的相对表达量(logCPM)进行平移校正,批次效应校正后(integrated)只剩下2000个HVG,及其对应的data(logCPM)和scale.data(中心化data)。再进行亚群分析的时候,该采用什么策略呢?
策略1:沿用大群的2000个HVGs,调整PC和resolution,进行分群。
困惑的问题:2000个HVGs并不是目标细胞群中差异变化的基因。细胞亚群分析特征基因分析的时候,如果使用FindAllmaker函数,对原始RNA count进行分析,细胞群特征显示很差。
策略2:亚群分析的时候不考虑批次效应,从头进行Normalize,HVG筛选,scale化分析,聚类。(这种是否可行?获得的亚群是否过于散乱?)
策略3:将目标细胞群作为整体,再以样本为单位进行批次效应校正,聚类和分群?(这个看起来似乎比较科学)
这家伙很懒,还没有设置简介