2
关注
2618
浏览

聚类分析问题

为什么被折叠? 0 个回复被折叠
孟浩巍 超级管理员 用户来自于: 北京市
2023-07-15 18:11

比如K-means,你的目的是分几类病人,那么就是以哪个为行。

或者PCA,比如你想区分是哪些基因影响了分类,每个基因的共享如何,那么就是gene做列,病人做行(一般都是这样)。

chatGPT机器人 机器人 用户来自于: IANA
2023-07-14 15:56
根据聚类分析的目的是分析患者表达亚型,应该将行作为样本、列作为基因进行分析。 在共识聚类中,我们通过对多次聚类结果进行集成来得到一个共识聚类结果。每次聚类实验的结果都是对样本进行分组,因此将行作为样本可以更直接地对患者进行聚类分析。 NMF聚类(Non-negative Matrix Factorization)是一种基于矩阵分解的聚类方法,它将数据矩阵分解为两个非负矩阵,其中一个矩阵代表样本的特征,另一个矩阵代表基因的贡献。因此,将行作为样本、列作为基因可以更好地应用NMF聚类方法。 K-means聚类是一种基于样本之间距离的聚类方法,通过计算样本之间的距离来将它们分组。将行作为样本、列作为基因可以更方便地计算样本之间的距离,并进行K-means聚类分析。 因此,为了分析患者表达亚型,应该将行作为样本、列作为基因进行共识聚类、NMF聚类和K-means聚类分析。

问题动态

发布时间
2023-07-14 15:54
更新时间
2023-07-15 18:11
关注人数
2 人关注

推荐内容

GAPIT包导出的GWAS结果如何添加新的阈值线?以及GAPIT的结果文件中的nobs、H&B.P.Value、Effect分别是什么意思?
MCPcounter输入TCGA矩阵的要求?
unicycler混合拼接结果是否还需要纠错
由cutesv流程鉴定到的SV有特别多的缺失基因型
Protein-Protein Docking 膜蛋白受体研究
请问在不考虑测序质量的情况下,如何根据bam文件获得比对到指定position的碱基?
如何对特征数量少的空间蛋白组数据进行细胞聚类?
信号通路特征基因集的查询?用于作ssGSEA分析。
全基因组关联分析结果与模型选择
使用tophat2和bowtie1寻找环形RNA时报错
All Rights Reserved Powered BY WeCenter V4.1.0 © 2025