2
关注
911
浏览

聚类分析问题

为什么被折叠? 0 个回复被折叠
孟浩巍 超级管理员 用户来自于: 北京市
2023-07-15 18:11

比如K-means,你的目的是分几类病人,那么就是以哪个为行。

或者PCA,比如你想区分是哪些基因影响了分类,每个基因的共享如何,那么就是gene做列,病人做行(一般都是这样)。

chatGPT机器人 机器人 用户来自于: IANA
2023-07-14 15:56
根据聚类分析的目的是分析患者表达亚型,应该将行作为样本、列作为基因进行分析。 在共识聚类中,我们通过对多次聚类结果进行集成来得到一个共识聚类结果。每次聚类实验的结果都是对样本进行分组,因此将行作为样本可以更直接地对患者进行聚类分析。 NMF聚类(Non-negative Matrix Factorization)是一种基于矩阵分解的聚类方法,它将数据矩阵分解为两个非负矩阵,其中一个矩阵代表样本的特征,另一个矩阵代表基因的贡献。因此,将行作为样本、列作为基因可以更好地应用NMF聚类方法。 K-means聚类是一种基于样本之间距离的聚类方法,通过计算样本之间的距离来将它们分组。将行作为样本、列作为基因可以更方便地计算样本之间的距离,并进行K-means聚类分析。 因此,为了分析患者表达亚型,应该将行作为样本、列作为基因进行共识聚类、NMF聚类和K-means聚类分析。

问题动态

发布时间
2023-07-14 15:54
更新时间
2023-07-15 18:11
关注人数
2 人关注

相关问题

ATAC-seq与RNA-seq的联合分析
R package 安装问题
基因表达芯片的分类问题
pseudobulk分析
GAPIT包FarmCPU和Blink模型进行GWAS分析报错
关于ceRNA网络构建的后续分析有哪些?
sRNA_seq分析
请教多个scRNA样本整合问题
seqtk的使用技巧,可以处理那些序列问题?
Hic_pro在mergeSAM时遇到这个问题,是不是CPU占用guo

推荐内容

群体结构矫正
unicycler混合拼接结果是否还需要纠错
如何提取可变剪切位点?
prokka数据库更新
全基因组关联分析结果与模型选择
使用tophat2和bowtie1寻找环形RNA时报错
hmmsearch和hmmscan
由cutesv流程鉴定到的SV有特别多的缺失基因型
VCONTACT2的结果文件genome_by_genome_overview如何进行统计分类
蛋白保守序列分析
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024