2
关注
2064
浏览

聚类分析问题

为什么被折叠? 0 个回复被折叠
孟浩巍 超级管理员 用户来自于: 北京市
2023-07-15 18:11

比如K-means,你的目的是分几类病人,那么就是以哪个为行。

或者PCA,比如你想区分是哪些基因影响了分类,每个基因的共享如何,那么就是gene做列,病人做行(一般都是这样)。

chatGPT机器人 机器人 用户来自于: IANA
2023-07-14 15:56
根据聚类分析的目的是分析患者表达亚型,应该将行作为样本、列作为基因进行分析。 在共识聚类中,我们通过对多次聚类结果进行集成来得到一个共识聚类结果。每次聚类实验的结果都是对样本进行分组,因此将行作为样本可以更直接地对患者进行聚类分析。 NMF聚类(Non-negative Matrix Factorization)是一种基于矩阵分解的聚类方法,它将数据矩阵分解为两个非负矩阵,其中一个矩阵代表样本的特征,另一个矩阵代表基因的贡献。因此,将行作为样本、列作为基因可以更好地应用NMF聚类方法。 K-means聚类是一种基于样本之间距离的聚类方法,通过计算样本之间的距离来将它们分组。将行作为样本、列作为基因可以更方便地计算样本之间的距离,并进行K-means聚类分析。 因此,为了分析患者表达亚型,应该将行作为样本、列作为基因进行共识聚类、NMF聚类和K-means聚类分析。

问题动态

发布时间
2023-07-14 15:54
更新时间
2023-07-15 18:11
关注人数
2 人关注

相关问题

seqtk的使用技巧,可以处理那些序列问题?
使用lapa进行APA分析
kraken2软件运行时内存分配的问题
用GWAS筛选受选择基因,样本数量不够,请问可以用选择消除分析吗
请教一个问题,一个转录因子TF只会调控位于同一条链的基因,还是有可能调控反义链的基因?
关于生存分析的问题
cox回归问题
关于hub基因的问题
进行转录组数据分析时,进行cuffdiff后的输出文件gene_exp.diff中,一个基因出现了两个不同的表达量数据,应该如何处理?
cox单因素分析问题

推荐内容

prokka数据库更新
动态库存在但调用报错问题
hmmsearch和hmmscan
VCONTACT2的结果文件genome_by_genome_overview如何进行统计分类
linux下非root用户设置所运行任务的CPU占用率和线程数
请问在不考虑测序质量的情况下,如何根据bam文件获得比对到指定position的碱基?
使用tophat2和bowtie1寻找环形RNA时报错
如何按一个列表对基因型文件进行过滤,剔除不需要的样本?
ASR祖先序列重建,最后一步使用PAML时出现一些问题
linux下使用convert出现报错,可能是什么原因?如何解决?
All Rights Reserved Powered BY WeCenter V4.1.0 © 2025