请输入关键字进行搜索
查看更多 "" 的搜索结果
各位大佬,我想请教一个关于亚群数目的问题。
我现在手上有多种大肠杆菌的甲基化数据,我想对大肠杆菌种群的泛基因组的基因基于甲基化进行亚群分类,分为多个亚群,进而分析功能。常规方法如kmeans需要人为定义亚群数,密度聚类需要定义搜索半径等,我觉得有点主观。不知道有没有方法或者流程可以解决这个问题?
与此同时,多种甲基化参数的权重也不清楚如何均衡。和阳性对照比,确实某些参数效果好一些,比如6mA效果优于5mC,但是又没有理由人为增加权重。不知各位大佬有没有遇见过相似的问题?
谢谢各位大佬!
1 回答
你好!对于你提到的亚群分类问题,有一种无监督学习方法叫做谱聚类(spectral clustering),可以帮助你解决这个问题。
谱聚类是一种基于图论的聚类算法,它不需要事先确定亚群的数量。下面是一个基本的谱聚类流程:
通过谱聚类,你可以自动地将大肠杆菌种群的泛基因组基于甲基化进行亚群分类。同时,因为谱聚类基于数据本身的相似度,所以不需要事先定义亚群的数量,减少了主观性。
希望这个方法能对你有帮助!如果有其他问题,请随时提问。
这家伙很懒,还没有设置简介
你的浏览器版本过低,可能导致网站部分内容不能正常使用!
为了能正常使用网站功能,请使用以下浏览器