最近做的GO、KEGG分析感觉结果不是很好,而且实验室老师说现在主要看的都是GSEA分析,GSEA分析的数据更加可靠,所以最近在学习如何进行GSEA富集分析,如果用R包的clusterprofile也不是不可以,但是自己实验室老师希望还是能够跟别人一样,在命令行使用Gsea-3.0.jar来进行基因富集分析,主要的问题是:
1、求助gsea-3.0.jar的详细参数的使用方法(不知道如何查看gsea-3.0.jar的帮助文档,使用java -cp gsea-3.0.jar -help我好像只能够查到java的使用方法,而不是gsea-3.0.jar的使用方法,无法得到具体的各种参数的使用介绍。)
2、根据网上以及自己老师曾经使用过的脚本,大体参数如下
[code]collapse true
mode Max_probe
norm meandiv
nperm 1000
permute phenotype
rnd_type no_balance
scoring_scheme weighted
rpt_label my_analysis
metric Signal2Noise
sort real
order descending
chip HG_U95Av2
include_only_symbols true
make_sets true
median false
num 100
plot_top_x 20
rnd_seed timestamp
save_rnd_lists false
set_max 500
set_min 15
zip_report false
gui false[/code][code]
这些个选项中,我最想要知道的是chip选项,据说是跟基因芯片有关,我希望能够专门的解释一下chip数据到底是有何作用,再就是,这个chip数据可以在ensemble上下载,这个chip数据到底有什么用?[/code][code]3、求助一下做GSEA分析的时候对于gmt选择的问题,我发现在用gseapy(此处不是用的Gsea-3.0.jar)使用自己的数据可以利用c2、c3但是无法使用msigdb_v6.2.xml,希望能够介绍一下这写gmt数据的区别,以及各自的应用领域,最后希望知道,有什么gmt文件是特别全的那种的么,虽然处理的速度可能会慢很多,但是,可能比较节省脑子
[/code]
阅读全文
收起全文