孟浩巍 超级管理员

先把生信坑能做够10年!
关注: 3    |    粉丝: 224    |    积分: 7770    |    威望: 3    |    访问: 14323
孟浩巍 在 2018-09-21 11:31 回答了问题
blastp后,我想提取score的序列,请问使用python应该怎么写这个脚本
孟浩巍: 问题描述很清楚呀!我给你提供一个思路吧:   1. 建立dict, key是你的蛋白名,value 是一个list,长度为4 对应你的4个物种,里面需要存储你的分数值和蛋白名;   2. 开始循环,获得蛋白名,然后获得这个蛋白名对应的list,根据物种来比较分数,如果分数值大于list中存的分数就替...
孟浩巍 在 2018-09-20 21:55 回答了问题
​单细胞RNA-seq,如何计算不同cluster之间的相关性
孟浩巍: 你可以去看一下paper里是怎么计算的,无外乎就是这么几个思路:   1. 选择cluster细胞中的平均情况,然后计算; 2. 选择cluster细胞中的代表情况,然后计算; 3. 选择cluster细胞中的一些特征信息,然后计算;    
孟浩巍 在 2018-09-20 21:54 回答了问题
通过富集得到了一些信号通路,我想看看这些通路里哪些是和癌症相关的,如何实现呢?
孟浩巍: 这是一个好问题,这个属于分析下游的事情了。一般对于这种问题,我有2个建议:   1. 比如你富集到了通路A,然后你就把富集到通路A的gene全部找到,之后一个一个去查;看看到底哪个和cancer相关。   2. 拿你感兴趣的cancer的通路去做GSEA分析。
孟浩巍 在 2018-09-20 14:08 回答了问题
当LIMMA计算计算结果中的调整P值都大于0.05时,可否使用p值<0.05+fc>2来筛选差异表达基因?
孟浩巍: 一般来说是不可以的。
孟浩巍 在 2018-09-19 20:46 回答了问题
知道一批基因的具体位置,如何批量的从基因组中取出基因序列?
孟浩巍: 方法有很多,我说一个在R里操作的办法吧。   1. 首先先使用Bioconductor安装GenomicRange包以及对应物种的BSgenome包,比如你这里应该是拟南芥。   2. 然后把你的区间,构建成GRange对象   3. 直接使用getSeq提取序列   [code]> library...
孟浩巍 在 2018-09-19 20:21 回答了问题
求助 limma计算DEG最后结果中的调整p值没有小于0.01的怎么办。。。
孟浩巍: 我觉得,是不是能够找个有分析结果的数据,先看看你流程有没有问题。 1个显著的gene也没有,这个确实没有遇到过。
孟浩巍 在 2018-09-19 15:58 回答了问题
read过滤的问题
孟浩巍: 切了,就完事了。纠结那么半天。
孟浩巍 在 2018-09-19 15:55 回答了问题
关于cufflinks中cuffdiff的使用问题。
孟浩巍: 如果时间很长,我建议你先使用默认参数,然后使用十分之一的数据确定能够运行成功再说~~  能够成功运行以后,再扔后台慢慢跑就行了,-p参数是控制CPU个数的,多设置几个就行。
孟浩巍 在 2018-09-19 13:54 回答了问题
TCGA数据下载
孟浩巍: TCGA的BAM数据需要授权下载,需要你们学院的院长提出申请,然后写申请报告之后才可以下载。
孟浩巍 在 2018-09-19 13:53 回答了问题
问一个关于miRNA ID的问题
孟浩巍: 一般指版本号。
个人成就
获得 176 次赞同
被 224 人关注了
关注了 3 人
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024