该问题已被锁定!
2
关注
1911
浏览

去除数据中特异值的方法

查看全部 2 个回答

孟浩巍 超级管理员 用户来自于: 北京市丰台区
2018-08-24 17:26
简单说说这个问题,其实归结到一句话还是具体问题具体分析。 比如在进行热图的绘制过程当中,有的时候需要把过于大或者过于小的数字进行一下处理,常用的办法就是让它们等于某个分位数。从而让整个热图的颜色分布比较均匀,视觉效果比较好。 再比如,在查看分布的时候,你觉得数字之间有数量级的差异,比如gene 的表达量,就需要log处理。处理之前可能是异常值,log以后就不是异常值了。 结合我们的例子,非要说常用的办法,就是z score,log以及分位数方法。

关于作者

问题动态

发布时间
2018-08-24 15:38
更新时间
2018-09-06 14:08
关注人数
2 人关注

相关问题

RNA结合蛋白数据库
数据不平衡
Aspera数据下载报错
有关蛋白表达定量的数据库数据打包下载(蛋白组学)
在很多分析表达谱芯片的教程中,使用limma 包寻找差异表达基因,都是先找到差异表达探针,再把探针注释为基因id,为何不先进行注释再计算差异表达呢?这两种方法有什么区别呢?
最新的cas9蛋白的sgRNA的数据集
如何下载指定文献的原始数据??
SRA 数据批量下载
bulk-RNAseq数据集整合
sc-ATAC数据质控

推荐内容

关于基因间的相关性分析
linux软件安装
seqtk的使用技巧,可以处理那些序列问题?
想补充生信统计学知识
蛋白表达矩阵
【求助】如何确定时期特定表达基因
ROSE算法寻找SEs
如何使用seqtk按照比例随机提取单细胞数据?
tsRNA测序思路求助
All Rights Reserved Powered BY WeCenter V4.1.0 © 2025