该问题已被锁定!
2
关注
2371
浏览

去除数据中特异值的方法

为什么被折叠? 0 个回复被折叠
孟浩巍 超级管理员 用户来自于: 北京市丰台区
2018-08-24 17:26
简单说说这个问题,其实归结到一句话还是具体问题具体分析。 比如在进行热图的绘制过程当中,有的时候需要把过于大或者过于小的数字进行一下处理,常用的办法就是让它们等于某个分位数。从而让整个热图的颜色分布比较均匀,视觉效果比较好。 再比如,在查看分布的时候,你觉得数字之间有数量级的差异,比如gene 的表达量,就需要log处理。处理之前可能是异常值,log以后就不是异常值了。 结合我们的例子,非要说常用的办法,就是z score,log以及分位数方法。
展翔逝时 注册会员 用户来自于: 华中农业大学
2018-09-06 14:08
[url=https://onenote.com/webapp/pages?token=K10emmh5SYkW-ciU_U-05-CIYGbQ4Vei1fVGM-F0i6uak42LQlmv2B6IGu4TBWZS3mgdp6SLVhLBn6IgiyjAy8plsG7T-eT50undefinedid=636718111198304007]https://onenote.com/webapp/pages?token=K10emmh5SYkW-ciU_U-05-CIYGbQ4Vei1fVGM-F0i6uak42LQlmv2B6IGu4TBWZS3mgdp6SLVhLBn6IgiyjAy8plsG7T-eT50&id=636718111198304007[/url] 异常值判断方法总结

关于作者

问题动态

发布时间
2018-08-24 15:38
更新时间
2018-09-06 14:08
关注人数
2 人关注

相关问题

bulk-RNAseq数据集整合
log2后的数据进行Wilcoxon秩和检验对结果存在什么影响?
使用MAS5.0处理过的芯片数据,能不能直接取对数后用limma包找差异表达基因,为什么不能?
公司双端测序的数据R1R2处理
数据下载
单细胞数据的多个lib是什么意思呢?
用atac-seq数据计算的TSS enrichment score
芯片数据的批次效应 对 差异表达基因的计算结果 影响大不大?
SRR1924430的sra数据与hdf5提取的fastq不一致
非靶向代谢组数据的PLS/OPLS模型Q2小于0.5,模型还可用吗?

推荐内容

如何获得cas9蛋白的高效低效的sgRNA
【求助】差异表达和特异表达
Homer预测motif
关于hub基因的问题
tsRNA测序思路求助
最新的cas9蛋白的sgRNA的数据集
WES数据下游分析和可视化结果展示
xp-ehh取top值
新人求教关于测序以及免疫的问题
chip-seq数据下载有多个SRA
All Rights Reserved Powered BY WeCenter V4.1.0 © 2025