去除数据中特异值的方法 - 做专业的生信问答网站

登录

该问题已被锁定！

2: 关注

3096: 浏览

去除数据中特异值的方法

数据去除特异值的方法都有哪些？我在网上搜索的是去除均值加减二倍标准差以外的数据。还有其他的方法吗？对于不同数据类型去除的方法有没有什么区别？

好问题 0 评论收藏举报

查看全部 2 个回答

孟浩巍超级管理员用户来自于: 北京市丰台区
2018-08-24 17:26

简单说说这个问题，其实归结到一句话还是具体问题具体分析。比如在进行热图的绘制过程当中，有的时候需要把过于大或者过于小的数字进行一下处理，常用的办法就是让它们等于某个分位数。从而让整个热图的颜色分布比较均匀，视觉效果比较好。再比如，在查看分布的时候，你觉得数字之间有数量级的差异，比如gene 的表达量，就需要log处理。处理之前可能是异常值，log以后就不是异常值了。结合我们的例子，非要说常用的办法，就是z score，log以及分位数方法。

赞同 1 10评论

关于作者

: 展翔逝时 注册会员
这家伙很懒，还没有设置简介

3: 回答

0: 文章

1: 问题

问题动态

发布时间: 2018-08-24 15:38

更新时间: 2018-09-06 14:08

关注人数: 2 人关注

相关问题

HHblits使用相同的数据库，得出的结果明显差于HHpred网页版的结果。该如何使用HHsuite命令行得到与网页端类似的效果: 4456 浏览 2 关注 2 回答 0 评论

数据不平衡: 2294 浏览 2 关注 1 回答 0 评论

使用seurat包，导出特定cluster的细胞-基因counts矩阵。初始数据命名为pbmc: 3453 浏览 2 关注 1 回答 0 评论

二代测序得到测序数据组装完成后如何进行丰度计算: 3045 浏览 1 关注 1 回答 0 评论

axel，wget下载数据出错的问题，没头绪: 2766 浏览 2 关注 1 回答 0 评论

sc-ATAC数据质控: 3130 浏览 2 关注 1 回答 0 评论

用atac-seq数据计算的TSS enrichment score: 5340 浏览 2 关注 2 回答 0 评论

有关蛋白表达定量的数据库数据打包下载(蛋白组学): 2830 浏览 2 关注 1 回答 0 评论

尿代谢组正负离子数据标准化是否可以均用正离子检测出来的肌酐峰: 2346 浏览 2 关注 1 回答 0 评论

DiffBind 标准化数据: 2709 浏览 2 关注 1 回答 0 评论

推荐内容

问生物信息学需要对哪些方面的数学知识进行深入研究: 3332 浏览 3 关注 2 回答 0 评论

问 bowtie2 参考基因组注释比对: 4070 浏览 2 关注 2 回答 0 评论

问选择信号检测XP-CLR: 4296 浏览 2 关注 1 回答 0 评论

问尿代谢组正负离子数据标准化是否可以均用正离子检测出来的肌酐峰: 2346 浏览 2 关注 1 回答 0 评论

问数据不平衡: 2294 浏览 2 关注 1 回答 0 评论

问 chromosome名称转换: 2501 浏览 2 关注 1 回答 0 评论

问给我一份最新的cas9蛋白的sgRNA的数据集: 2972 浏览 2 关注 1 回答 0 评论

问 logistic回归、异常值: 2802 浏览 2 关注 1 回答 0 评论

问基因互作网络和蛋白互作网络: 2740 浏览 2 关注 2 回答 0 评论

问蛋白表达矩阵: 2807 浏览 1 关注 1 回答 0 评论

All Rights Reserved Powered BY WeCenter V4.1.0 © 2026