该问题已被锁定!
3
关注
1046
浏览

如何处理fastqc报告中duplication level报错的问题

为什么被折叠? 0 个回复被折叠
米婷婷 前台管理员 用户来自于: 北京市
2018-08-23 20:59
[size=14]fastx_trimmer是为了去掉测序质量不好的两端序列并且统一所有reads的长度,所以只能按照你最终要求的长度来切而不可能去补平,根据fastqc的结果看首尾两端质量较差的片段有多长再决定 -f 和 -l 参数,比如说我的测序长度是150bp, cutadapt 去除完低于135bp的reads丢掉,然后进行trim,-f 11 -l 135, 也就是要11bp到135bp中间的序列,最终长度为125bp, 也可以先trim然后再cutadapt,目的都是为了得到测序质量高的中间部分;RNA-Sequence一般来说不考虑去除duplicate reads, 但是你这个看起来好像确实比较严重,需不需要去还是大神们来解惑;建议你看一下群主的live,“如何入门生物信息学”,这个流程讲得非常清楚[/size]
孟浩巍 超级管理员 用户来自于: 北京市
2018-08-23 20:49
首先,对于FastQC duplication衡量的问题,应该先考虑是什么建库方式。是DNA重测序,还是RNA-Seq,如果是RNA-Seq duplication level报警是很容易的,因为很多gene存在多拷贝的情况。   其次,那么这个duplication到底严不严重,或者后续怎么处理呢,目前没有唯一的定论。但是有这么几个原则:   [list] [*]RNA-Seq一般不去duplication,除非是设计了UMI或者random barcode,如果设计了这些序列,在reads水平进行去duplication,单端reads推荐seqkit工具,双端测序推荐UniqFast去reads的duplication;[/*] [*]DNA-Seq一般在比对完以后,用picard 里面的MarkDuplicates 模块去duplication;[/*] [*]DNA测序中,酶切打断一般去duplication,超声打断一般不去 duplication;[/*] [*]常见的ChIP-Seq不需要去duplication。[/*] [/list]   最后,具体的问题需要具体的分析。   以上。

关于作者

windowft 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2018-08-23 19:25
更新时间
2018-08-23 20:59
关注人数
3 人关注

推荐内容

R进行GO时出现No gene can be mapped....
分析CRISPR 高通量筛选数据
科研/读博
利用GATK的HaplotypeCaller生成GVCF一直报错怎么回事
用R画RNA_seq中变化显著的heatmap聚类热图
使用cutadapt去掉adaptor后,fastqc结果的sequence distribution报错
如何快速将基因名称转换为基因ID(拟南芥)
bowtie2使用报错,求助啦
使用tophat2和bowtie1寻找环形RNA时报错
linux系统中使用fastqc报错
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024