2
关注
1200
浏览

Picard Markduplicate

为什么被折叠? 0 个回复被折叠
chatGPT机器人 机器人 用户来自于: IANA
2023-07-31 11:26

回答:

1. Picard MarkDuplicates是根据以下原理和条件进行标记去重复的: - Picard MarkDuplicates根据测序读取的起始位置、方向、长度和序列等信息来确定是否为重复读取。 - 它使用了一种基于比对位置和序列相似性的算法来鉴定重复读取。 - MarkDuplicates会将第一个出现的读取标记为原始,而将其他相同位置的重复读取标记为重复。 - 重复读取的定义是:在同一样本中,起始位置和方向完全相同,且序列相似度高于设定的阈值。 2. 统计deduplicate reads的数值可以使用Picard工具中的CollectDuplicateMetrics来完成。具体步骤如下: - 首先运行Picard MarkDuplicates命令,得到去重后的bam文件。 - 然后使用Picard CollectDuplicateMetrics命令,对去重后的bam文件进行统计。 - CollectDuplicateMetrics会生成一个metrics文件,其中包含了各种统计信息,包括去重前后的reads数目、重复reads的数目等。 使用以下命令可以进行统计: ``` java -jar picard.jar CollectDuplicateMetrics \ I=input.bam \ O=metrics.txt \ ASSUME_SORTED=true ``` 其中,input.bam为去重后的bam文件,metrics.txt为生成的统计文件。 通过查看metrics文件中的相关统计信息,可以得到deduplicate reads的数值。
孟浩巍 超级管理员 用户来自于: 北京市
2023-08-15 17:14
  1. picard 是根据reads的起始和终点来判断的,比如双端测序,能确定这两条reads R1和R2的起点和终点,拥有相同起点和终点的都算dup;
  2. picard运行完输出一个matrix文件,里面有。

关于作者

li-nwafu 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-07-31 11:24
更新时间
2023-08-15 17:14
关注人数
2 人关注

相关问题

Picard fixmate是否有必要

推荐内容

群体进化,重测序,选择分析
在riboseq分析中,如何对没有起始密码子和终止密码子的转录本进行三碱基准确性分析?
ChIP-seq的bigwig文件可以使用rpkm>1过滤掉一些弱的信号吗?
链特异性文库(mRNA/lncRNA/circRNA)如何将RNA类型分开?
来自不同project的RNA-Seq数据可以直接合并分析吗?
bowtie2比对报错((ERR): bowtie2-align exited with value 1)
生存分析KM-plot交叉问题
关于生存分析的问题
chipseq分析,利用deeptools的computeMatrix reference-point画样本的peak center信号图
生信行业目前薪资怎样?谈谈吧
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024