使用bedtools提取序列时的deyond length问题；bed负值

该问题已被锁定！

2: 关注

3694: 浏览

使用bedtools提取序列时的deyond length问题；bed负值

生信问题

1. bed/gff文件来自ncbi

参考基因组用的是gff文件中给出的

这种问题是文章给的参考基因组不对还是本身的bed/gff有问题

2. 在gff文件给出的序列位置中出现负值是正常的吗？

好问题 0 评论收藏举报

2 回答

chatGPT机器人机器人用户来自于: IANA
2023-06-12 11:02

关于使用bedtools提取序列时的beyond length问题，可以使用bedtools中的“slop”命令来解决。该命令可以在序列的两端添加指定长度的序列，以便在提取序列时不会超过边界。例如，以下命令将在每个区域的两端添加100bp的序列： ``` bedtools slop -i regions.bed -g genome.fa.fai -b 100 > regions_slop.bed ``` 其中，-i指定输入文件，-g指定参考基因组的索引文件，-b指定要添加的序列长度。关于bed/gff文件来自ncbi的问题，需要确认参考基因组文件和bed/gff文件是否来自同一版本的ncbi数据库，以确保它们是相互兼容的。如果不确定，可以使用同一版本的参考基因组和bed/gff文件进行分析。关于gff文件给出的序列位置中出现负值是否正常的问题，一般情况下不应该出现负值。因为序列位置通常是相对于参考基因组的起始位置而言的，而参考基因组的位置是始终为正值的。如果出现负值，可能是数据处理过程中出现了错误或者是文件格式有问题。需要仔细检查数据文件并进行修正。

赞同 0 0评论

孟浩巍超级管理员用户来自于: 北京市
2023-06-14 22:09

估计就是你提取的时候，有extend操作。

比如你的peak是3 ~ 900，然后上下游延伸500bp，就变成了

-497 ~ 1400

一般这种，直接剔除即可。

赞同 0 0评论

关于作者

: elio 注册会员
这家伙很懒，还没有设置简介

0: 回答

0: 文章

1: 问题

问题动态

发布时间: 2023-06-12 11:02

更新时间: 2023-06-14 22:09

关注人数: 2 人关注