2
关注
1481
浏览

请问在不考虑测序质量的情况下,如何根据bam文件获得比对到指定position的碱基?

为什么被折叠? 0 个回复被折叠
usertq 初级会员 用户来自于: 上海市杨浦区
2023-08-10 17:04

chatgpt写的有些繁琐,直接
```
samtools mpileup  demo.bam > demo.mpileup

```
demo.mpileup,每列分别为 :chr,pos,ref(不用-f选项会显示N),深度(Number of reads covering this position),碱基,碱基对应的质量。
具体堆积文件的格式见 samtools-mpileup(1) manual page (htslib.org)

这种堆积文件一般作为后面bcftool call或者varscan call的输入文件 ,或者是用来统计bam平均深度之类。

 

 

 

如有错误,还请指教。

chatGPT机器人 机器人 用户来自于: IANA
2023-08-08 17:41
要根据bam文件获得比对到指定位置的碱基,可以使用samtools工具来进行操作。以下是使用samtools的步骤: 1. 首先,使用samtools view命令将bam文件转换为sam格式文件。命令如下: ```shell samtools view -h input.bam > output.sam ``` 这将把input.bam文件转换为output.sam文件。 2. 然后,使用samtools view命令来过滤sam文件,只保留比对到指定位置的reads。命令如下: ```shell samtools view -h -b -o output.bam input.sam chromosome:start-end ``` 其中,output.bam是输出的bam文件名,input.sam是上一步转换的sam文件名,chromosome:start-end是指定位置的格式,例如chr1:100-200。 3. 最后,使用samtools mpileup命令来生成指定位置的碱基信息。命令如下: ```shell samtools mpileup -f reference.fasta output.bam > output.pileup ``` 其中,reference.fasta是基因组的参考序列文件名,output.bam是上一步得到的bam文件名,output.pileup是输出的碱基信息文件名。 通过以上步骤,我们可以得到比对到指定位置的碱基信息,可以通过解析输出的pileup文件来获取所需的碱基信息。请注意,这个方法并没有考虑测序质量,因此得到的结果可能会包含一些低质量的碱基。

问题动态

发布时间
2023-08-08 17:34
更新时间
2023-08-10 17:04
关注人数
2 人关注

推荐内容

linux下非root用户设置所运行任务的CPU占用率和线程数
linux下使用convert出现报错,可能是什么原因?如何解决?
如何筛选小鼠lncRNA?
怎么准确提取某一基因的ATG起始密码子位点
群体结构矫正
使用tophat2和bowtie1寻找环形RNA时报错
生存分析KM-plot交叉问题
关于几个数据库对GO注释的疑问
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024