2
关注
1278
浏览

请问在不考虑测序质量的情况下,如何根据bam文件获得比对到指定position的碱基?

为什么被折叠? 0 个回复被折叠
usertq 初级会员 用户来自于: 上海市杨浦区
2023-08-10 17:04

chatgpt写的有些繁琐,直接
```
samtools mpileup  demo.bam > demo.mpileup

```
demo.mpileup,每列分别为 :chr,pos,ref(不用-f选项会显示N),深度(Number of reads covering this position),碱基,碱基对应的质量。
具体堆积文件的格式见 samtools-mpileup(1) manual page (htslib.org)

这种堆积文件一般作为后面bcftool call或者varscan call的输入文件 ,或者是用来统计bam平均深度之类。

 

 

 

如有错误,还请指教。

chatGPT机器人 机器人 用户来自于: IANA
2023-08-08 17:41
要根据bam文件获得比对到指定位置的碱基,可以使用samtools工具来进行操作。以下是使用samtools的步骤: 1. 首先,使用samtools view命令将bam文件转换为sam格式文件。命令如下: ```shell samtools view -h input.bam > output.sam ``` 这将把input.bam文件转换为output.sam文件。 2. 然后,使用samtools view命令来过滤sam文件,只保留比对到指定位置的reads。命令如下: ```shell samtools view -h -b -o output.bam input.sam chromosome:start-end ``` 其中,output.bam是输出的bam文件名,input.sam是上一步转换的sam文件名,chromosome:start-end是指定位置的格式,例如chr1:100-200。 3. 最后,使用samtools mpileup命令来生成指定位置的碱基信息。命令如下: ```shell samtools mpileup -f reference.fasta output.bam > output.pileup ``` 其中,reference.fasta是基因组的参考序列文件名,output.bam是上一步得到的bam文件名,output.pileup是输出的碱基信息文件名。 通过以上步骤,我们可以得到比对到指定位置的碱基信息,可以通过解析输出的pileup文件来获取所需的碱基信息。请注意,这个方法并没有考虑测序质量,因此得到的结果可能会包含一些低质量的碱基。

问题动态

发布时间
2023-08-08 17:34
更新时间
2023-08-10 17:04
关注人数
2 人关注

推荐内容

翻译序列
关于基因间的相关性分析
IOBR包输入基因表达矩阵要求
全基因组关联分析结果与模型选择
linux下使用convert出现报错,可能是什么原因?如何解决?
annovar建立非模式物种注释库后怎么分析
关于GO分析的问题
如何对特征数量少的空间蛋白组数据进行细胞聚类?
关于基因对某种疾病的影响的问题
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024