2
关注
1282
浏览

请问在不考虑测序质量的情况下,如何根据bam文件获得比对到指定position的碱基?

为什么被折叠? 0 个回复被折叠
usertq 初级会员 用户来自于: 上海市杨浦区
2023-08-10 17:04

chatgpt写的有些繁琐,直接
```
samtools mpileup  demo.bam > demo.mpileup

```
demo.mpileup,每列分别为 :chr,pos,ref(不用-f选项会显示N),深度(Number of reads covering this position),碱基,碱基对应的质量。
具体堆积文件的格式见 samtools-mpileup(1) manual page (htslib.org)

这种堆积文件一般作为后面bcftool call或者varscan call的输入文件 ,或者是用来统计bam平均深度之类。

 

 

 

如有错误,还请指教。

chatGPT机器人 机器人 用户来自于: IANA
2023-08-08 17:41
要根据bam文件获得比对到指定位置的碱基,可以使用samtools工具来进行操作。以下是使用samtools的步骤: 1. 首先,使用samtools view命令将bam文件转换为sam格式文件。命令如下: ```shell samtools view -h input.bam > output.sam ``` 这将把input.bam文件转换为output.sam文件。 2. 然后,使用samtools view命令来过滤sam文件,只保留比对到指定位置的reads。命令如下: ```shell samtools view -h -b -o output.bam input.sam chromosome:start-end ``` 其中,output.bam是输出的bam文件名,input.sam是上一步转换的sam文件名,chromosome:start-end是指定位置的格式,例如chr1:100-200。 3. 最后,使用samtools mpileup命令来生成指定位置的碱基信息。命令如下: ```shell samtools mpileup -f reference.fasta output.bam > output.pileup ``` 其中,reference.fasta是基因组的参考序列文件名,output.bam是上一步得到的bam文件名,output.pileup是输出的碱基信息文件名。 通过以上步骤,我们可以得到比对到指定位置的碱基信息,可以通过解析输出的pileup文件来获取所需的碱基信息。请注意,这个方法并没有考虑测序质量,因此得到的结果可能会包含一些低质量的碱基。

问题动态

发布时间
2023-08-08 17:34
更新时间
2023-08-10 17:04
关注人数
2 人关注

推荐内容

infercnv运行报错
smORF的鉴定方法
怎么准确提取某一基因的ATG起始密码子位点
关于GO分析的问题
prokka数据库更新
GAPIT包导出的GWAS结果如何添加新的阈值线?以及GAPIT的结果文件中的nobs、H&B.P.Value、Effect分别是什么意思?
生信问题(我也不知道该怎么问)
根据GFF和fasta等文件提取某一基因的ATG位点信息,比如具体的位置?
在单细胞测序中,不同组的T细胞统计检验方法
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024