2
关注
2692
浏览

请问在不考虑测序质量的情况下,如何根据bam文件获得比对到指定position的碱基?

为什么被折叠? 0 个回复被折叠
usertq 初级会员 用户来自于: 上海市杨浦区
2023-08-10 17:04

chatgpt写的有些繁琐,直接
```
samtools mpileup  demo.bam > demo.mpileup

```
demo.mpileup,每列分别为 :chr,pos,ref(不用-f选项会显示N),深度(Number of reads covering this position),碱基,碱基对应的质量。
具体堆积文件的格式见 samtools-mpileup(1) manual page (htslib.org)

这种堆积文件一般作为后面bcftool call或者varscan call的输入文件 ,或者是用来统计bam平均深度之类。

 

 

 

如有错误,还请指教。

chatGPT机器人 机器人 用户来自于: IANA
2023-08-08 17:41
要根据bam文件获得比对到指定位置的碱基,可以使用samtools工具来进行操作。以下是使用samtools的步骤: 1. 首先,使用samtools view命令将bam文件转换为sam格式文件。命令如下: ```shell samtools view -h input.bam > output.sam ``` 这将把input.bam文件转换为output.sam文件。 2. 然后,使用samtools view命令来过滤sam文件,只保留比对到指定位置的reads。命令如下: ```shell samtools view -h -b -o output.bam input.sam chromosome:start-end ``` 其中,output.bam是输出的bam文件名,input.sam是上一步转换的sam文件名,chromosome:start-end是指定位置的格式,例如chr1:100-200。 3. 最后,使用samtools mpileup命令来生成指定位置的碱基信息。命令如下: ```shell samtools mpileup -f reference.fasta output.bam > output.pileup ``` 其中,reference.fasta是基因组的参考序列文件名,output.bam是上一步得到的bam文件名,output.pileup是输出的碱基信息文件名。 通过以上步骤,我们可以得到比对到指定位置的碱基信息,可以通过解析输出的pileup文件来获取所需的碱基信息。请注意,这个方法并没有考虑测序质量,因此得到的结果可能会包含一些低质量的碱基。

问题动态

发布时间
2023-08-08 17:34
更新时间
2023-08-10 17:04
关注人数
2 人关注

相关问题

含有2个重复的Chip-seq的bw文件的展示
请问UCSC上下载的参考基因组中这个文件是什么含义
bash命令,遍历并区分“目录/文件”的问题
ChIP-seq的bigwig文件可以使用rpkm>1过滤掉一些弱的信号吗?
请问大家都是用什么做KEGG功能注释的呢
两次运行同一个FQ文件产生的bam文件分析结果存在差异
从多个.fa文件中提取以“poptri.”开头的蛋白序列
HTseq gtf文件的选择
为什么单端测序的数据解压会出现多个文件?
请问一下,如何将登陆服务器局域网的ip设置为静态的呢?

推荐内容

ASR祖先序列重建,最后一步使用PAML时出现一些问题
如何筛选小鼠lncRNA?
根据GFF和fasta等文件提取某一基因的ATG位点信息,比如具体的位置?
smORF的鉴定方法
在单细胞的细胞通讯分析软件cellphonedb的结果解读
去除批次效应选定靶标细胞群后如何进行亚群分析?
infercnv运行报错
VCONTACT2的结果文件genome_by_genome_overview如何进行统计分类
生信问题(我也不知道该怎么问)
编程
All Rights Reserved Powered BY WeCenter V4.1.0 © 2025