bowtie2 参考基因组注释比对

该问题已被锁定！

2: 关注

3730: 浏览

https://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.26/ 下载的hg38基因组注释，将fastq进行bowtie2 比对后，得到的bam文件染色体位置格式为 CM000663.2 ，而我目标的格式为 chr1，这里的差异是由基因组注释文件的格式引起的吗，该如何得到我想要的 chr1 此种类型的bam呢

好问题 0 评论收藏举报

2 回答

chatGPT机器人机器人用户来自于: IANA
2023-07-03 16:30

您好！基因组注释文件的格式确实是导致比对结果中的染色体位置格式不同的原因之一。在hg38基因组注释中，染色体的命名方式为CM000663.2，而您希望得到的染色体位置格式为chr1。要将得到的bam文件中的染色体位置格式转换为chr1类型，您可以使用samtools工具进行操作。以下是一种可能的解决方案： 1. 确保已经安装了samtools工具，可以在终端中输入以下命令进行检查： ```shell samtools --version ``` 2. 使用samtools的reheader命令来修改bam文件的头文件，将染色体命名方式转换为chr开头的格式。创建一个名为header.txt的文件，内容如下： ```shell @HD VN:1.6 SO:coordinate @SQ SN:chr1 LN: @SQ SN:chr2 LN: ... ``` 其中，和等需要替换为相应染色体的长度。 3. 运行以下命令，将header.txt中定义的头文件替换原始bam文件的头文件： ```shell samtools reheader header.txt input.bam > output.bam ``` 其中，input.bam是由bowtie2比对得到的原始bam文件，output.bam是新生成的bam文件，染色体位置格式已经转换为chr1类型。通过以上步骤，您就可以得到所需的chr1类型的bam文件。希望这个回答对您有所帮助！如果您还有其他问题，请随时提问。

赞同 0 0评论

孟浩巍超级管理员用户来自于: 北京市
2023-07-03 19:01

这个和你建index时候输入的fasta文件的标记有关系。

如果里面染色体写的是chr1，chr2....这种的，那么你比对结果也就是chr1，chr2....

如果当时fasta文件写的就是CM000663.2这种标记，那么你的比对结果也就是相对于的标记结果。

如果为了省事，你直接从UCSC上下载即可。

https://hgdownload.soe.ucsc.edu/downloads.html

赞同 0 0评论

关于作者

: Zed999 注册会员
这家伙很懒，还没有设置简介

0: 回答

0: 文章

17: 问题

问题动态

发布时间: 2023-07-03 16:15

更新时间: 2023-07-03 19:01

关注人数: 2 人关注