该问题已被锁定!
2
关注
3842
浏览

bowtie2 参考基因组注释 比对

为什么被折叠? 0 个回复被折叠
chatGPT机器人 机器人 用户来自于: IANA
2023-07-03 16:30
您好!基因组注释文件的格式确实是导致比对结果中的染色体位置格式不同的原因之一。在hg38基因组注释中,染色体的命名方式为CM000663.2,而您希望得到的染色体位置格式为chr1。 要将得到的bam文件中的染色体位置格式转换为chr1类型,您可以使用samtools工具进行操作。以下是一种可能的解决方案: 1. 确保已经安装了samtools工具,可以在终端中输入以下命令进行检查: ```shell samtools --version ``` 2. 使用samtools的reheader命令来修改bam文件的头文件,将染色体命名方式转换为chr开头的格式。创建一个名为header.txt的文件,内容如下: ```shell @HD VN:1.6 SO:coordinate @SQ SN:chr1 LN: @SQ SN:chr2 LN: ... ``` 其中,等需要替换为相应染色体的长度。 3. 运行以下命令,将header.txt中定义的头文件替换原始bam文件的头文件: ```shell samtools reheader header.txt input.bam > output.bam ``` 其中,input.bam是由bowtie2比对得到的原始bam文件,output.bam是新生成的bam文件,染色体位置格式已经转换为chr1类型。 通过以上步骤,您就可以得到所需的chr1类型的bam文件。 希望这个回答对您有所帮助!如果您还有其他问题,请随时提问。
孟浩巍 超级管理员 用户来自于: 北京市
2023-07-03 19:01

这个和你建index时候输入的fasta文件的标记有关系。

如果里面染色体写的是chr1,chr2....这种的,那么你比对结果也就是chr1,chr2....

如果当时fasta文件写的就是CM000663.2这种标记,那么你的比对结果也就是相对于的标记结果。

如果为了省事,你直接从UCSC上下载即可。

https://hgdownload.soe.ucsc.edu/downloads.html

 

关于作者

Zed999 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-07-03 16:15
更新时间
2023-07-03 19:01
关注人数
2 人关注

相关问题

多种DL based的label transfer自动注释细胞类型,降维clustering两者不太匹配. 如何进行下一步的paga analysis呢?
为什么用prokka注释完,都是假设蛋白质
转录本坐标转换成基因组坐标
请问大家都是用什么做KEGG功能注释的呢
耐药细菌的比较基因组分析流程和机制探索
基因symbol注释GEO芯片时,如何把mRNA和lncRNA分别标注出来?
bowtie2比对 报错
无参基因组分析GO富集到了这一步不会做
一般报告基因组某个碱基突变是指正链还是负链
annovar建立非模式物种注释库后怎么分析

推荐内容

chromosome名称转换 的批量处理
fastANI报错,不出结果
WES数据下游分析和可视化结果展示
运行roary软件不出结果,命令行用了这种
chip-seq数据下载有多个SRA
怎么从ncbi上下载gbff格式的文件
nextpolish二代三代纠错报错N过多
Hic_pro在mergeSAM时遇到这个问题,是不是CPU占用guo
SRR1924430的sra数据与hdf5提取的fastq不一致
All Rights Reserved Powered BY WeCenter V4.1.0 © 2026