转录本坐标转换成基因组坐标

该问题已被锁定！

4: 关注

2453: 浏览

生信问题

如何将转录本某个m6a修饰的位置坐标，转换成基因组坐标。

有尝试biostars上的一些解决方法，也都转换成功，但是最终得出的基因组坐标信息与RMbase数据库中的修饰信息做overlap，得到的数量很少。数据库50w左右的修饰位点，鉴定出2w多的位点仅有1k多overlap。所以我认为是在转换坐标上出现了问题，但是又不知道具体问题在哪，下面是我的代码：

txdb <- makeTxDbFromGFF("gencode.v43.annotation.gtf",format = "gtf")

gr <- GRanges(seqnames = data$ENST, ranges = IRanges(start=data$start,
end=data$end, names = data$ENST), strand = "*")

# isolate transcripts and genes from txdb
transcripts <- transcripts(txdb)

mcols(transcripts)$tx_name <- transcripts$tx_name
names(transcripts)<-mcols(transcripts)$tx_name
# use mapFromTranscripts in the GenomicFeatures package
map2genome <- mapFromTranscripts(gr, transcripts)

另外转换出的坐标与在基因组上看，对应的碱基都不是A或者T，有人知道是什么问题吗？

好问题 0 评论收藏举报

2 回答

孟浩巍超级管理员用户来自于: 北京市
2023-06-18 20:49

关于转录组坐标转基因组坐标，我给你个神器。

这个是我之前的一位师兄写的，现在人已经在兰大独立当PI了。

https://github.com/mt1022/gppy

主要功能：

python小工具，用于GTF文件信息提取，转bed12，基因组与转录本坐标互相转换。仅依赖python标准包。

赞同 0 2评论

chatGPT机器人机器人用户来自于: IANA
2023-06-17 20:20

首先，将转录本坐标转换成基因组坐标需要考虑基因组中的剪切变异和多个转录本的存在。您的代码中使用了GenomicFeatures包中的mapFromTranscripts函数进行坐标转换，这是正确的方法。然而，您提到转换后得到的坐标与基因组上的碱基不对应的问题可能是因为您的代码中没有考虑转录本的方向性。您可以使用strand参数指定转录本的方向，例如： ```map2genome <- mapFromTranscripts(gr, transcripts, strand = strand(gr))``` 另外，您提到转换后得到的基因组坐标与RMbase数据库中的修饰信息做overlap得到的数量很少，可能是因为RMbase数据库的修饰信息是基于特定转录本的，而您的代码中使用的是所有转录本的坐标进行转换。您可以尝试只使用特定转录本的坐标进行转换，例如： ```gr <- GRanges(seqnames = "ENST00000281150", ranges = IRanges(start = 123456, end = 123457), strand = "+")``` 其中seqnames参数指定需要转换的转录本，ranges参数指定需要转换的m6A修饰位置。希望这些建议能帮助您解决问题。

赞同 0 1评论

关于作者

: bioinfoBai 注册会员
这家伙很懒，还没有设置简介

0: 回答

0: 文章

2: 问题

问题动态

发布时间: 2023-06-17 20:20

更新时间: 2023-06-19 15:43

关注人数: 4 人关注