该问题已被锁定!
3
关注
974
浏览

知道一批基因的具体位置,如何批量的从基因组中取出基因序列?

查看全部 2 个回答

孟浩巍 超级管理员 用户来自于: 北京市
2018-09-19 20:46
方法有很多,我说一个在R里操作的办法吧。   1. 首先先使用Bioconductor安装GenomicRange包以及对应物种的BSgenome包,比如你这里应该是拟南芥。   2. 然后把你的区间,构建成GRange对象   3. 直接使用getSeq提取序列   [code]> library(BSgenome.Athaliana.TAIR.TAIR9) > library(GenomicRanges) > input_range = GRanges(seqnames = c("Chr1","Chr1"), + ranges = IRanges(start = c(28552,78931),end = c(28655,79030)), + id = c("ath-MIR838","ath-MIR165a"), + strand = c("+","-")) > input_range GRanges object with 2 ranges and 1 metadata column: seqnames ranges strand | id | [1] Chr1 [28552, 28655] + | ath-MIR838 [2] Chr1 [78931, 79030] - | ath-MIR165a ------- seqinfo: 1 sequence from an unspecified genome; no seqlengths > getSeq(BSgenome.Athaliana.TAIR.TAIR9,input_range) A DNAStringSet instance of length 2 width seq [1] 104 GTGCAAGAAGGAGAAGCAAAGTCTGTCTATGTATTATGAGATAGCTACTTCTATGGCTAGGATATATGTTGTACAAGACCGGCTTTTCTTCTACTTCTTGCACA [2] 100 GGAATGTTGTCTGGATCGAGGATATTATAGATATATACATGTGTATGTTAATGATTCAAGTGATCATAGAGAGTATCCTCGGACCAGGCTTCATCCCCCC[/code]    

关于作者

restpop 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2018-09-19 20:27
更新时间
2018-09-19 21:09
关注人数
3 人关注

相关问题

宏基因组注释率超低
请问一下,如何根据基因名批量下载CDS区的序列?
请教一个问题,一个转录因子TF只会调控位于同一条链的基因,还是有可能调控反义链的基因?
批量获得基因间区及内含子的突变距离最近的基因外显子的距离
怎么寻找某个基因的不同可变剪切形式?
【求助】如何判断一个基因是否存在表观修饰的位点?
Linux中具体操作问题
关于hub基因的问题
噬菌体比较基因组分析流程
请问一下大家生物信息学的生物学具体应用
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024