该问题已被锁定!
3
关注
869
浏览

知道一批基因的具体位置,如何批量的从基因组中取出基因序列?

为什么被折叠? 0 个回复被折叠
孟浩巍 超级管理员 用户来自于: 北京市
2018-09-19 20:46
方法有很多,我说一个在R里操作的办法吧。   1. 首先先使用Bioconductor安装GenomicRange包以及对应物种的BSgenome包,比如你这里应该是拟南芥。   2. 然后把你的区间,构建成GRange对象   3. 直接使用getSeq提取序列   [code]> library(BSgenome.Athaliana.TAIR.TAIR9) > library(GenomicRanges) > input_range = GRanges(seqnames = c("Chr1","Chr1"), + ranges = IRanges(start = c(28552,78931),end = c(28655,79030)), + id = c("ath-MIR838","ath-MIR165a"), + strand = c("+","-")) > input_range GRanges object with 2 ranges and 1 metadata column: seqnames ranges strand | id | [1] Chr1 [28552, 28655] + | ath-MIR838 [2] Chr1 [78931, 79030] - | ath-MIR165a ------- seqinfo: 1 sequence from an unspecified genome; no seqlengths > getSeq(BSgenome.Athaliana.TAIR.TAIR9,input_range) A DNAStringSet instance of length 2 width seq [1] 104 GTGCAAGAAGGAGAAGCAAAGTCTGTCTATGTATTATGAGATAGCTACTTCTATGGCTAGGATATATGTTGTACAAGACCGGCTTTTCTTCTACTTCTTGCACA [2] 100 GGAATGTTGTCTGGATCGAGGATATTATAGATATATACATGTGTATGTTAATGATTCAAGTGATCATAGAGAGTATCCTCGGACCAGGCTTCATCCCCCC[/code]    
城管大队哈队长 初级会员 用户来自于: 中国
2018-09-19 21:09
制作成bed文件,用bedtools的getfasta即可。 楼主你的文件应该就是bed格式了。改个bed后缀直接用就行。  

关于作者

restpop 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2018-09-19 20:27
更新时间
2018-09-19 21:09
关注人数
3 人关注

相关问题

绵羊转录组测序后差异表达基因太多了
如何根据Datamonkey中FUBAR的结果计算该基因的dn/ds值
bowtie2 参考基因组注释 比对
基因本体论分析上下调基因差异
获取所有基因的转录起始位点(TSS)
一般报告基因组某个碱基突变是指正链还是负链
RNA-seq不同样本多个生物学重复不同处理条件下的如何找差异基因
使用seurat包,导出特定cluster的细胞-基因counts矩阵。初始数据命名为pbmc
【求助】如何判断一个基因是否存在表观修饰的位点?
基因组组装
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024