该问题已被锁定!
2
关注
769
浏览

L1插入位点的百分比密度分布

为什么被折叠? 0 个回复被折叠
chatGPT机器人 机器人 用户来自于: IANA
2023-06-05 19:58
首先,需要加载相关的R包和BSgenome.Hsapiens.UCSC.hg38参考基因组: ``` r library(BSgenome.Hsapiens.UCSC.hg38) library(dplyr) library(ggplot2) ``` 然后,读取多个L1的插入位点的染色体坐标excel表格,包含染色体名称chr,起始和终止坐标: ``` r L1_insertions <- read.csv("L1_insertions.csv") ``` 接下来,计算在R包BSgenome.Hsapiens.UCSC.hg38参考基因组上下游2kb范围内,7个特定的motifs (TTAAAA, TTAAGA, TTAGAA, TTGAAA, TTAAAG, CTAAAA, TCAAAA)在L1插入位点的百分比密度分布: ``` r motifs <- c("TTAAAA", "TTAAGA", "TTAGAA", "TTGAAA", "TTAAAG", "CTAAAA", "TCAAAA") L1_insertions_motifs <- L1_insertions %>% mutate(start = pmax(start - 2000, 1), end = end + 2000) %>% mutate(sequence = mapply(function(chrom, start, end) { as.character(BSgenome.Hsapiens.UCSC.hg38[[chrom]][start:end]) }, chrom, start, end)) %>% mutate_at(vars(sequence), ~ str_count(., motifs)) %>% select(-c(start, end)) L1_insertions_motifs_density <- L1_insertions_motifs %>% summarise_at(vars(motifs), ~ sum(.)/length(sequence)/4) %>% gather(key = "motif", value = "density") ``` 最后,画直方图: ``` r ggplot(L1_insertions_motifs_density, aes(x = motif, y = density)) + geom_bar(stat = "identity", fill = "blue") + xlab("Motif") + ylab("Density") + ggtitle("L1 Insertion Site Motif Density Distribution") + theme(plot.title = element_text(hjust = 0.5)) ``` 完整的代码如下: ``` r library(BSgenome.Hsapiens.UCSC.hg38) library(dplyr) library(ggplot2) L1_insertions <- read.csv("L1_insertions.csv") motifs <- c("TTAAAA", "TTAAGA", "TTAGAA", "TTGAAA", "TTAAAG", "CTAAAA", "TCAAAA") L1_insertions_motifs <- L1_insertions %>% mutate(start = pmax(start - 2000, 1), end = end + 2000) %>% mutate(sequence = mapply(function(chrom, start, end) { as.character(BSgenome.Hsapiens.UCSC.hg38[[chrom]][start:end]) }, chrom, start, end)) %>% mutate_at(vars(sequence), ~ str_count(., motifs)) %>% select(-c(start, end)) L1_insertions_motifs_density <- L1_insertions_motifs %>% summarise_at(vars(motifs), ~ sum(.)/length(sequence)/4) %>% gather(key = "motif", value = "density") ggplot(L1_insertions_motifs_density, aes(x = motif, y = density)) + geom_bar(stat = "identity", fill = "blue") + xlab("Motif") + ylab("Density") + ggtitle("L1 Insertion Site Motif Density Distribution") + theme(plot.title = element_text(hjust = 0.5)) ``` 结果将会是一个展示7个motifs在L1插入位点的百分比密度分布的直方图。

关于作者

song 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-06-05 19:48
更新时间
2023-06-05 19:58
关注人数
2 人关注

相关问题

获取所有基因的转录起始位点(TSS)
【求助】如何判断一个基因是否存在表观修饰的位点?
如何提取可变剪切位点?
甲基化位点选择
根据GFF和fasta等文件提取某一基因的ATG位点信息,比如具体的位置?
怎么准确提取某一基因的ATG起始密码子位点
启动子区域甲基化位点选择
根据GFF和fasta等文件提取某一基因的ATG位点信息,比如具体的位置?

推荐内容

logistic回归、异常值
如何根据Datamonkey中FUBAR的结果计算该基因的dn/ds值
如何按一个列表对基因型文件进行过滤,剔除不需要的样本?
请问下这种格式的R语言内容如何选择最小值
how to speed up following code 
rna-seq数据校正
链特异性文库(mRNA/lncRNA/circRNA)如何将RNA类型分开?
juicer_tools.jar hiccups 运行怎么更改物种?
grep 能不能指定匹配第多少列?
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024