该问题已被锁定!
2
关注
771
浏览

L1插入位点的百分比密度分布

查看全部 1 个回答

chatGPT机器人 机器人 用户来自于: IANA
2023-06-05 19:58
首先,需要加载相关的R包和BSgenome.Hsapiens.UCSC.hg38参考基因组: ``` r library(BSgenome.Hsapiens.UCSC.hg38) library(dplyr) library(ggplot2) ``` 然后,读取多个L1的插入位点的染色体坐标excel表格,包含染色体名称chr,起始和终止坐标: ``` r L1_insertions <- read.csv("L1_insertions.csv") ``` 接下来,计算在R包BSgenome.Hsapiens.UCSC.hg38参考基因组上下游2kb范围内,7个特定的motifs (TTAAAA, TTAAGA, TTAGAA, TTGAAA, TTAAAG, CTAAAA, TCAAAA)在L1插入位点的百分比密度分布: ``` r motifs <- c("TTAAAA", "TTAAGA", "TTAGAA", "TTGAAA", "TTAAAG", "CTAAAA", "TCAAAA") L1_insertions_motifs <- L1_insertions %>% mutate(start = pmax(start - 2000, 1), end = end + 2000) %>% mutate(sequence = mapply(function(chrom, start, end) { as.character(BSgenome.Hsapiens.UCSC.hg38[[chrom]][start:end]) }, chrom, start, end)) %>% mutate_at(vars(sequence), ~ str_count(., motifs)) %>% select(-c(start, end)) L1_insertions_motifs_density <- L1_insertions_motifs %>% summarise_at(vars(motifs), ~ sum(.)/length(sequence)/4) %>% gather(key = "motif", value = "density") ``` 最后,画直方图: ``` r ggplot(L1_insertions_motifs_density, aes(x = motif, y = density)) + geom_bar(stat = "identity", fill = "blue") + xlab("Motif") + ylab("Density") + ggtitle("L1 Insertion Site Motif Density Distribution") + theme(plot.title = element_text(hjust = 0.5)) ``` 完整的代码如下: ``` r library(BSgenome.Hsapiens.UCSC.hg38) library(dplyr) library(ggplot2) L1_insertions <- read.csv("L1_insertions.csv") motifs <- c("TTAAAA", "TTAAGA", "TTAGAA", "TTGAAA", "TTAAAG", "CTAAAA", "TCAAAA") L1_insertions_motifs <- L1_insertions %>% mutate(start = pmax(start - 2000, 1), end = end + 2000) %>% mutate(sequence = mapply(function(chrom, start, end) { as.character(BSgenome.Hsapiens.UCSC.hg38[[chrom]][start:end]) }, chrom, start, end)) %>% mutate_at(vars(sequence), ~ str_count(., motifs)) %>% select(-c(start, end)) L1_insertions_motifs_density <- L1_insertions_motifs %>% summarise_at(vars(motifs), ~ sum(.)/length(sequence)/4) %>% gather(key = "motif", value = "density") ggplot(L1_insertions_motifs_density, aes(x = motif, y = density)) + geom_bar(stat = "identity", fill = "blue") + xlab("Motif") + ylab("Density") + ggtitle("L1 Insertion Site Motif Density Distribution") + theme(plot.title = element_text(hjust = 0.5)) ``` 结果将会是一个展示7个motifs在L1插入位点的百分比密度分布的直方图。

关于作者

song 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-06-05 19:48
更新时间
2023-06-05 19:58
关注人数
2 人关注

相关问题

【求助】如何判断一个基因是否存在表观修饰的位点?
根据GFF和fasta等文件提取某一基因的ATG位点信息,比如具体的位置?
启动子区域甲基化位点选择
如何提取可变剪切位点?
根据GFF和fasta等文件提取某一基因的ATG位点信息,比如具体的位置?
怎么准确提取某一基因的ATG起始密码子位点
甲基化位点选择
获取所有基因的转录起始位点(TSS)

推荐内容

启动子染色质开放性
尿代谢组正负离子数据标准化是否可以均用正离子检测出来的肌酐峰
转录本坐标转换成基因组坐标
bulk-RNAseq数据集整合
请问下这种格式的R语言内容如何选择最小值
atac重复样品可视化
de novo mutation检测和判断
染色体号是罗马数字怎么写sh循环
rna-seq数据校正
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024