该问题已被锁定!
2
关注
770
浏览

L1插入位点的百分比密度分布

为什么被折叠? 0 个回复被折叠
chatGPT机器人 机器人 用户来自于: IANA
2023-06-05 19:58
首先,需要加载相关的R包和BSgenome.Hsapiens.UCSC.hg38参考基因组: ``` r library(BSgenome.Hsapiens.UCSC.hg38) library(dplyr) library(ggplot2) ``` 然后,读取多个L1的插入位点的染色体坐标excel表格,包含染色体名称chr,起始和终止坐标: ``` r L1_insertions <- read.csv("L1_insertions.csv") ``` 接下来,计算在R包BSgenome.Hsapiens.UCSC.hg38参考基因组上下游2kb范围内,7个特定的motifs (TTAAAA, TTAAGA, TTAGAA, TTGAAA, TTAAAG, CTAAAA, TCAAAA)在L1插入位点的百分比密度分布: ``` r motifs <- c("TTAAAA", "TTAAGA", "TTAGAA", "TTGAAA", "TTAAAG", "CTAAAA", "TCAAAA") L1_insertions_motifs <- L1_insertions %>% mutate(start = pmax(start - 2000, 1), end = end + 2000) %>% mutate(sequence = mapply(function(chrom, start, end) { as.character(BSgenome.Hsapiens.UCSC.hg38[[chrom]][start:end]) }, chrom, start, end)) %>% mutate_at(vars(sequence), ~ str_count(., motifs)) %>% select(-c(start, end)) L1_insertions_motifs_density <- L1_insertions_motifs %>% summarise_at(vars(motifs), ~ sum(.)/length(sequence)/4) %>% gather(key = "motif", value = "density") ``` 最后,画直方图: ``` r ggplot(L1_insertions_motifs_density, aes(x = motif, y = density)) + geom_bar(stat = "identity", fill = "blue") + xlab("Motif") + ylab("Density") + ggtitle("L1 Insertion Site Motif Density Distribution") + theme(plot.title = element_text(hjust = 0.5)) ``` 完整的代码如下: ``` r library(BSgenome.Hsapiens.UCSC.hg38) library(dplyr) library(ggplot2) L1_insertions <- read.csv("L1_insertions.csv") motifs <- c("TTAAAA", "TTAAGA", "TTAGAA", "TTGAAA", "TTAAAG", "CTAAAA", "TCAAAA") L1_insertions_motifs <- L1_insertions %>% mutate(start = pmax(start - 2000, 1), end = end + 2000) %>% mutate(sequence = mapply(function(chrom, start, end) { as.character(BSgenome.Hsapiens.UCSC.hg38[[chrom]][start:end]) }, chrom, start, end)) %>% mutate_at(vars(sequence), ~ str_count(., motifs)) %>% select(-c(start, end)) L1_insertions_motifs_density <- L1_insertions_motifs %>% summarise_at(vars(motifs), ~ sum(.)/length(sequence)/4) %>% gather(key = "motif", value = "density") ggplot(L1_insertions_motifs_density, aes(x = motif, y = density)) + geom_bar(stat = "identity", fill = "blue") + xlab("Motif") + ylab("Density") + ggtitle("L1 Insertion Site Motif Density Distribution") + theme(plot.title = element_text(hjust = 0.5)) ``` 结果将会是一个展示7个motifs在L1插入位点的百分比密度分布的直方图。

关于作者

song 注册会员

这家伙很懒,还没有设置简介

问题动态

发布时间
2023-06-05 19:48
更新时间
2023-06-05 19:58
关注人数
2 人关注

相关问题

根据GFF和fasta等文件提取某一基因的ATG位点信息,比如具体的位置?
启动子区域甲基化位点选择
根据GFF和fasta等文件提取某一基因的ATG位点信息,比如具体的位置?
甲基化位点选择
【求助】如何判断一个基因是否存在表观修饰的位点?
怎么准确提取某一基因的ATG起始密码子位点
获取所有基因的转录起始位点(TSS)
如何提取可变剪切位点?

推荐内容

转录本坐标转换成基因组坐标
linux下使用convert出现报错,可能是什么原因?如何解决?
juicer_tools.jar hiccups 运行怎么更改物种?
使用Tracking Tumor ImmunoPhenotype(TIP)网站分析TCGA的BLCA_tpm数据
sc-ATAC数据质控
SPSS报错
kraken2软件运行时内存分配的问题
基因和染色体,lncRNA,mRNA之间的关系是怎样的?
染色体号是罗马数字怎么写sh循环
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024