首页
问答
文章
专栏
大咖
更多
话题
帮助
请输入关键字进行搜索
查看更多 "
" 的搜索结果
登录
GTEx项目的数据类型
关注问题
回答问题
该问题已被锁定!
2
关注
767
浏览
GTEx项目的数据类型
GTEx
我是做血液--白血病的,TCGA的数据库里骨髓来源的只有AML患者数据,没有正常对照,所以我将GTEx里总共407个sample的whole blood数据作为对照,构建WGCNA,差异分析等等。。。 感谢群主大人分享GTEX的相关资料给我,感激ing
阅读全文
收起全文
关注问题
回答问题
邀请回答
好问题
0
评论
收藏
举报
分享
复制链接
新浪微博
腾讯空间
微信扫一扫
展开
收起
0
评论
查看全部
1
个回答
孟浩巍
超级管理员
用户来自于: 北京市
2018-08-31 20:01
GTEx数据我有一点总结笔记,分享给你。 [b]## 基本信息[/b] 1. 网址 ```https://www.gtexportal.org/home/``` [b]## GTEx Data and Analysis FAQs[/b] 1. 数据下载 * 数据下载可以通过```https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000424.v3.p1``` 2. 编号的含义,类似GTEX-14753-1626-SM-5NQ9L * GTEX-YYYYY 表示捐赠者,同1个捐赠者有可能会有不同的器官数据和不同类型的数据; * 中间的4位,简单理解为器官的数据,但官方建议根据```Annotations_SampleAttributes```文件来定义器官的不同信息; * 最后SM-YYYYY是测序方法 3. RNA建库的方法是什么? * polyA + 建库方法 * 原文如下: - No. RNA-seq was performed using the Illumina TruSeq library construction protocol. This is a non-strand specific polyA+ selected library. For more details, please visit our documentation page: https://gtexportal.org/home/documentationPage 4. 建库与分析方法 * Expression Data - Illumina TrueSeq RNA sequencing - Affymetrix Human Gene 1.1 ST Expression Array (V3; 837 samples) * Genotype Data - Whole genome sequencing (HiSeq X; first batch on HiSeq 2000) - Whole exome sequencing (Agilent or ICE target capture, HiSeq 2000) - Illumina OMNI 5M Array or 2.5M SNP Array - Illumina Human Exome SNP Array [b]5. 分析方法[/b] * 比对的参考基因组 hg19 * 参考转录组 GENCODE V19 - ```http://www.gencodegenes.org/releases/19.html``` [b]6. 使用STAR 进行mapping[/b] [b]7. 表达量使用TPM表示,使用软件``` RNA-SeQC v1.1.8```[/b] * 只计算unique的mapping reads * 只计算STAR认为是proper pairs的reads * mismatch要小于等于6 * 只使用了非junction的reads,且需要完全包含在exon里面,与intron有overlap的reads全部也被去除 [b]8. 提取的RNA的RIN值图[/b] [img]https://gtexportal.org/home/images/RNAquality.rin.png[/img]
阅读全文
收起全文
赞同
6
2
评论
分享
复制链接
新浪微博
腾讯空间
微信扫一扫
2
评论
关于作者
sysuwinux
注册会员
这家伙很懒,还没有设置简介
1
回答
0
文章
3
问题
问题动态
发布时间
2018-08-31 19:58
更新时间
2018-08-31 20:01
关注人数
2 人关注
相关问题
非靶向代谢组数据的PLS/OPLS模型Q2小于0.5,模型还可用吗?
891 浏览
2 关注
1 回答
0 评论
去除数据中特异值的方法
1085 浏览
2 关注
2 回答
0 评论
数据不平衡
732 浏览
2 关注
1 回答
0 评论
log2(fold_change)可以用来做热图吗?遇到想要表达的目的基因log2(fold_change)值为0时,怎么办?
814 浏览
2 关注
1 回答
0 评论
ATAC-seq数据多样本call peak如何合并?
694 浏览
2 关注
1 回答
0 评论
请问芯片数据分析的一般流程及涉及的常用算法?
1157 浏览
2 关注
3 回答
0 评论
如何根据转录组数据得到新转录本?如何验证一个基因的多个转录本?
1165 浏览
2 关注
2 回答
0 评论
关于affy芯片Affymetrix Human Genome U133 Plus 2.0 Array的注释文件,为何GEO、affy官方与Bioconductor的注释数据有差别?
1071 浏览
2 关注
2 回答
0 评论
二代测序得到测序数据组装完成后如何进行丰度计算
943 浏览
1 关注
1 回答
0 评论
多种DL based的label transfer自动注释细胞类型,降维clustering两者不太匹配. 如何进行下一步的paga analysis呢?
939 浏览
2 关注
2 回答
0 评论
All Rights Reserved Powered BY
WeCenter V4.1.0
© 2024
关于我们
社区规范
你的浏览器版本过低,可能导致网站部分内容不能正常使用!
为了能正常使用网站功能,请使用以下浏览器
Chrome
Firefox
Safari
IE 10+