该问题已被锁定!
2
关注
763
浏览

GTEx项目的数据类型

为什么被折叠? 0 个回复被折叠
孟浩巍 超级管理员 用户来自于: 北京市
2018-08-31 20:01
GTEx数据我有一点总结笔记,分享给你。   [b]## 基本信息[/b] 1. 网址 ```https://www.gtexportal.org/home/```   [b]## GTEx Data and Analysis FAQs[/b] 1. 数据下载     * 数据下载可以通过```https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000424.v3.p1```   2. 编号的含义,类似GTEX-14753-1626-SM-5NQ9L     * GTEX-YYYYY 表示捐赠者,同1个捐赠者有可能会有不同的器官数据和不同类型的数据;     * 中间的4位,简单理解为器官的数据,但官方建议根据```Annotations_SampleAttributes```文件来定义器官的不同信息;     * 最后SM-YYYYY是测序方法   3. RNA建库的方法是什么?     * polyA + 建库方法     * 原文如下:         - No.  RNA-seq was performed using the Illumina TruSeq library construction protocol. This is a non-strand specific polyA+ selected library.  For more details, please visit our documentation page: https://gtexportal.org/home/documentationPage   4. 建库与分析方法     * Expression Data         - Illumina TrueSeq RNA sequencing         - Affymetrix Human Gene 1.1 ST Expression Array (V3; 837 samples)     * Genotype Data         - Whole genome sequencing (HiSeq X; first batch on HiSeq 2000)         - Whole exome sequencing (Agilent or ICE target capture, HiSeq 2000)         - Illumina OMNI 5M Array or 2.5M SNP Array         - Illumina Human Exome SNP Array   [b]5. 分析方法[/b]     * 比对的参考基因组 hg19     * 参考转录组 GENCODE V19          -  ```http://www.gencodegenes.org/releases/19.html```    [b]6. 使用STAR 进行mapping[/b]   [b]7. 表达量使用TPM表示,使用软件``` RNA-SeQC v1.1.8```[/b]     * 只计算unique的mapping reads     * 只计算STAR认为是proper pairs的reads     * mismatch要小于等于6     * 只使用了非junction的reads,且需要完全包含在exon里面,与intron有overlap的reads全部也被去除   [b]8. 提取的RNA的RIN值图[/b] [img]https://gtexportal.org/home/images/RNAquality.rin.png[/img]      
All Rights Reserved Powered BY WeCenter V4.1.0 © 2024