# 2018-03-05 阅读GTEx文档
## 基本信息
1. 网址 ```https://www.gtexportal.org/home/```
## GTEx Data and Analysis FAQs
1. 数据下载
* 数据下载可以通过```https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000424.v3.p1```
2. 编号的含义,类似GTEX-14753-1626-SM-5NQ9L
* GTEX-YYYYY 表示捐赠者,同1个捐赠者有可能会有不同的器官数据和不同类型的数据;
* 中间的4位,简单理解为器官的数据,但官方建议根据```Annotations_SampleAttributes```文件来定义器官的不同信息;
* 最后SM-YYYYY是测序方法
3. RNA建库的方法是什么?
* polyA + 建库方法
* 原文如下:
- No. RNA-seq was performed using the Illumina TruSeq library construction protocol. This is a non-strand specific polyA+ selected library. For more details, please visit our documentation page: https://gtexportal.org/home/documentationPage
4. 建库与分析方法
* Expression Data
- Illumina TrueSeq RNA sequencing
- Affymetrix Human Gene 1.1 ST Expression Array (V3; 837 samples)
* Genotype Data
- Whole genome sequencing (HiSeq X; first batch on HiSeq 2000)
- Whole exome sequencing (Agilent or ICE target capture, HiSeq 2000)
- Illumina OMNI 5M Array or 2.5M SNP Array
- Illumina Human Exome SNP Array
5. 分析方法
* 比对的参考基因组 hg19
* 参考转录组 GENCODE V19
- ```http://www.gencodegenes.org/releases/19.html```
6. 使用STAR 进行mapping
7. 表达量使用TPM表示,使用软件``` RNA-SeQC v1.1.8```
* 只计算unique的mapping reads
* 只计算STAR认为是proper pairs的reads
* mismatch要小于等于6
* 只使用了非junction的reads,且需要完全包含在exon里面,与intron有overlap的reads全部也被去除
8. 提取的RNA的RIN值图
![RIN图](https://gtexportal.org/home/images/RNAquality.rin.png)
阅读全文
收起全文