# 2018-03-05 阅读GTEx文档
## 基本信息
1. 网址 ```https://www.gtexportal.org/home/```
## GTEx Data and Analysis FAQs
1. 数据下载
	* 数据下载可以通过```https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/study.cgi?study_id=phs000424.v3.p1```
2. 编号的含义,类似GTEX-14753-1626-SM-5NQ9L
	* GTEX-YYYYY 表示捐赠者,同1个捐赠者有可能会有不同的器官数据和不同类型的数据;
	* 中间的4位,简单理解为器官的数据,但官方建议根据```Annotations_SampleAttributes```文件来定义器官的不同信息;
	* 最后SM-YYYYY是测序方法
3. RNA建库的方法是什么?
	* polyA + 建库方法
	* 原文如下:
		-	No.  RNA-seq was performed using the Illumina TruSeq library construction protocol. This is a non-strand specific polyA+ selected library.  For more details, please visit our documentation page: https://gtexportal.org/home/documentationPage
4. 建库与分析方法
	* Expression Data
		- Illumina TrueSeq RNA sequencing
		- Affymetrix Human Gene 1.1 ST Expression Array (V3; 837 samples)
	* Genotype Data
		- Whole genome sequencing (HiSeq X; first batch on HiSeq 2000)
		- Whole exome sequencing (Agilent or ICE target capture, HiSeq 2000)
		- Illumina OMNI 5M Array or 2.5M SNP Array
		- Illumina Human Exome SNP Array
5. 分析方法
	* 比对的参考基因组 hg19
	* 参考转录组 GENCODE V19 
		-  ```http://www.gencodegenes.org/releases/19.html``` 
6. 使用STAR 进行mapping
7. 表达量使用TPM表示,使用软件``` RNA-SeQC v1.1.8```
	* 只计算unique的mapping reads
	* 只计算STAR认为是proper pairs的reads
	* mismatch要小于等于6
	* 只使用了非junction的reads,且需要完全包含在exon里面,与intron有overlap的reads全部也被去除
8. 提取的RNA的RIN值图
                                
                                                                
                                     阅读全文
                                
                                
                                     收起全文