一、参考基因组:https://hgdownload.soe.ucsc.edu/goldenPath/oviAri4/bigZips/oviAri4.fa.gz
二、GTF:https://hgdownload.soe.ucsc.edu/goldenPath/oviAri4/bigZips/genes/oviAri4.ncbiRefSeq.gtf.gz
三、hisat2 构建INDEX流程:
1.hisat2_extract_exons.py oviAri4.ncbiRefSeq.gtf > oviAri4.ncbiRefSeq.gtf.exon 2.hisat2_extract_splice_sites.py oviAri4.ncbiRefSeq.gtf > oviAri4.ncbiRefSeq.ss &
3.hisat2-build -p 6 --exon oviAri4.ncbiRefSeq.gtf.exon#提取外显子# --ss oviAri4.ncbiRefSeq.ss#提取剪切位点# oviAri4.fa#参考基因组# oviAri4.fa_ex_ss.gtf > hisat2_build.log 2>&1 &
四、DESeq2得到差异表达基因后,log2foldchange的绝对值> 1 同时padj值小于0.05的筛选条件,共获得了5552个差异表达基因。
想请问一下这么多的差异表达基因可以改筛选条件么?
2 回答
你可以画一个MA plot看看,然后再画一个火山图看看这些差异基因的分布。
另外就是,可以增加表达量的筛选,就是ctrl和treatment样品中至少有1个样品是FPKM>1的。或者其他筛选表达量的条件。
对于差异表达基因过多的情况,可以考虑调整筛选条件。可以根据研究目的、实验设计、生物学意义等因素,综合考虑确定新的筛选条件。具体可采用以下方法:
需要注意的是,调整筛选条件时应该谨慎,不能过于严格或宽松,否则会影响结果的准确性和可靠性。
这家伙很懒,还没有设置简介