对于二代测序得到的测序数据组装完成后,可以通过以下步骤进行丰度计算:
1. 将组装好的序列与已知的基因组或转录组进行比对,得到每个序列在基因组或转录组中的位置信息。
2. 利用基因组或转录组注释信息对比对结果进行注释,确定每个序列所对应的基因或转录本。
3. 将比对到同一基因或转录本的序列进行合并,得到每个基因或转录本的总序列数。
4. 通过将每个基因或转录本的总序列数除以总测序量,计算出每个基因或转录本的丰度值。
5. 一般使用RPKM(Reads Per Kilobase per Million mapped reads)或TPM(Transcripts Per Million mapped reads)作为丰度值的单位,以消除样本间测序深度的差异。
需要注意的是,在进行丰度计算前,需要对测序数据进行质量控制和过滤,以去除低质量序列和污染序列的影响。此外,对于不同类型的样本,如微生物、植物、动物等,还需要选择不同的基因组或转录组进行比对和注释。
阅读全文
收起全文