针对第一个问题,可能有以下几个方面的问题:
1. 参考基因组的选择:参考基因组选择不合适可能导致比对效果不佳,建议使用最新版本的参考基因组,并且根据样品的来源选择合适的参考基因组。
2. 比对参数的选择:gmap比对有很多参数需要设置,如seed长度、最大误配数等,不同的参数会对比对效果产生影响,需要针对实验设计进行优化。
3. 数据质量的问题:三代测序数据相对于二代测序数据来说,数据质量会有一定程度的差异,如果数据质量不好,比对效果也会受到影响。 针对第二个问题,由于quiver过的高质量序列相对于ccs序列来说,经过了错误校正和拼接等步骤,因此序列长度会有所缩短,400M左右的大小是正常的。