[size=15]代码:samtools mpileup -f ~/reference/genome/hg19/hg19.fa ../P_jmzeng.final.bam|[b]head -1000000[/b] |perl -alne '{$pos=int($F[1]/20000); $key="$F[0]\t$pos";$GC{$key}++ if $F[2]=~/[GC]/;$counts_sum{$key}+=$F[3];$number{$key}++;}END{print "$_\t$number{$_}\t$GC{$_}\t$counts_sum{$_}" foreach sort{$a<=>$b} keys %number}'[/size]
[size=15]当取前100万行时GC含量正常,但取的行数越多GC含量越低,请问是代码问题还是数据本身原因[/size]
阅读全文
收起全文