简单脚本自动查询Phred质量分数编码系统
修改自:
从零开始完整学习全基因组测序数据分析:第2节 FASTA和FASTQ
less $1 | head -n 1000 | awk '{if(NR%4==0) printf("%s",$0);}' | od -A n -t u1 -v \
| awk 'BEGIN{min=100;max=0;} \
{for(i=1;i<=NF;i++) {if($i>max) max=$i; if($i<min) min=$i;}}END \
{if(max<=126 && min<59) print "Phred33"; \
else if(max>73 && min>=64) print "Phred64"; \
else if(min>=59 && min<64 && max>73) print "Solexa64"; \
else print "Unknown score encoding"; \
print "( " min ", " max, ")";}'
下面逐步解析代码:
1)less $1
这个不多说,$1代表脚本输入的第一个参数