使用Cutadapt进行fastq修整后的Phred质量错误

问题描述

在映射到bowtie2的基因组之前,我想将fastq文件中所有读取的开头修剪给定长度。我已经用过Cutadapt:

cutadapt -u 48 -o output.fastq.gz input.fastq.gz

修剪后我的fastq文件看起来像这样:

gunzip -c output.fastq.gz | head

@NB502143:99:HFF7TAFX2:1:11101:4133:1019 1:N:0:ATCACG
CATGAAAAAGAGCTCATTTTCAGATGCAGGAATTCCTATCCG
+
EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE
@NB502143:99:HFF7TAFX2:1:11101:19790:1020 1:N:0:ATCACG
CATGATCCACTTTTCCACGCGCTTTGACGACCATTTTATAA
+
EEEEE<EEEEEEEEEEEEEEEEE<EE/EEAEEEEEEEEEEE
@NB502143:99:HFF7TAFX2:1:11101:6327:1020 1:N:0:ATCACG
CATGATCTCAGTAAAGGCATTTGTGGTTGTTAAGTAGCCATT

当我尝试用bowtie2映射它时,出现以下错误消息:

Saw ASCII character 10 but expected 33-based Phred qual.

如果我映射input.fastq.gz我没有得到这个错误,所以我怀疑在修剪过程中发生了什么问题,但是我不知道是什么! 我用FastQC检查了两个文件,它们都是Sanger / Illumina 1.9编码的。

感谢您的帮助。

解决方法

我一直遇到类似的问题。当我使用cutadapt时会发生该错误,但是当我使用另一工具fastp进行修整时不会发生此错误。

检查生成的修剪后的fastq文件的完整性,发现某些读取没有碱基。 fastq_utils包中的fastq_info之类的工具可以使用。

如果存在问题,则在运行-m <minimum-length>时可能需要使用cutadapt标志。这将删除指定长度以下的读段。如果那是问题所在,那么之后的对齐应该可以。