问题描述
我需要计算包含字符串“TAACCCTAACCCTAACCCTAACCC”的双端fastq文件的百分比。 所以我用了 bbduk.sh in1=1.fastq.gz in2=2.fastq.gzliteral=TAACCCTAACCCTAACCCTAACCC k=24 mm=f int=f
我得到了:
Input: 65975862 reads 6554014910 bases.
Contaminants: 195232 reads (0.30%) 19519262 bases (0.30%)
Total Removed: 1040136 reads (1.58%) 61775988 bases (0.94%)
Result: 64935726 reads (98.42%) 6492238922 bases (99.06%)
我可以将总删除量 (1.58%) 视为该字符串在双端 fastq 文件中的百分比吗?
另外,我用的是grep,这个命令:grep -A 2 -B 1 ' TAACCCTAACCCTAACCCTAACCC ' D1_TTAGGC_L001_R1_001.fastq.gz | sed '/--/d' > out_D1_R1.fq.
它给出了包含字符串的大约 7526 行。我除以总序列 (32987931) 得到字符串的百分比 7526/32987931= 0.02。这是否意味着只有前向 fastq 文件有 0.02 个该字符串?
谢谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)