如何找到包含给定字符串的双端 fastq 文件的百分比

问题描述

我需要计算包含字符串“TAACCCTAACCCTAACCCTAACCC”的双端fastq文件的百分比。 所以我用了 bbduk.sh in1=1.fastq.gz in2=2.fastq.gzliteral=TAACCCTAACCCTAACCCTAACCC k=24 mm=f int=f

我得到了:

Input:                      65975862 reads      6554014910 bases.
Contaminants:               195232 reads (0.30%)    19519262 bases (0.30%)
Total Removed:              1040136 reads (1.58%)   61775988 bases (0.94%)
Result:                     64935726 reads (98.42%)     6492238922 bases (99.06%)

我可以将总删除量 (1.58%) 视为该字符串在双端 fastq 文件中的百分比吗?

另外,我用的是grep,这个命令:grep -A 2 -B 1 ' TAACCCTAACCCTAACCCTAACCC ' D1_TTAGGC_L001_R1_001.fastq.gz | sed '/--/d' > out_D1_R1.fq.

它给出了包含字符串的大约 7526 行。我除以总序列 (32987931) 得到字符串的百分比 7526/32987931= 0.02。这是否意味着只有前向 fastq 文件有 0.02 个该字符串?

谢谢

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...