使用bowtie2为循环for循环应用文件限制

问题描述

你好,我只想对一组文件应用循环,而不是对我的所有文件进行循环,我只想对目录中的某些文件进行循环

这是我使用的命令,是基于Bowtie2的基因组序列比对:

 for i in *1.fastq.gz
    do 
    base=$(basename $i "_1.fastq.gz")
    bowtie2 -p 8 -x /mnt/path/contigs -1 ${base}_1.fastq.gz -2 ${base}_2.fastq.gz | samtools view -b -o ${base}.bam -
    done

因此,使用此命令,bowtie2会与我的所有文件对齐,但是鉴于以下事实:在此文件夹中,有些文件的bowtie2分析已完成,因此我不希望bowtie2对这些文件再次进行分析,因此,我可以在此循环中添加任何子命令来避免对某些文件进行分析吗?

解决方法

创建2个文件,每个文件每行具有1个基本名:(1)输入,此处读取1个fastq基本文件名,以及(2)您现有的输出,此处为bam基本文件名。对文件进行排序,然后使用comm -23 file1 file2 > file3仅选择尚未映射的基本名称。然后遍历保存在file3中的内容。

快速而肮脏的解决方案(假设文件名没有空格):

ls -1 *_1.fastq.gz | perl -pe 's/_1.fastq.gz//' | sort > in.basenames.txt
ls -1 *.bam | perl -pe 's/.bam//' | sort > out.basenames.txt
comm -23 in.basenames.txt out.basenames.txt > todo.in.basenames.txt

while read -r base_name ; do
    bowtie2 -1 ${base_name}_1.fastq.gz -2 ${base_name}_2.fastq.gz ...
done < todo.in.basenames.txt

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...