通过 CLI 提供 NextFlow 工作流输入非参数

问题描述

我有以下(简化的)nextflow 模块。它有一个进程,它在一个 fasta 文件上运行多序列比对,以及一个运行这个进程的工作流(最终它也会运行其他进程):

process clustal_omega_msa {
    input:
      path fastas
    output:
      path 'clustal.sto'
    script:
      """
      cat ${fastas} > merged.fa
      clustalo -infile merged.fa --outfmt=stockholm
      """
    container "https://depot.galaxyproject.org/singularity/clustalo:1.2.4--h1b792b2_4"
}

workflow msa {
  take:
    path fastas
  main:
    clustal_omega_msa(fastas)
}

我希望这个工作流程既可以作为子工作流程导入,也可以直接执行。为此,我没有指定任何参数,只使用输入(因为我认为在调用子工作流时无法指定参数)。

但是,我看不到直接在命令行上运行此子工作流的方法

如果我运行 nextflow run msa.nf -entry msa,我会收到以下错误

No such variable: fastas

 -- Check script 'msa.nf' at line: 1 or see '.nextflow.log' file for more details

这是有道理的 - 我没有指定这些文件的来源。但是我怎么办?如果我按照文档的 config 部分并创建一个 nextflow.config 包含以下内容

fastas = "/some/path/to/*.fasta"

我仍然收到此错误。我也知道有一个 -params-file 选项,但我相信它只适用于参数,而不适用于输入。

解决方法

Implicit workflow definitions 在脚本作为模块导入时被忽略。这意味着您的工作流脚本可以用作库模块或应用程序脚本:

nextflow.enable.dsl=2
params.input_fasta_files = './data/*.fasta'


process clustal_omega_msa {

    input:
    path fastas
    
    output:
    path 'clustal.sto'

    """
    cat ${fastas} > merged.fa
    clustalo -infile merged.fa --outfmt=stockholm
    """
}

workflow msa {
  
    take:
    fasta_files
  
    main:
    clustal_omega_msa(fasta_files)
}

workflow {

    input_fasta_files = Channel.fromPath( params.input_fasta_files ).collect()

    msa( input_fasta_files )
}

请注意,如果您要将“msa”子工作流移动到一个单独的文件中,例如名为“msa.nf”的文件,那么您只需导入它并使用 {{3} }.例如:

nextflow.enable.dsl=2

include { msa } from './path/to/msa.nf' addParams(foo: 'bar')

params.input_fasta_files = './data/*.fasta'


workflow {

    input_fasta_files = Channel.fromPath( params.input_fasta_files ).collect()

    msa(input_fasta_files)
}

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...