Apache Drill UDF:找不到匹配的函数签名

问题描述

嗨,我正在开发钻取用户定义的函数。我已经写了这个 UDF。

package somepackage.udfs;

import io.netty.buffer.DrillBuf;
import org.apache.drill.exec.expr.DrillSimpleFunc;
import org.apache.drill.exec.expr.annotations.FunctionTemplate;
import org.apache.drill.exec.expr.annotations.Output;
import org.apache.drill.exec.expr.annotations.Param;
import org.apache.drill.exec.expr.holders.Float8Holder;
import org.apache.drill.exec.expr.holders.NullableVarCharHolder;
import org.apache.drill.exec.expr.holders.VarCharHolder;

import javax.inject.Inject;

@FunctionTemplate(
        name = "split_sample",scope = FunctionTemplate.FunctionScope.SIMPLE,nulls = FunctionTemplate.NullHandling.NULL_IF_NULL
)
public class SplitTrainTestSample implements DrillSimpleFunc {
    @Param
    NullableVarCharHolder targetIn;

    @Param(constant = true)
    Float8Holder train_test_rate;

    @Output
    VarCharHolder label;

    @Inject
    DrillBuf buffer;

    public SplitTrainTestSample() {
    }

    @Override
    public void setup() {
    }

    @Override
    public void eval() {
        double r = Math.random();
        String l;
        assert 0 < train_test_rate.value && train_test_rate.value < 1;
        if (r < train_test_rate.value) {
            l = "train";
        }
        else {
            l = "test";
        }
        byte[] bytes = l.getBytes();

        label.buffer = buffer;
        label.start = 0;
        label.end = bytes.length;
        label.buffer.setBytes(0,bytes);
    }
}

但是当我运行这个查询

Apache Drill> select split_sample(cast(full_name as char),0.5) from cp.`employee.json`;

Drill 返回错误消息。

Error: VALIDATION ERROR: From line 1,column 8 to line 1,column 49: No match found for function signature split_sample(<CHaraCTER>,<NUMERIC>)

请帮我找出问题所在。我在同一个包下编写了另一个 UDF,它运行良好。所以不太可能是 UDF 注册错误

有没有办法探测UDF的函数签名?

解决方法

Drill UDF 真的很难调试。

我怀疑这种情况下的问题是:

double r = Math.random();

尝试将其替换为:

double r = java.lang.Math.random();

如果这不起作用,您可能想尝试使用简单的 if 语句而不是 assert。此外,我从未在 UDF 参数中看到 (constant = true)

一般来说,除了 Drill 内部类,几乎所有外部类都必须写出它们的完整路径。除了 Drill 内部构件之外,您不能将任何内容导入 UDF。 UDF 实际上使用 Java 的一个子集,结果是要知道支持什么和不支持什么可能有点棘手。

令人讨厌的是 Drill 没有为您提供任何有用的调试信息。它只是说它找不到 UDF。

当我遇到这种情况时,我要做的是注释掉整个 UDF 主体,在取消注释每一行后运行该函数以查看哪一行导致了问题。

一种简单的方法是创建一个带有静态函数的辅助类。

public class functionHelpers {
 public String getLabel(<params>) {
   // Your code here... 
 }
}

// Then in your UDF exec() method
...

String label = com.my_package.functionHelpers.getLabel(<params>);
...

如果您有复杂的 UDF,让生活变得更轻松。您还可以更轻松地调试代码,因为您可以轻松地为辅助类编写单元测试,然后使用固定代码将输出映射到 Drill 向量。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...