问题描述
package somepackage.udfs;
import io.netty.buffer.DrillBuf;
import org.apache.drill.exec.expr.DrillSimpleFunc;
import org.apache.drill.exec.expr.annotations.FunctionTemplate;
import org.apache.drill.exec.expr.annotations.Output;
import org.apache.drill.exec.expr.annotations.Param;
import org.apache.drill.exec.expr.holders.Float8Holder;
import org.apache.drill.exec.expr.holders.NullableVarCharHolder;
import org.apache.drill.exec.expr.holders.VarCharHolder;
import javax.inject.Inject;
@FunctionTemplate(
name = "split_sample",scope = FunctionTemplate.FunctionScope.SIMPLE,nulls = FunctionTemplate.NullHandling.NULL_IF_NULL
)
public class SplitTrainTestSample implements DrillSimpleFunc {
@Param
NullableVarCharHolder targetIn;
@Param(constant = true)
Float8Holder train_test_rate;
@Output
VarCharHolder label;
@Inject
DrillBuf buffer;
public SplitTrainTestSample() {
}
@Override
public void setup() {
}
@Override
public void eval() {
double r = Math.random();
String l;
assert 0 < train_test_rate.value && train_test_rate.value < 1;
if (r < train_test_rate.value) {
l = "train";
}
else {
l = "test";
}
byte[] bytes = l.getBytes();
label.buffer = buffer;
label.start = 0;
label.end = bytes.length;
label.buffer.setBytes(0,bytes);
}
}
但是当我运行这个查询时
Apache Drill> select split_sample(cast(full_name as char),0.5) from cp.`employee.json`;
Drill 返回错误消息。
Error: VALIDATION ERROR: From line 1,column 8 to line 1,column 49: No match found for function signature split_sample(<CHaraCTER>,<NUMERIC>)
请帮我找出问题所在。我在同一个包下编写了另一个 UDF,它运行良好。所以不太可能是 UDF 注册表错误。
有没有办法探测UDF的函数签名?
解决方法
Drill UDF 真的很难调试。
我怀疑这种情况下的问题是:
double r = Math.random();
尝试将其替换为:
double r = java.lang.Math.random();
如果这不起作用,您可能想尝试使用简单的 if
语句而不是 assert
。此外,我从未在 UDF 参数中看到 (constant = true)
。
一般来说,除了 Drill 内部类,几乎所有外部类都必须写出它们的完整路径。除了 Drill 内部构件之外,您不能将任何内容导入 UDF。 UDF 实际上使用 Java 的一个子集,结果是要知道支持什么和不支持什么可能有点棘手。
令人讨厌的是 Drill 没有为您提供任何有用的调试信息。它只是说它找不到 UDF。
当我遇到这种情况时,我要做的是注释掉整个 UDF 主体,在取消注释每一行后运行该函数以查看哪一行导致了问题。
一种简单的方法是创建一个带有静态函数的辅助类。
public class functionHelpers {
public String getLabel(<params>) {
// Your code here...
}
}
// Then in your UDF exec() method
...
String label = com.my_package.functionHelpers.getLabel(<params>);
...
如果您有复杂的 UDF,让生活变得更轻松。您还可以更轻松地调试代码,因为您可以轻松地为辅助类编写单元测试,然后使用固定代码将输出映射到 Drill 向量。