在 Oozie 工作流中运行的 Hive 查询中使用用户名创建表名?

问题描述

我有一个 Hive sql 脚本/操作作为 Oozie 工作流的一部分。我正在做一个 CREATE TABLE AS SELECT 来输出结果。我想使用用户名和附加字符串(例如“User123456_output_table”)命名表,但似乎无法获得正确的语法。

set tablename=${hivevar:current_user()};
CREATE TABLE `${hiveconf:tablename}_output_table` AS SELECT ...

这不起作用并给出:

Error while compiling statement: Failed: IllegalArgumentException java.net.URISyntaxException: Relative path in absolute URI: ${hivevar:current_user()%7D_output_table

或者改变第一行设置 tablename=${current_user()};开始运行 SELECT 查询,但最终停止:

Error while processing statement: Failed: Execution Error,return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.hadoop.hive.ql.Metadata.HiveException: [${current_user()}_output_table]: is not a valid table name

或者改变第一行设置 tablename=current_user();开始运行 SELECT 查询,但最终停止:

Error while processing statement: Failed: Execution Error,return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.hadoop.hive.ql.Metadata.HiveException: [current_user()_output_table]: is not a valid table name

或者,有没有办法通过参数从 Oozie 工作流中传递用户名

我使用 Hue 来完成所有这些工作,而不是使用命令行。

谢谢

解决方法

这是错误的:set tablename=${hivevar:current_user()}; - 它不会按原样解决和替换。

Hive 在替换之前不会计算变量,它会按原样替换它们,变量中的所有函数都不会计算。变量只是文本替换。

这个:

set tablename=current_user();
CREATE TABLE `${hiveconf:tablename}_output_table` ...

解析为

CREATE TABLE `current_user()_output_table` ...

而且表名不支持函数,这样就不行了。

解决方案是在脚本之外计算函数,并将它们作为参数传递。

查看此博客:https://prodlife.wordpress.com/2013/12/06/parameterizing-hive-actions-in-oozie-workflows/

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...