问题描述
我有一个 Hive sql 脚本/操作作为 Oozie 工作流的一部分。我正在做一个 CREATE TABLE AS SELECT 来输出结果。我想使用用户名和附加字符串(例如“User123456_output_table”)命名表,但似乎无法获得正确的语法。
set tablename=${hivevar:current_user()};
CREATE TABLE `${hiveconf:tablename}_output_table` AS SELECT ...
这不起作用并给出:
Error while compiling statement: Failed: IllegalArgumentException java.net.URISyntaxException: Relative path in absolute URI: ${hivevar:current_user()%7D_output_table
或者改变第一行设置 tablename=${current_user()};开始运行 SELECT 查询,但最终停止:
Error while processing statement: Failed: Execution Error,return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.hadoop.hive.ql.Metadata.HiveException: [${current_user()}_output_table]: is not a valid table name
或者改变第一行设置 tablename=current_user();开始运行 SELECT 查询,但最终停止:
Error while processing statement: Failed: Execution Error,return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.hadoop.hive.ql.Metadata.HiveException: [current_user()_output_table]: is not a valid table name
或者,有没有办法通过参数从 Oozie 工作流中传递用户名?
我使用 Hue 来完成所有这些工作,而不是使用命令行。
谢谢
解决方法
这是错误的:set tablename=${hivevar:current_user()};
- 它不会按原样解决和替换。
Hive 在替换之前不会计算变量,它会按原样替换它们,变量中的所有函数都不会计算。变量只是文本替换。
这个:
set tablename=current_user();
CREATE TABLE `${hiveconf:tablename}_output_table` ...
解析为
CREATE TABLE `current_user()_output_table` ...
而且表名不支持函数,这样就不行了。
解决方案是在脚本之外计算函数,并将它们作为参数传递。
查看此博客:https://prodlife.wordpress.com/2013/12/06/parameterizing-hive-actions-in-oozie-workflows/