Hive Query在where子句中不允许> =

问题描述

我有一个Hive查询,该查询返回max_date(单行,单列),该记录将用于主表以过滤数据。我使用临时表为max_date

生成逻辑
create temporary table umt (processdate date);
insert into umt ( 
select 
code for max_date from a_table 
where processname = 'a_process'
);

我想在我的master_table查询中使用此max_date。 如果我使用硬编码日期来过滤master_table,则我会在1-2分钟内得到结果

select data from master_table where process_date >= '2020-09-01'; 1-2分钟

但是,如果我加入,则需要15分钟以上。 master_table在process_date列上分区 select data from master_table inner join umt on process_date >= umt._max_date;〜15分钟

是否有任何方法可以提高性能或以其他方式替换查询中的max_date以避免连接?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)