问题描述
我有一个Hive查询,该查询返回max_date
(单行,单列),该记录将用于主表以过滤数据。我使用临时表为max_date
create temporary table umt (processdate date);
insert into umt (
select
code for max_date from a_table
where processname = 'a_process'
);
我想在我的master_table查询中使用此max_date。 如果我使用硬编码日期来过滤master_table,则我会在1-2分钟内得到结果
select data from master_table where process_date >= '2020-09-01';
1-2分钟
但是,如果我加入,则需要15分钟以上。 master_table在process_date列上分区
select data from master_table inner join umt on process_date >= umt._max_date;
〜15分钟
是否有任何方法可以提高性能或以其他方式替换查询中的max_date以避免连接?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)