如何在 Hive 中创建一个以非事务表为模型的分桶 ORC 事务表

问题描述

假设我在 Hive 中有一个名为“ccm”的非事务性表。它有数百列和一个分区字段。

我知道如何使用“create table abc like ccm”创建副本,但我希望将 abc 分桶、ORC,并通过 TBLPROPERTIES 设置事务支持

我在编写 HQL 时不想提及 ccm 中的所有列。

我可以这样做吗?

解决方法

这个答案在您的情况下可能有正确的处理方式,并且还解释了所用方法的一些限制。

Create hive table using "as select" or "like" and also specify delimiter

因此,从示例中,您应该添加缺少的部分:

  • CLUSTER BY
  • TBLPROPERTIES ("transactional"="true")

我怀疑您能否完全达到预期的结果,但我认为这是向前迈出的一步