Hive 中 MERGE INTO
的语法及应用案例详解
MERGE INTO
是 Hive 中用于高效处理 数据合并(插入、更新、删除)的操作,特别适用于 增量数据处理 或 缓慢变化维(SCD) 场景。需注意以下前提条件:
一、前提条件
-
Hive 版本:
MERGE INTO
需要 Hive 2.2 及以上版本,且需启用 ACID 事务支持。 -
表配置:
-
目标表必须为 分桶表(Bucketed Table)。
-
存储格式需为 ORC。
-
启用事务属性:
TBLPROPERTIES ('transactional'='true')
。
-
-
配置参数:
SET hive.support.concurrency = true; SET hive.enforce.bucketing = true; SET hive.exec.dynamic.partition.mode = nonstrict; SET hive.tx