Hive:四大表类型内部表、外部表、分区表和桶表

本文介绍了Hive的四种表类型:内部表、外部表、分区表和桶表。内部表在删除时会连同数据一起消失,而外部表仅删除元数据,保留数据,适合共享。分区表用于大数据量场景,通过分区快速定位查询,提高效率。桶表则有助于解决数据倾斜问题,改善查询性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考资料:

Hive(7):Hive四大表类型内部表、外部表、分区表和桶表

https://blog.csdn.net/u010886217/article/details/83796151

 

2.外部表

(1)适用情形:

  当一份日志需要多个小组一起分析,分析完了之后创建的表就可以删除了。但是普通的表删除的同时也会把数据删除,这样就会影响到其他小组的分析,而且日志数据也不能随便删除。所以,需要外部表,删除外部表,不会删除对应的hdfs上的数据

备注:

普通表,指的是内表,内表需要insert数据,如果删除内表,则所有数据都会被删除。

外表,使用hdfs上的txt文件,只要指定一下文件路径和分隔符即可。

(2)创建外部表

create EXTERNAL table dept_ext(
deptno int,
dname string,
loc string
)
row format delimited fields terminated by '\t' ;
load data local inpath '/opt/datas/dept.txt' into table dept_ext;

(3)对比外部表和内部表区别
   

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值