hive 误删表恢复

hive表分内部表和外部表,误删(drop)后,其恢复逻辑是不同的

内部表

内部表删除以后表结构和表数据都会删除,如果hdfs没有开启“回收站”功能,那数据是就是直接删除了;如果开启了“回收站”,表数据就在‘回收站’里,可以通过下面命令一级一级的找到

hdfs dfs -ls /user/XX/.Trash

找到以后,恢复方法是:1)重建表结构;2)把‘回收站’里的数据 mv 到新的目录;3)命令:MSCK REPAIR TABLE XX 修复数据不一致

外部表

外部表删除后只删除了表结构,表数据还在建表时指定的位置。
恢复方法是:重建表结构时把位置指向原表的数据位置

参考

https://blog.csdn.net/qq_44696532/article/details/127841934

### Hive 中 Truncate 命令误删除数据后的恢复方法 对于通过 `TRUNCATE` 命令清空的 Hive ,由于该命令会直接清除中的所有数据而不会移动到回收站,因此常规情况下这些数据无法像 DROP 的那样容易恢复[^1]。 然而,在某些特定条件下仍有可能尝试恢复: #### 尝试从 HDFS 日志中查找残留数据 虽然 `TRUNCATE` 不会将旧版本的数据放入垃圾箱,但在极少数情况下,部分未及时清理的日志文件可能还保存着被截断之前的数据副本。这取决于具体集群配置以及日志保留策略[^4]。 ```bash hdfs dfs -ls /path/to/table/directory/_logs/ ``` 请注意上述路径需替换为实际存储位置,并且这种方法成功率较低。 #### 利用备份机制 如果所在环境启用了自动定期全量或增量备份,则可以从最近一次完整的备份集中提取丢失的信息并重新导入至当前数据库实例内[^2]。 #### 数据库快照功能(适用于支持此特性的发行版) 一些企业级大数据平台提供了更高级别的保护措施如时间点恢复(PITR),允许管理员回滚到指定历史时刻的状态从而挽救意外损失的内容[^3]。 尽管存在以上几种理论上的解决方案,但针对由 TRUNCATE 导致的数据遗失情况而言,最有效的预防手段始终在于事前准备——即建立完善的事先防范体系,包括但不限于启用事务管理、设置合理的权限控制政策等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值