在Hive select查询中一般会遍历整个表的内容,有时候只需要遍历表中关心的一部分数据,因此建表时引入了partition的概念
一个表可以拥有一个或者多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下。
分区是以字段的形式在表结构中存在,可以查看到字段存在,但不存放数据
单分区在表文件目录下只有一级目录,多分区在表文件夹下以多文件夹嵌套模式呈现
在Hive select查询中一般会遍历整个表的内容,有时候只需要遍历表中关心的一部分数据,因此建表时引入了partition的概念
一个表可以拥有一个或者多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下。
分区是以字段的形式在表结构中存在,可以查看到字段存在,但不存放数据
单分区在表文件目录下只有一级目录,多分区在表文件夹下以多文件夹嵌套模式呈现