Hive基本命令整理 作为大数据处理的重要工具,Hive 提供了许多实用的命令来帮助开发人员高效地处理和分析数据。下面是 Hive 中的一些基本命令整理,涵盖了表的创建、加载数据、查看结构信息、更新表名、添加新列、删除表、加载本地文件数据、显示所有函数、查看函数用法、查看数组、map、结构、内连接、外连接、in 查询等方面。 创建表 Hive 提供了多种方式来创建表,包括创建一个简单的表、创建一个分区表、创建一个结构与其他表相同的表等。例如,创建一个名为 pokes 的表,具有两个列,一个整型,一个字符串型: ``` hive> CREATE TABLE pokes (foo INT, bar STRING); ``` 创建一个名为 new_table 的表,结构与 records 表相同: ``` hive> create table new_table like records; ``` 创建一个名为 logs 的分区表,具有两个分区列 dt 和 country: ``` hive> create table logs(ts bigint,line string) partitioned by (dt String,country String); ``` 加载数据 Hive 提供了多种方式来加载数据,包括加载本地文件数据、加载 HDFS 数据等。例如,加载一个本地文件数据到 logs 表中: ``` hive> load data local inpath '/home/Hadoop/input/hive/partitions/file1' into table logs partition (dt='2001-01-01',country='GB'); ``` 查看表信息 Hive 提供了多种方式来查看表信息,包括查看表结构信息、查看表中的分区信息、查看所有表等。例如,查看 logs 表中的分区信息: ``` hive> show partitions logs; ``` 查看所有表: ``` hive> SHOW TABLES; ``` 查看所有以 's' 结尾的表: ``` hive> SHOW TABLES '.*s'; ``` 查看 invites 表的结构信息: ``` hive> DESCRIBE invites; ``` 更新表名 Hive 提供了多种方式来更新表名,例如,更新 source 表的名称为 target: ``` hive> ALTER TABLE source RENAME TO target; ``` 添加新列 Hive 提供了多种方式来添加新列,例如,添加一个名为 new_col2 的列到 invites 表中: ``` hive> ALTER TABLE invites ADD COLUMNS (new_col2 INT COMMENT 'a comment'); ``` 删除表 Hive 提供了多种方式来删除表,例如,删除 records 表: ``` hive> DROP TABLE records; ``` 删除表中的数据,但保持表的结构定义: ``` hive> dfs -rmr /user/hive/warehouse/records; ``` 加载本地文件数据 Hive 提供了多种方式来加载本地文件数据,例如,加载一个本地文件数据到 records 表中: ``` hive> LOAD DATA LOCAL INPATH '/home/hadoop/input/ncdc/micro-tab/sample.txt' OVERWRITE INTO TABLE records; ``` 查看函数 Hive 提供了多种方式来查看函数,例如,查看所有函数: ``` hive> show functions; ``` 查看 substr 函数的用法: ``` hive> describe function substr; ``` 查看数组、map、结构 Hive 提供了多种方式来查看数组、map、结构,例如,查看 complex 表中的数组、map、结构: ``` hive> select col1[0],col2['b'],col3.c from complex; ``` 内连接 Hive 提供了多种方式来实现内连接,例如,实现 sales 和 things 表的内连接: ``` hive> SELECT sales.*, things.* FROM sales JOIN things ON (sales.id = things.id); ``` 外连接 Hive 提供了多种方式来实现外连接,例如,实现 sales 和 things 表的左外连接: ``` hive> SELECT sales.*, things.* FROM sales LEFT OUTER JOIN things ON (sales.id = things.id); ``` 实现 sales 和 things 表的右外连接: ``` hive> SELECT sales.*, things.* FROM sales RIGHT OUTER JOIN things ON (sales.id = things.id); ``` 实现 sales 和 things 表的全外连接: ``` hive> SELECT sales.*, things.* FROM sales FULL OUTER JOIN things ON (sales.id = things.id); ``` in 查询 Hive 不支持 in 查询,但是可以使用左半连接来实现: ``` hive> SELECT * FROM things LEFT SEMI JOIN sales ON (things.id = sales.id); ```




















- 粉丝: 0
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 永磁同步电机(PMSM)直接转矩控制(DTC)技术的研究与实现 v1.5
- 基于改进粒子群算法的六自由度机械臂轨迹规划Matlab源码:加入动态学习因子、动态惯性权重、混沌映射与黄金正弦的优化算法
- 基于GPU并行计算的LBM三维两相流模拟:实时相饱和度曲线与精准控制参数
- LabVIEW调用VisionPro DLL实现多工位多相机二维码读取及MES上传与Modbus TCP通讯
- 基于SUMO的智能小车实时动态道路信息获取与备选路径推荐系统
- 电力系统三段式电流保护机制的Simulink建模与仿真分析 · 仿真分析
- Proteus仿真中可控增益放大电路
- 三菱PLC控制的中达一体机程序:实现单轴往复运动,双段位置循环,手动前进后退及回原点功能,便捷设置循环次数
- Cruise双电机四驱与单电机前驱分层建模研究:控制策略模型与多模式联合仿真实现及SP资料详解
- Algotirhm.cs
- MMC储能技术详解:模块化多电平变换器与电池储能系统的SOC均衡控制策略
- 相场锂枝晶:进阶案例教学——融合相场、浓度与电势的耦合分析在Comsol中的应用
- 基于TC397的Autosar BSW与MCAL工程配置:支持Xcp功能与Can通信的多核嵌入式系统开发 - CAN通信 v1.0
- 混合A星路径规划详解:基于MATLAB的逐行源码解析与实践应用
- 基于无差拍控制的有源电力滤波器仿真研究及谐波补偿文献探讨 参考文献:可依据研究内容选取相关电力电子、电力系统和控制理论等领域的文献进行参考。
- 马尔科夫时间序列预测方法:简单、易用且效果显著的具体流程步骤及相关文档 (2025年)



评论0