Hive 表 DML 操作——第2关:Select 操作

本篇博客主要介绍了Hive中的Select操作,包括基本语法、与各种属性的组合使用,以及具体的编程要求和测试说明。读者将学习如何查询表中的数据,如选择所有行和列、基于条件的查询、处理重复行、使用LIMIT获取指定数量的记录,以及按特定字段排序。通过实例,详细解析了如何在Hive中执行这些操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第2关:Select 操作


任务描述

本关任务:按照编程要求执行相应的select操作。

相关知识

为了完成本关任务,你需要掌握:1. select语法格式;2. 常用的select语法。

select 语法格式

Hive select操作的语法与SQL-92规范几乎没有区别,其格式语法为:

SELECT [ALL | DISTINCT] select_expr,select_expr,… FROM table_reference
[WHERE where_condition] [GROUP BY col_list] [CLUSTER BY col_list | [DISTRIBUTE BY col_list] [SORT BY col_list]] [LIMIT number]
select 与各种属性的组合
  • 简单的select查询操作,如下面的查询操作返回students表中所有的行和列:

    hive> select * from students;

  • WHERE子句的select条件查询操作,返回满足WHERE指定条件的行。如下面的查询操作返回用户信息表users中的年龄大于10岁且国籍为中国的所有用户:

HiveDML(Data Manipulation Language)操作包括对数据的增加(INSERT)、查询(SELECT)、更新(UPDATE)和删除(DELETE)。以下是每种操作的基本介绍: 1. INSERT操作Hive提供了向中插入数据的方法,可以将数据插入到新中或者追加数据到现有中。 ```sql INSERT OVERWRITE TABLE 新 [PARTITION (分区列 = '分区值')] SELECT 列1, 列2 FROM 原 WHERE ...; INSERT INTO TABLE 现有 [PARTITION (分区列 = '分区值')] SELECT 列1, 列2 FROM 原 WHERE ...; ``` Hive 0.14版本之后支持更新(UPDATE)和删除(DELETE)操作2. SELECT操作SELECT语句用于从中选择数据。这是最常用的查询语句,可以使用各种聚合函数、条件判断等来进行复杂查询。 ```sql SELECT 列名 FROM 名 WHERE 条件; ``` 3. UPDATE操作: UPDATE用于更新中已经存在的数据,但只能更新最后一个分区的数据。 ```sql UPDATE 名 SET 列名 = 新值 WHERE 条件; ``` 4. DELETE操作: DELETE用于从中删除数据,同样只支持删除最后一个分区的数据。 ```sql DELETE FROM 名 WHERE 条件; ``` Hive中的DML操作通常使用MapReduce进行执行,因此操作的性能相较于传统系型数据库要慢一些。需要注意的是,由于Hive本质上是存储在HDFS上的数据,因此在执行更新或删除操作时,实际上是在原有数据的基础上进行标记或添加新的数据版本,而不是直接修改原数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

真题OK撒

你的打赏将是我最大的创作

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值