大数据技术之HBase：恁爹搞的数据库

王二蛋！

于 2024-12-02 17:49:51 发布

阅读量1.1k

点赞数 20

分类专栏：大数据文章标签：大数据数据库 hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28314431/article/details/143365174

版权

大数据专栏收录该内容

9 篇文章

订阅专栏

HBase 和 HDFS、MapReduce 是 Google 三篇大论文对应的开源实现。全称为 Hadoop DataBase ，看到这个名称也就不难理解，HBase 是一款数据库。

提到数据库大家应该就有概念了，所有业务系统都离不开的增删改查操作都需要数据库。

没错，HBase 就是一个支持增删改查操作的“大”数据库，只不过 HBase 是基于 HDFS 实现的。

初学者在接触HBase的时候，可能会产生一个疑问：“既然有支持SQL的Hive，为什么又有HBase，这两个有什么区别 ”。这里有几个概念补齐后可能会解答你的疑惑：

第一，就如上面所说，两者的提出按照时间线来讲，HBase是前于Hive的。一个是为了解决关系数据库所存在的存储（增删改）和查询的瓶颈，一个是为了简化大数据的计算难度。
HBase 是基于 HDFS 解决存储和查询大规模数据的分布式数据库。Hive 被称为数据仓库，主要是可以通过 SQL 实现 MapReduce、Spark 等计算任务，从而达到快速计算统计的效果。（查询不等于统计）。

所以，这里需要把数据库和数据仓库的概念区分开。

如果对数据仓库没有概念的可以看下oracle对数仓的定义。

如果非要对两者区分的话，可以从增删改查来区分：

HBase 是分布式 NoSQL 数据库， NoSQL 大家应该都不陌生，从Redis、MongoDB等一度要替代 SQL 的 No SQL ，到后来的 Not Only SQL 的各式各样数据库。所以 HBase 本身也是不支持SQL语句的，只提供一些API完成增删改查操作。
Hive 通常应用在对海量数据进行计算统计，整个过程比较耗时，替代不了数据库。

虽然基于 HDFS 存储，但是HBase却支持数据的实时增删改查。

这里有个概念需要知道：

传统的关系型数据库是单机的，通常一个表的数据在一个文件中，想要做到实时的增删改查是比较容易的。但是 HDFS 中的一个文件是要分布在不同的节点上，实时添加一条数据相对容易，直接在文件末尾追加数据即可。删除、修改这样的更新操作还要去定位到数据，是怎么做到实时的？

带上问题去了解 HBase，欢迎大家一起交流。

评论 14

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

王二蛋！ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。