hive分层结构

最新推荐文章于 2025-04-02 16:48:24 发布

原创最新推荐文章于 2025-04-02 16:48:24 发布 · 1.8k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#hive #数据仓库 #hadoop

大数据专栏收录该内容

31 篇文章

订阅专栏

hive分层结构

hive分层结构是根据不同的业务需求而设计的。目前主流的就两种设计

三层结构

ODS层：临时存储层，一般来说是对企业中所产生的数据采集过来做临时存储，对数据源系统做解耦合，为下一步分析做准备

DW层：数据仓库层，数据加工与整合

DA层：数据应用层，提供产品和数据分析所使用的数据

四层结构

ODS层：临时存储层，一般来说是对企业中所产生的数据采集过来做临时存储，对数据源系统做解耦合，为下一步分析做准备

PWD层：数据仓库层，数据仓库层，数据加工与整合

DM层：为数据集市层，这层数据是面向主题来组织数据的，通常是星形或雪花结构的数据。从数据粒度来说，这层的数据是轻度汇总级的数据，已经不存在明细数据了。从数据的时间跨度来说，通常是PDW层的一部分，主要的目的是为了满足用户分析的需求，而从分析的角度来说，用户通常只需要分析近几年（如近三年的数据）的即可。从数据的广度来说，仍然覆盖了所有业务数据

APP层：为应用层，这层数据是完全为了满足具体的分析需求而构建的数据，也是星形或雪花结构的数据。从数据粒度来说是高度汇总的数据。从数据的广度来说，则并不一定会覆盖所有业务数据，而是DM层数据的一个真子集，从某种意义上来说是DM层数据的一个重复。从极端情况来说，可以为每一张报表在APP层构建一个模型来支持，达到以空间换时间的目的数据仓库的标准分层只是一个建议性质的标准，实际实施时需要根据实际情况确定数据仓库的分层，不同类型的数据也可能采取不同的分层方法

编程小菜鸟下午给出宝贵建议不胜感激

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

炸鸡叔老白 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。