理解Kylin中Cube、Cuboid、Cube Segment

本文详细介绍了Kylin中的Cube、Cuboid和Cube Segment的概念。Cube是数据立方体,是对原始数据的多维度索引集合;Cuboid是在特定维度组合下的聚合数据;Cube Segment则指针对源数据片段计算出的Cube数据。Kylin通过构建不同维度组合的Cuboid,对度量进行聚合,形成Cube。此外,文章还讨论了Cube的构建方式和操作,以及SQL查询在Kylin中的实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • Cube和Cuboid和Cube Segment

    • Cuboid在kylin中指定在某一种维度组合下所有计算的数据;

    • Cube(Data Cube),即数据立方体,是一种常用于数据分析与索引的基数;它可以对原始数据建立多维度索引。简单来说,一个Cube就是许多按维度聚合的物化视图的集合;

    • Cube Segment是指针对源数据中的某一个片段,计算出来的Cube数据。通常数据仓库中的数据会随着时间的增长而增长,而Cube Segment也是按时间顺序来构建的。注意的是,在增量构建中,相邻两个Segment的时间是连续的;

    • 了解维度和度量,就可以将数据模型上的所有字段进行分类:他们要么是维度,要么是度量,没有第三种字段。根据定义的维度和度量就可以构建Cube了。

    • 对于一个给定的数据模型,我们可以对其上所有的维度进行组合,对于N个维度来说,组合可能性共有2的N次方种。即一个N维的cube,是由1个N维子立方体、N个(N-1)维子立方体、N*(N-1)/2个(N-2)维立方体…N个1维子立方体和1个0维子立方体构成。其实就是排列组合。

    • 对于每一种维度的组合,将度量做聚合运算,然后将运算的结果保存为一个物化视图,成为cuboid。所有的维度组合的cuboid作为一个整理,被称为Cube。

  • 举个例子,假设有维度A、B、C,那么2的3次方共8种。

    • 0 维度

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

杨鑫newlfe

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值