用来做个人测试记录的
一、MPP概念
1、架构解析
(1)达梦大规模并行处理 MPP(DM Massively Parallel Processing,缩写 DM MPP)
(2)DM MPP 采用的完全对等无共享体系架构
2、实现原理
(1)使用分布表,将数据表分布到多个EP中
(2)连接MPP系统,内任意一个 EP 节点,则该 EP 为连接的主 EP,其余节点为从 EP
(3)主EP负责分发语句和收集结果
3、分布表类型
(1)哈希分布
哈希分布按照表定义中指定的一列或多列对行数据计算一个哈希值,再根据哈希值和哈希映射表,将该行数据分布到映射的节点上。
(2)随机分布(默认)
随机分布表不存在分布列,插入表数据时会按照一定的随机算法,将数据随机均衡分布到各个节点。
(3)复制分布
复制分布表在每个节点上的本地数据都是一份完整的拷贝
(4)范围分布
按照表定义中指定的一个或多个列的列值范围分布项,决定将一行数据存储到MPP 的哪个相应 EP 上。
(5)LIST分布
LIST 分布通过指定表中的一个或多个列的离散值集,来确定将一行数据存储到 MPP 的哪个相应 EP 上。