应用场景:
使用在需要占用大量外存时,根节点存在内存中,相比红黑树,可以多分叉减层高,能减少外存IO的次数,比如有100w条数据,只需三层,每层1000叉。
B树:数据存储在每个节点,关键字是子树叉数减一
B+树:数据仅存在叶子节点,是B树的现实增强版,关键字(其实是子树中的最大数)等于子树个数,根节点的最大关键字就是整个B+树的最大元素;同样数据情况下,B+树比B树更矮胖,查询更快;叶子节点使用指针串联成有序链表,范围查询很方便。
B树的性质:
一颗M阶B树T,满足以下条件
1.每个结点至多拥有M颗子树(即至多含有m-1个关键字)
2.根结点不是叶节点,则至少拥有两颗子树
3.除了根结点以外,其余每个分支结点至少拥有M/2课子树
4.所有的叶结点都在同一层上,并且不带信息
5.有k棵子树的分支结点则存在k-1个关键字,关键字按照递增顺序进行排序
6.关键字数量满足ceil(M/2)-1 <= n <= M-1
插入:
分为定位---插入---分裂的过程
首先找点要插入的位置再插入,如果插入后不满足B树的性质需要进行分裂
分裂又分为根节点分裂和叶节点分裂,以6阶B树为例(最多含有6-1=5个关键字)
根节点分裂:
叶节点分裂:
B树的删除:
删除的是终端节点:
如果被删除关键字所在节点的关键字个数>ceil(M/2)-1,直接删除;
如果被删除关键字所在节点的关键字个数==ceil(M/2)-1:且相邻兄弟节点>=ceil(M/2),调整该节点、左右兄弟节点和双亲节点达到平衡(满足B树性质);
且相邻兄弟节点==ceil(M/2)-1,将关键字删除后与兄弟节点以及双亲节点中的关键字合并;
删除的是内节点k:
如果其那好两子树的关键字==ceil(M/2)-1,则合并两子节点,直接删除关键字;
其他情况,找k的前驱(子树关键字个数>ceil(M/2)-1)或后继(子树关键字个数<ceil(M/2)-1),分别替换k,然后删除k。
有合并和借位的操作,先合并或借位,再删除。
文章参考与<零声教育>的C/C++linux服务期高级架构线上课学习