MySQL中Nested-LoopJoin算法小结资源-CSDN下载

5星 · 超过95%的资源 170 浏览量 2020-09-10 05:38:27 上传评论收藏 59KB PDF 举报

数据库中JOIN操作的实现主要有三种：嵌套循环连接（Nested Loop Join），归并连接（Merge Join）和散列连接或者哈稀连接（Hash Join）。其中嵌套循环连接又视情况又有两种变形：块嵌套循环连接和索引嵌套循环连接。 MySQL中的Nested-Loop Join（NLJ）是一种基本的JOIN操作实现方式，主要用于处理两个或多个表之间的连接。NLJ的基本思想是逐行遍历一张表（称为外部表），然后对每一行与另一张表（称为内部表）进行匹配。这个过程可以继续扩展到更多的表，形成多层循环。 NLJ的基本算法可以简化为以下步骤： 1. 对外部表t1进行范围查询（如果存在索引，可能会优化为只扫描满足条件的部分行）。 2. 对于t1的每一行，查询内部表t2，寻找与t1匹配的行。这个匹配通常基于参考键（即JOIN条件）。 3. 对于找到的t1和t2的匹配行，进一步与其他表（如t3）进行JOIN操作，直到所有JOIN条件都满足，然后将结果发送给客户端。 NLJ的两种变形： - 块Nested-Loop Join（BNLJ）：在基本的NLJ中，每次仅处理一行。BNLJ则尝试批量处理，将外部表的一批行存储在内存的join buffer中。当buffer满时，它会与内部表的所有行进行匹配，然后清空buffer，重复此过程。这样减少了磁盘I/O次数，提高了效率。 - 索引Nested-Loop Join（INLJ）：如果内部表有合适的索引，MySQL可能会利用该索引来快速查找匹配行，而不是进行全表扫描，这显著提高了JOIN的性能。 MySQL在5.7版本中仍然不支持Hash Join，只支持NLJ和Merge Join。在某些情况下，NLJ可以通过选择正确的驱动表（即JOIN顺序）来优化。MySQL会选择预计结果集最小的表作为驱动表，因为这通常会导致更少的循环次数和更高的效率。通过调整JOIN顺序，或者使用`STRAIGHT_JOIN`语法指定JOIN顺序，可以强制优化器使用特定的驱动表。 Block Nested-Loop Join的效率提升在于使用join buffer来存储外部表的行。这样，内部表只需与buffer中的行组合进行比较，而不是与每一行单独比较。对于buffer中的行S和内部表的组合C，扫描内部表t3的次数可以用公式`(S * C) / join_buffer_size + 1`计算。join_buffer_size越大，扫描次数越少，但当buffer足够大以容纳所有组合时，进一步增加buffer大小不再带来显著的性能提升。在实际应用中，调整join_buffer_size的大小可以优化JOIN操作，但要注意过大的buffer会占用更多的内存，可能会影响其他查询的性能。此外，优化JOIN还包括创建合适的索引，特别是在JOIN列上，以及避免全表扫描，确保JOIN操作尽可能高效。理解MySQL中的Nested-Loop Join机制对于数据库性能优化至关重要。通过深入理解NLJ的工作原理、变形和优化策略，我们可以更好地设计和调优复杂的SQL查询，提高数据库系统的整体性能。

资源推荐

资源详情

资源评论

MySQL中中Nested-Loop Join算法小结算法小结

数据库中JOIN操作的实现主要有三种：嵌套循环连接（Nested Loop Join），归并连接（Merge Join）和散列

连接或者哈稀连接（Hash Join）。其中嵌套循环连接又视情况又有两种变形：块嵌套循环连接和索引嵌套循环

连接。

不知不觉的玩了两年多的MySQL，发现很多人都说MySQL对比Oracle来说，优化器做的比较差，其实某种程度上来说确实是

这样，但是毕竟MySQL才到5.7版本，Oracle都已经发展到12c了，今天我就看了看MySQL的连接算法，嗯，现在来说还是不

支持Hash Join，只有Nested-Loop Join，那今天就总结一下我学习的心得吧。

Nested-Loop Join基本算法实现，伪代码是这样：

for each row in t1 matching range {

for each row in t2 matching reference key {

for each row in t3 {

if row satisfies join conditions,

send to client

}

这段代码很简单，虽然我也不怎么会写代码，但是我还是看得懂的。这里假设有三张表，t1, t2, t3，这段代码，分别会展现

出explain计划里的range, ref和ALL，表现在SQL执行计划层里，t3就会进行一次全表扫描，我今天在这个地方看到了一个很妖

的优化SQL方法，Straight-join：http://hidba.ga/2014/09/26/join-query-in-mysql/，其中提到了驱动表的概念，那么对应过来，

驱动表就是伪代码里的t3表，博文里说MySQL会自动选择结果集最小的表作为驱动表，作为算法分析，这样选择驱动表确实

是消耗最小的办法。那么这里还提到了，通过缩小驱动表结果集进行连接优化，那么根据这个算法来看，结果集较小的驱动表

确实可以使循环次数减少。

当然了，MySQL自己在这个算法基础上，演进出了Block Nested-Loop join算法，其实基本上和上面的算法没有区别，伪代

码如下：

for each row in t1 matching range {

for each row in t2 matching reference key {

store used columns from t1, t2 in join buffer

if buffer is full {

for each row in t3 {

for each t1, t2 combination in join buffer {

if row satisfies join conditions,

send to client

}

empty buffer

}

if buffer is not empty {

for each row in t3 {

for each t1, t2 combination in join buffer {

if row satisfies join conditions,

send to client

}

这个算法，将外层循环的数据缓存在join buffer中，内层循环中的表回合buffer中的数据进行对比，从而减少循环次数，这

样便可以提高效率。官网上有个example，我有点没有看明白：如果有10行被缓存到了buffer里，这10行被传给了内层循环，

内层循环的所有行都会和buffer中的这10行进行对比。原文是这样的：

For example, if 10 rows are read into a buffer and the buffer is passed to the next inner loop, each row read in the inner loop

can be compared against all 10 rows in the buffer

如果S指的是t1, t2组合在缓存中的大小，C是这些组合在buffer中的数量，那么t3表被扫描的次数应该是：

(S * C)/join_buffer_size + 1

根据这个算式，join_buffer_size越大，扫描的次数越小，如果join_buffer_size到了能缓存所有之前的行组合，那么这时就

是性能最好的时候，之后再增大也就没有什么效果了。

在有索引的情况下，MySQL会尝试去使用Index Nested-Loop Join算法，在有些情况下，可能Join的列就是没有索引，那么这

时MySQL的选择绝对不会是最先介绍的Simple Nested-Loop Join算法，因为那个算法太粗暴，不忍直视。数据量大些的复杂

SQL估计几年都可能跑不出结果，如果你不信，那就是too young too simple。或者Inside君可以给你些SQL跑跑看。

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论收藏

内容反馈

郑华滨

2023-06-20

不像其他的文章，这篇作者没有选择过于复杂的实例，保持了阅读的简单。
湯姆漢克

2023-06-20

很感激文章中所提供的使用实际例子解释的例子。
鲸阮

2023-06-20

对于初学者来说，这里提供的参考文献也是非常有用的。
陌陌的日记

2023-06-20

我很感谢作者所提供的清晰和易懂的解释。
陈后主

2023-06-20

这篇文章对于我这个新手来说非常有帮助！

前往

页

weixin_38565003

粉丝: 6

MySQL中Nested-Loop Join算法小结

最新资源

MySQL中Nested-Loop Join算法小结

mysql存储过程双层嵌套

Index-Nested-Loop-Join-INLJ:使用Semi Stream Join实现构建和分析DW原型

mysql-5.7.28-linux-glibc2.12-x86_64.tar.gz

mysql Join使用以及优化

MySQL JOIN 工作原理浅析1

35.join语句怎么优化？1

MySQL的联接_V21

实验4设计思路1

SQL语句优化之JOIN和LEFT JOIN 和 RIGHT JOIN语句的优化

Mysql 8.0.18 hash join测试(推荐)

Mysql join联表及id自增实例解析

mysql源码

MySQL 8.0.18 Hash Join不支持left/right join左右连接问题

44.答疑文章（三）：说一说这些好问题1

MySQL 8.0.18 稳定版发布! Hash Join如期而至

101 透彻研究通过explain命令得到的SQL执行计划（2）.pdf

数据结构与数据库的有关资料

行业-100 透彻研究通过explain命令得到的SQL执行计划（1）.rar

东软颐养中心系统 Spring Boot+Vue+MySQL

学生成绩管理系统（JAVA课程设计）

MySQL学生成绩管理系统设计实验报告

基于Java的校园二手交易平台的设计与实现【附源码】

自主研发的软著申请代码文档整理输出工具

芋道源码-BPM工作流模块-初始化sql语句-mysql版本

mysql 全国省市区三级联动表（2024.4最新）

MySQL 8.0 OCP认证考试题目详解

MySql 8.0.37

DataGrip软件包

基于SpringBoot+Vue的学生选课管理系统的毕业设计，Vue+SpringBoot+MybatisPlus+MySQL

JS 两种事件处理模型：事件冒泡和事件捕获

行业分类-设备装置-用于胶版印刷纸的涂料组合物.zip

最新资源