Elasticsearch的分布式查询过程

最新推荐文章于 2025-06-23 14:57:56 发布

程序员面试那点事儿

最新推荐文章于 2025-06-23 14:57:56 发布

阅读量488

点赞数 1

CC 4.0 BY-SA版权

分类专栏：每天一道面试题 ElasticSearch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_23864697/article/details/109582708

每天一道面试题同时被 2 个专栏收录

119 篇文章

订阅专栏

11 篇文章

订阅专栏

Elasticsearch搜索请求通过协调节点在多个分片上执行，包括查询和取回两个阶段。查询阶段，请求广播到所有分片，每个分片构建topN匹配文档的有序列表；取回阶段，协调节点获取文档详情，最终按需返回结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一个搜索请求必须询问请求的索引中所有分片的某个副本来进行匹配。

假设一个索引有5个主分片，每个主分片有1个副分片，共10个分片，一次搜索请求会由5个分片来共同完成，它们可能是主分片，也可能是副分片。也就是说，一次搜索请求只会命中所有分片副本中的一个。
在这里插入图片描述

协调节点

两阶段：查询（Query）阶段和取回（Fetch）阶段。

在初始查询阶段，查询会广播到索引中每一个分片副本（主分片或副分片），每个分片在本地执行搜索并构建一个匹配文档的、存有topN匹配文档的有序列表优先队列，大小为分页参数from +size。

Query阶段

在这里插入图片描述

客户端发送search请求到NODE 3
Node 3将查询请求转发到索引的每个主分片或副分片中。
每个分片在本地执行查询，并使用本地的Term/Document Frequency信息进行打分，添加结果到大小为from + size的本地有序优先队列中。
每个分片返回各自优先队列中所有文档的ID和排序值给协调节点，协调节点合并这些值到自己的优先队列中，产生一个全局排序后的列表。

更详细的Query流程如下

在这里插入图片描述

Fetch阶段

在这里插入图片描述

协调节点向相关NODE发送GET请求。
分片所在节点向协调节点返回数据
协调节点等待所有文档被取得，会按照返回的排序值对从所有分片取回的值重新进行排序，最终只选取客户端需要的from+size个文档的Id,然后返回给客户端。

更详细的Fetch流程如下
在这里插入图片描述

ElasticSearch的分布式查询流程分为query和fetch两个阶段，在query阶段会从所有的shard上读取相关document的docId及相关的排序字段值，并最终在coordinating节点上收集所有的结果数进入一个全局的排序列表后，然后获取根据from+size指定page页的数据，获取这些docId后再构建一个multi-get请求发送相关的shard上从_source里面获取需要加载的数据，最终再返回给client端，至此整个search请求流程执行完毕

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。