系列文章:《Istio 服务网格详解》
第 15 篇:Day 2 运维 - Istio 升级与问题排查
本篇焦点:
- 学习 Istio 控制平面的金丝雀升级 (Canary Upgrade) 流程,实现零停机平滑升级。
- 深入掌握 SRE 的“听诊器”——
istioctl
命令行工具的核心排障命令。 - 学习如何使用
istioctl
诊断配置问题、检查同步状态、以及“透视” Envoy Sidecar 的实时内部配置。
第一部分:Istio 升级 - “在飞行中更换引擎”
升级像 Istio 这样的核心基础设施,是一项高风险操作。它不仅涉及控制平面 istiod
的更新,还关系到数据平面中成百上千个 Envoy Sidecar 的行为。一次鲁莽的升级,可能会导致整个服务网格的瘫痪。
为了将风险降至最低,Istio 官方推荐使用基于 revision
的金丝雀升级策略。
核心思想:
我们不再是“就地升级”旧的控制平面,而是在集群中并行地安装一个新版本的控制平面。然后,像金丝雀发布