如何理解Kubernetes的高可用

最新推荐文章于 2025-05-06 10:00:00 发布

原创最新推荐文章于 2025-05-06 10:00:00 发布

· 454 阅读

版权

文章标签：

3 篇文章

订阅专栏

本文主要讨论kubernetes的高可用性，即每个kubernetes组件的弹性和容错能力

对Kubernetes高可用性的需求

Kubernetes是一个分布式系统，它容易受到多种故障的影响。

对于组织来说，拥有高可用性的kubernetes以提供良好的客户体验至关重要。

在发生意外中断的情况下，如果集群在一个或多个组件发生故障后仍无法继续运行，则停机时间可能会导致收入损失、声誉问题等。

通过在kubernetes中实施HA，可以降低停机风险，在集群上运行的应用程序和服务保持可用且可供用户访问，并且系统可以在无需人工干预的情况下快速从故障中恢复。

概括地说，这可以通过部署控制平面组件的多个副本来实现，这些副本具有跨多个可用性区域或区域的网络拓扑。

kubernetes控制平面的高可用性

Kubernetes控制平面包含以下核心组件

1.API服务器

2.Kube控制器管理器

3.Kube调度器

运行单个节点控制平面可能会导致所以控制平面组件的单点故障。要拥有高可用的Kubernetes控制平面，至少应有三个quoram控制平面节点，并在所有三个节点之间复制控制平面组件。

了解每个控制平面组件在跨节点部署为多个副本时的性质非常重要。因为在部署为多个副本时，很少有组件使用leader-election。

以下是每个控制平面组件的高可用性：

etcd

当涉及到etcd HA架构时，有两种模式

堆叠etcd：etcd与控制平面节点一起部署

外部etcd集群：运行专用节点的etcd集群。此模型的有点是管理良好的备份和原型选项。

为了具有容错能力，至少应该有一个三个节点的etcd集群。etcd集群的容错能力如下表所示：

当涉及到生产部署时，定期备份etcd是必不可少的

API服务器

API服务器时一个无状态应用程序，主要与etcd集互以存储和检索数据。这意味着API服务器的多个实例可以在不同的控制平面节点上运行。

为确保集群API始终可用，应将负债均衡器放置在API服务器副本的前面。工作器节点、最终用户和外部系统使用此负债均衡器端点与集群进行交互。

Kube调度器

当运行kube调度器的多个实例时，它遵循leader-election方法。这是因为，schedler组件涉及pod调度活动，一次只有一个实例可以做决策。因此，当你运行调度程序的多个副本时，一个实例被选为领导者，而其他实例被标记为追随者。

着确保了始终有一个活动的调度程序，用于做出调度决策，并避免冲突和不一致。如果是领导者，则追随者将被选为领导者并接管所以调度抉择。这样，就拥有了一个具有一致计时的高可用调度程序。

Kube控制器管理器

Kube控制器管理器也遵循相同的领导者选举方法。在许多副本中，将选出一个控制器经理，并将领导者和其他控制器标记为追随者。主控制器负责控制集群的状态。

工作器节点的高可用性

为了实现工作节点的高可用性，需要运行应用程序所需的多个工作节点。当发生pod缩放活动或节点故障时，其他工作节点上应该有足够的容量来调度pod。

在云平台上，你可以使用自动缩放来扩展工作器节点。因此，当存放扩展活动或资源需求时，工作节点可以扩展到所需的容量。

Kubernetes可用性常见问题解答

1、控制平面故障期间会发生什么情况？

即使在控制平面发生故障的情况下，工作器节点上的现有工作负载也会继续为请求提供服务器服务，但是，如果出现节点故障，则不会发生pod调度活动或任何类型的更新活动。

2、如果kubernetes集群中的DNS服务失败，会发生什么情况？

如果像核心DNS这样的DNS服务失败，它可能会对集群中运行的应用程序的可用性和功能产生重大影响。它可能会中断服务发现、外部访问、负债均衡、监控和日志记录以及滚动更新，从而导致应用程序故障、错误和中断。