Kubernetes(K8s)探针

文章详细介绍了Kubernetes中的三种探针类型(存活探针、就绪探针和启动探针),以及它们如何在运行时监控应用程序健康状态。还提供了配置示例和一个自动检测容器健康的shell脚本,强调了合理配置探针以提升应用稳定性和可靠性的关键性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Kubernetes(K8s)提供了几种类型的探针(Probes),用于运行时检查容器中运行的应用程序的健康状态。这些探针使得Kubernetes能够更加智能地管理容器,例如自动重启失败的容器、不将流量发送到未准备好接收流量的容器等。探针可以配置为执行三种类型的检查:HTTP GET请求、TCP Socket检查、以及执行容器内的命令。

探针类型

Kubernetes定义了三种主要类型的探针:

  1. 存活探针(Liveness Probe):

    • 目的:确保应用程序正在运行。如果存活探针失败,表示应用不再活动,Kubernetes会根据策略重启该容器。
    • 应用场景:当应用因死锁或其他原因卡住时,自动重启可能恢复应用。
  2. 就绪探针(Readiness Probe):

    • 目的:检查容器是否准备好接受流量。如果就绪探针失败,表示应用虽然正在运行,但不应接收请求,Kubernetes会停止向该容器发送请求,直到它准备就绪。
    • 应用场景:用于控制那些需要加载大量数据或配置文件的应用,直到应用准备好接受流量前,不将请求路由到该容器。
  3. 启动探针(Startup Probe):

    • 目的:检查容器应用程序是否已启动。如果启动探针失败,Kubernetes会重启容器。一旦启动探针成功,就绪和存活探针将接管后续的检查。
    • 应用场景:对于启动时间较长的应用,确保不会因为启动慢而被误判为失败状态。

探针检查类型

每种探针都可以配置为执行以下类型的检查之一:

  • HTTP GET:对指定的端口和路径执行HTTP GET请求。如果返回的状态码在成功的范围内(默认为200-399),则认为检查成功。
  • TCP Socket:尝试建立TCP连接到容器的指定端口。如果连接成功建立,则认为检查成功。
  • Exec:在容器内执行指定的命令。如果命令退出状态码为0,则认为检查成功。

配置示例

下面是一个配置存活探针和就绪探针的YAML示例:

apiVersion: v1
kind: Pod
metadata:
  name: mypod
spec:
  containers:
  - name: mycontainer
    image: myimage
    livenessProbe:
      httpGet:
        path: /healthz
        port: 8080
      initialDelaySeconds: 15
      timeoutSeconds: 2
      periodSeconds: 5
      failureThreshold: 3
    readinessProbe:
      exec:
        command:
        - cat
        - /tmp/ready
      initialDelaySeconds: 5
      periodSeconds: 5

在这个例子中,存活探针通过对/healthz路径执行HTTP GET请求来检查应用的存活状态,而就绪探针通过执行cat /tmp/ready命令来检查容器是否准备好接受流量。

通过合理配置这些探针,可以提高应用的稳定性和可靠性,确保Kubernetes集群能够更加智能地管理容器。

一个自动检测容器健康状况的shell脚本例子

下面实现一个基于启动探针和存活探针的健康检测脚本,同时包括读取配置文件获取IP和端口信息,以及在检测到容器不健康时重启容器的逻辑

#!/bin/bash

# 定义变量
namespace="your-namespace"
config_path="/path/to/your/config"
pod_label_selector="app=your-app-label"

# 读取配置文件获取IP和端口
ip=$(grep 'ip' $config_path | cut -d'=' -f2)
port=$(grep 'port' $config_path | cut -d'=' -f2)

# 获取Pod名字列表
pod_names=$(kubectl get pods -n $namespace -l $pod_label_selector -o=jsonpath='{.items[*].metadata.name}')

for pod_name in $pod_names; do
    echo "Checking health for Pod: $pod_name"

    # 使用kubectl exec执行健康检查命令
    health_check_cmd="curl -s -o /dev/null -w '%{http_code}' http://$ip:$port/health"
    result=$(kubectl exec $pod_name -n $namespace -- bash -c "$health_check_cmd")

    # 检查健康状态
    if [ "$result" != "200" ]; then
        echo "Pod $pod_name is unhealthy. Restarting..."
        kubectl delete pod $pod_name -n $namespace
        # 注意:重启Pod应谨慎操作,确保符合你的应用逻辑
        # Kubernetes的部署(Deployment)会自动重新创建Pod以保持所需的副本数量
    else
        echo "Pod $pod_name is healthy."
    fi
done
说明
  • 配置读取:脚本首先从指定的配置文件路径读取应用的IP和端口信息。这里假设配置文件中有ip=...port=...这样的行。
  • Pod检索:通过kubectl get pods命令和标签选择器获取目标应用Pod的名称列表。
  • 健康检查:对每个Pod执行健康检查命令。这个示例使用curl命令检查应用的/health端点。
  • 容器重启:如果检测到容器不健康(即HTTP状态码不是200),脚本会使用kubectl delete pod命令删除该Pod。在Deployment等控制器管理下的Pod会自动被重新创建,从而达到重启的目的。
注意事项
  • 权限:执行这个脚本需要对Kubernetes集群有足够的权限,包括读取Pod信息和删除Pod的能力。
  • 安全性:在生产环境中,直接删除Pod以触发重启可能不是最佳实践,特别是对于那些没有正确配置探针的应用。最好是在应用的Deployment配置中正确设置启动探针和存活探针。
  • 配置文件:确保配置文件的路径和格式与脚本中的逻辑相匹配。如果使用不同的配置管理方式(如ConfigMap或环境变量),需要相应调整脚本。
  • 错误处理:在实际使用中,脚本应包含更详细的错误处理逻辑,比如检查kubectl命令的执行结果,处理未找到Pod的情况等。

这个脚本提供了一个基础的框架,可以根据实际需求进行调整和扩展。

Kubernetes 中,探针(Probes)用于监控容器的健康状态并据此做出相应的管理决策。Kubernetes 提供了三种类型的探针:**Liveness Probe**(存活探针)、**Readiness Probe**(就绪探针),以及 **Startup Probe**(启动探针)。每种探针都有其特定的作用和应用场景。 ### 1. Liveness Probe (存活探针) 存活探针的主要目的是判断容器是否处于“存活”状态。如果存活探针失败多次,Kubernetes 认为容器已经失效并将对其进行重启操作。这有助于自动恢复因程序崩溃或其他原因导致的服务中断。 #### 示例配置: ```yaml livenessProbe: httpGet: path: /healthz port: 8080 initialDelaySeconds: 30 # 容器启动后的初始延迟时间(秒) periodSeconds: 10 # 检查间隔时间(秒) timeoutSeconds: 1 # 超时时长(秒) failureThreshold: 3 # 连续失败次数阈值,默认是3次连续失败才认为挂掉 ``` 在这个例子中,每隔 10 秒向 `/healthz` 发送一次 HTTP 请求来检查服务是否正常工作。若三次请求均未成功,则判定容器异常进而触发重启流程。 ### 2. Readiness Probe (就绪探针) 就绪探针用来确定 Pod 是否已准备好处理外部流量和服务请求。即使一个容器还在初始化过程中,只要它的就绪探针返回成功信号,就会被视为准备完毕,并将其 IP 地址加入 Service 的端点列表中参与调度分发任务。 #### 示例配置: ```yaml readinessProbe: tcpSocket: port: 9999 # TCP连接测试目标端口 initialDelaySeconds: 5 periodSeconds: 10 timeoutSeconds: 1 successThreshold: 1 # 成功几次之后才算真正的Ready ``` 此段落表示每当新实例上线初期等待五秒钟再开始检测,以后每隔十秒尝试建立与本地 `9999` 端口号之间的TCP连接验证它能否顺利到达;只有首次尝试即成功的状况才会被认为完全可用。 ### 3. Startup Probe (启动探针) *(仅适用于 v1.16+)* 对于某些需要长时间才能完成初始化的应用来说,单独依靠 liveness probe 可能不足以准确反映实际状况,因为后者通常会在应用部分功能尚未全部加载前就已经开始了监测过程。而 startup probes 则专门为这种情况设计——它们会一直等到应用程序真正进入稳定阶段后停止活动,随后将控制权交给常规的 liveness 和 readiness checks. #### 示例配置: ```yaml startupProbe: exec: command: ["ls", "/tmp"] failureThreshold: 30 # 允许的最大连续失败次数 periodSeconds: 10 timeoutSeconds: 1 ``` 这意味着每次执行命令 `ls /tmp`, 如果在指定时间内未能得到预期结果则计作一次错误记录直至累计到设定限度为止。 ### 探针类型及其实现方式 每个探针对应多种实现手段: - **HTTP Get:** 向给定路径发起 GET 请求; - **Exec Command:** 在容器内运行一条 shell 命令; - **TCP Socket:** 尝试创建一个到某个地址/端口组合上的套接字连接。 以上就是关于 K8S探针的基本概念、用途及其常用配置示例,希望对您有所帮助! ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值