1.k8s组成图
2.service和deployment的流量转发图
# Deployment 定义容器端口
apiVersion: apps/v1
kind: Deployment
metadata:name: myapp
spec:template:spec:containers:- name: nginximage: nginxports:- containerPort: 80 # 容器监听 80name: http # 端口命名(可选)---
# Service 定义端口映射
apiVersion: v1
kind: Service
metadata:name: my-service
spec:ports:- port: 8080 # Service 暴露 8080targetPort: http # 转发到容器中名为 "http" 的端口(即80)selector:app: myapp
3.pod的生命周期
| - Pod 已被 API Server 接收,但尚未被调度到节点 |
|
| - 初始化容器正在执行(示例中总共有1个初始化容器,当前完成0个) | 检查初始化容器的日志: |
| - 所有初始化容器已成功完成 | 通常短暂(秒级),若长时间卡在此状态,检查主容器的镜像拉取或启动命令问题 |
| - 主容器已成功启动并持续运行 | 可通过 |
4.容器的探针执行流程
1. Deployment 的局限性
Deployment 主要解决以下问题:
副本管理:确保指定数量的 Pod 副本运行(通过
replicas
字段)。滚动更新:支持无缝升级和回滚。
故障恢复:当 Pod 完全崩溃时,Deployment 会重新创建 Pod。
但它无法解决:
应用逻辑层面的健康状态:Pod 进程可能正在运行,但应用内部已死锁或无响应。
依赖就绪问题:Pod 已启动,但依赖的数据库/缓存尚未准备好。
启动顺序问题:应用需要较长时间初始化(如 Java 应用启动慢)。
2. 探针的核心作用
探针弥补了 Deployment 的不足,提供细粒度的健康控制:
探针类型 | 解决的问题 | 示例场景 |
---|---|---|
Liveness Probe | 解决"进程在但服务挂"的问题,触发重启。 | 线程池耗尽、内存泄漏、死锁等故障导致无响应 |
Readiness Probe | 解决"临时不可用"的问题,控制流量。 | 要加载大量的配置文件、建立数据库连接池、初始化缓存等操作 |
Startup Probe | 保护慢启动应用,避免被 Liveness Probe 误杀。 | 某个模型启动需要较长的时间加载 |
containers:
- name: myapp# 存活探针(Liveness Probe):检测容器是否处于运行但不可用的状态(如死锁),失败时会重启容器livenessProbe:httpGet: # 使用 HTTP GET 请求检测path: /internal/health # 健康检查接口路径(需由应用实现)port: 8080 # 检测的容器端口failureThreshold: 3 # 连续失败 3 次才判定为故障(默认值)# initialDelaySeconds: 0 # (未显式设置)容器启动后立即开始检测(生产环境建议设置缓冲时间)# periodSeconds: 10 # (未显式设置)默认每10秒检测一次# timeoutSeconds: 1 # (未显式设置)默认检测超时时间为1秒# 就绪探针(Readiness Probe):检测容器是否准备好接收流量,失败时从 Service 负载均衡中移除该 PodreadinessProbe:httpGet:path: /api/ready # 就绪检查接口路径(可与健康检查分开)port: 8080periodSeconds: 5 # 每 5 秒检测一次(比存活探针更频繁)# successThreshold: 1 # (未显式设置)默认成功1次即标记为就绪# failureThreshold: 3 # (未显式设置)默认连续失败3次才判定为未就绪# 启动探针(Startup Probe):保护慢启动应用,避免在初始化期间被存活探针误杀startupProbe:httpGet:path: /internal/health # 通常与存活探针使用相同接口port: 8080failureThreshold: 30 # 允许的最大失败次数(30次)periodSeconds: 10 # 每 10 秒检测一次# 总启动时间 = failureThreshold × periodSeconds = 30 × 10 = 300秒(5分钟)# 在此期间,存活探针和就绪探针不会执行