K8S 性能瓶颈排查
随着业务量增长,Kubernetes 集群经常出现:
- • Pod 启动慢?
- • API 响应慢?
- • 节点 CPU 飙高?
- • 服务无故中断?
这可能是性能瓶颈在悄悄作祟。
性能瓶颈全局视角
# K8S 性能瓶颈排查思维导图- 集群层面- API Server 响应慢- Etcd 压力大- 控制面组件异常- 节点层面- CPU / Memory / Disk I/O 饱和- Kubelet 资源不足- 宿主机负载高- Pod 层面- OOM / CPU Throttling- Pending / CrashLoopBackOff- 容器冷启动慢- 网络层面- DNS 延迟- Service 负载不均- 网络丢包 / 延迟- 存储层面- PV 响应慢- PVC 挂载失败- IO 延迟高
核心性能瓶颈定位指标
1. API Server 响应慢
可使用 Prometheus + Grafana 面板查看:
- •
apiserver_request_duration_seconds