我目前正在从事一项监测服务,该服务将监测Kubernetes的部署及其吊舱。当部署没有运行预期数量的副本时,以及当pods容器意外地重新启动时,我希望通知用户。这可能不是正确的事情来监测,我将非常感谢一些反馈意见,我应该监测。
无论如何,主要的问题是豆荚的所有状态之间的差异。当我说状态时,我指的是运行kubectl get pods时的Status列。有关的情况如下:
- ContainerCreating
- ImagePullBackOff
- Pending
- CrashLoopBackOff
- Error
- Running 是什么导致吊舱/容器进入这些状态?
对于前四种状态,这些状态可以在没有用户交互的情况下恢复吗?
CrashLoopBackOff的阈值是多少?
Running是唯一有Ready Condition为True的状态吗?
如有任何反馈,将不胜感激!
另外,在自动化脚本中使用kubectl用于监视会不会是一种糟糕的做法?例如,每分钟将kubectl get pods的结果记录到Elasticsearch?
发布于 2019-10-23 04:44:50
我会试着说出我在这些术语背后所看到的
显示何时我们等待图像被下载,容器将由一个码头或其他系统创建。
显示何时我们有问题从注册表下载图像。例如,登录到码头枢纽的凭据错误。
容器启动(如果启动需要时间)或启动,但redinessProbe失败。
此状态显示容器重新启动的时间太频繁。例如,我们有一个进程试图读取不存在的文件并崩溃。然后这个容器将由Kube重新创建并重复。
这很清楚。我们有一些运行容器的错误。
所有的都是良好的集装箱运行和livenessProbe是好的。
https://stackoverflow.com/questions/58436015
复制相似问题