我有一个EKS集群和一个运行6个节点的节点组。对于一些reson节点,随机地将其标记为unschedulable,每周或两周一次,然后保持这种状态。当我注意到我手动解除他们的限制时,一切都很好。
为什么会发生这种情况?我如何调试、防止或配置群集来自动修复它?
发布于 2022-02-03 14:15:57
在我的例子中,问题是正在运行的AWS Termination Handler守护进程。它已经过时,在集群中并没有真正使用,在删除它之后,节点被标记为不可调度的问题就消失了。
https://stackoverflow.com/questions/70695954
复制相似问题