文档中心>容器服务>动态与公告>公告>超级节点 Pod 宿主机操作系统发布公告(优化 NodeLost 问题)

超级节点 Pod 宿主机操作系统发布公告(优化 NodeLost 问题)

最近更新时间:2025-02-11 15:42:52

我的收藏
为了提供更丰富的功能和特性,TKE 容器服务计划于2025年3月10日发布超级节点新的宿主机操作系统版本,超级节点增量 Pod 将逐步使用新版操作系统。

时间窗口

该操作系统将于2025年3月10日起逐步覆盖增量 Pod。

影响范围

本次调整对超级节点上重建或者新增的 Pod 生效,包含 TKE 标准集群和 TKE Serverless 集群的超级节点。超级节点上现有运行中的 Pod 不受影响。

新版宿主机操作系统介绍

新版宿主机操作系统依托于腾讯商业发行版本 TencentOS 底座,在原操作系统的基础上升级内核,支持更丰富的存储类型,并且对系统组件的内存使用进行了深度优化,减少系统组件对内存的占用。

版本查看方式

登录 Pod 后执行以下命令查看宿主机操作系统内核版本(5.4.241-1.0017):
# uname -a
Linux <pod-name> 5.4.241-1.0017.10.eks.8.tl4

新增特性

优化内存紧张导致机器无法响应的问题,在业务 Pod 内存接近 memory limit 时及时触发 cgroup OOM kill,避免机器进入无法响应状态(NodeLost 状态)。
支持对象存储 COS,操作指引请参见 使用对象存储 COS
支持 Ceph 文件系统(CephFS)。

变更特性

内核版本由 5.4.119-1.0009 升级到 5.4.241-1.0017。
containerd 从 v1.4.3 升级到 v1.6.9。
GPU 驱动由 470 升级到 535,最高支持 CUDA 版本由 11.4 升级到 12.2。
systemd 软件包版本由 239 更新到 255。
dbus 软件包版本由 1.12.8 更新到 1.14.8。

其他说明

如果您想提前试用该操作系统,可以 提交工单 进行申请。
运行中 Pod 如果也想使用新版本操作系统,需要重建后才能生效。
如果您通过 annotation(eks.tke.cloud.tencent.com/eklet-version)指定特定版本的操作系统,需要移除该 annotation 才能生效。