功能概述
调度策略配置是原生节点专用调度器(Crane-scheduler)的一项功能,旨在帮助用户根据业务需求和集群资源状况,灵活地调整 Pod 的调度策略。通过配置调度策略,用户可以优化集群资源利用率,提高应用性能和可用性。
版本限制
仅支持 v1.4.1 及以上的 Crane-scheduler 版本。
调度策略说明
预选策略
为了避免 Pod 被调度至高负载的节点(Node),我们首先采用预选策略把高负载的 Node 过滤掉。预选策略可以根据节点的实际负载情况动态配置过滤阈值和比例。具体配置方法请参见 后续参数设置说明。
以图示为例,Node2 在过去5分钟内的负载以及 Node3 在过去1小时内的负载均超出了预设的阈值,因此它们将不会进入下一阶段的优选过程。
优选策略
优选策略旨在从符合预选策略条件的节点(Node)中挑选出最佳节点进行 Pod 调度。为了实现集群内各节点负载的均衡分布,Crane-scheduler 会依据 Node 的实时负载数据为其评分,其中负载越低的节点获得的评分越高。评分策略及其权重系数均可根据实际需求进行动态调整,详细的配置方法请参阅后续参数配置说明。
参考下图,我们可以看到 Node1 因其较低的负载而获得了最高的评分,因此它将被系统优先调度以运行 Pod。
调度热点
为了避免低负载节点因持续调度大量 Pod 而变成新的负载热点,Crane-scheduler 引入了调度热点策略。该策略通过统计节点在过去一段时间内调度的 Pod 数量,并据此调整节点在优选阶段的评分。
节点得分计算公式:节点得分 = 优选策略评分 - 热点值
当前策略细节如下:
若节点在过去一分钟内调度的 Pod 数量超过2个,则优选评分减1分。
若节点在过去五分钟内调度的 Pod 数量超过5个,则优选评分同样减1分。
通过实施这一策略,Crane-scheduler 能够确保调度决策更加全面,既考虑了节点的即时负载情况,也考虑了节点近期的调度历史,从而实现更为均衡的集群负载分布。
参数说明
预选参数
预选指标默认参数 | 描述 |
5分钟平均 CPU 利用率阈值 | 节点过去5分钟平均 CPU 利用率超过设定阈值,不会调度 Pod 到该节点上。 |
1小时最大 CPU 利用率阈值 | 节点过去1小时最大 CPU 利用率超过设定阈值,不会调度 Pod 到该节点上。 |
5分钟平均内存利用率阈值 | 节点过去5分钟平均内存利用率超过设定阈值,不会调度 Pod 到该节点上。 |
1小时最大内存利用率阈值 | 节点过去1小时最大内存利用率超过设定阈值,不会调度 Pod 到该节点上。 |
优选参数
说明:
优选参数默认值,如您无额外需求,可直接采用。
优选指标 | 默认参数 | 描述 |
5分钟平均 CPU 利用率权重 | 0.2 | 该权重越大,过去5分钟节点平均 CPU 利用率对节点的评分影响越大。 |
1小时最大 CPU 利用率权重 | 0.3 | 该权重越大,过去1小时节点最大 CPU 利用率对节点的评分影响越大。 |
1天最大 CPU 利用率权重 | 0.5 | 该权重越大,过去1天内节点最大 CPU 利用率对节点的评分影响越大。 |
5分钟平均内存利用率权重 | 0.2 | 该权重越大,过去5分钟节点平均内存利用率对节点的评分影响越大。 |
1小时最大内存利用率权重 | 0.3 | 该权重越大,过去1小时节点最大内存利用率对节点的评分影响越大。 |
1天最大内存利用率权重 | 0.5 | 该权重越大,过去1天内节点最大内存利用率对节点的评分影响越大。 |
热点参数
说明:
热点参数默认值,如您无额外需求,可直接采用。
热点指标 | 默认参数 | 描述 |
近5分钟调度 Pod 数 | 10.0 | 该权重越大,近5分钟节点调度 Pod 数对节点的评分影响越大。 |
近1分钟调度 Pod 数 | 20.0 | 该权重越大,近1分钟节点调度 Pod 数对节点的评分影响越大。 |
操作步骤
开始使用
1. 登录 容器服务控制台,在左侧导航栏中选择集群。
2. 在集群列表中,单击目标集群 ID,进入集群详情页。
3. 选择左侧菜单栏中的组件管理,在 CranesScheduler 的操作列单击更新配置,进入更新组件配置页面。
配置调度策略
注意:
1. 在配置调度策略时,请确保充分了解业务需求和集群资源状况,以避免不必要的资源浪费或性能下降。
2. 在调整调度策略时,建议先在测试环境中验证效果,再应用到生产环境。
预选指标配置
预选指标作用:用于节点初步筛选,仅当该节点对应指标低于设定的调度阈值时,方可通过预选。
指标数量限制:最多可配置4条预选指标,且指标不可重复。您也可以选择不配置预选指标。
优选指标配置
优选指标作用:用于在通过预选后的节点中进一步筛选,显示默认权重参数,支持自定义权重设置。
调度原则:Pod 将优先调度至资源利用率较低的节点。
指标数量限制:最多可配置6条优选指标,且指标不可重复。您也可以选择不配置优选指标。
热点设置
热点指标作用:考虑节点近期调度 Pod 的数量,以便更全面地评估节点的负载状况。
推荐权重设置:近5分钟调度 Pod 数权重建议设为10,近1分钟调度 Pod 数权重建议设为20。
指标数量限制:最多可配置2条热点指标,且指标不可重复。您也可以选择不配置热点指标。