前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【K8s】Kubernetes 稳定性之资源限制及服务质量等级

【K8s】Kubernetes 稳定性之资源限制及服务质量等级

作者头像
行者Sun
发布2024-09-11 18:45:18
1530
发布2024-09-11 18:45:18
举报
文章被收录于专栏:Kubernetes

以下内容均来自个人笔记并重新梳理,如有错误欢迎指正!

如果对您有帮助,烦请点赞、关注、转发!如果您有其他想要了解的,欢迎私信联系我~

资源限制

1、基本介绍

Kubernetes 是一个完全以资源为中心的系统,资源限制是通过 Cgroups 等控制 Pod 使用节点资源(CPU、内存、存储)的一种机制,对于确保 Kubernetes 集群运行的稳定、高效至关重要。通过合理配置资源限制,可以避免资源争用和过载,同时提高应用程序的可靠性和性能。

资源限制的具体概念有:

  • Requests(请求):定义容器启动时所需的最小资源量。Kubernetes 会确保每个容器至少获得其请求的资源量,以避免因为资源不足而启动失败
  • Limits(限制):定义容器可以使用的最大资源量。当容器尝试使用超过其限制的资源时,它可能会被系统终止或受到限制,以防止影响集群中其他容器的性能
  • Quotas(配额):针对命名空间内所有资源进行总体限制,用于控制资源的消耗,防止某些用户或团队过度使用资源

2、工作原理

  • 资源定义:用户在 Pod 中定义资源请求和限制
  • 调度决策:Kubernetes 调度器在调度 Pod 时会考虑节点上的可用资源。如果节点上的资源不足以满足 Pod 的请求,调度器将不会将 Pod 调度到该节点
  • 资源分配:一旦 Pod 被调度到节点,Kubernetes 会根据资源请求为 Pod 分配资源。Pod 可以使用的资源不会超过其限制
  • 资源监控:Kubernetes 持续监控每个 Pod 的资源使用情况
  • 资源回收:当 Pod 使用的资源超过其限制时,Kubernetes 可以采取回收措施。如果是 CPU 使用超过限制,CPU 会被压缩导致应用程序运行变缓,如果是内存使用超过限制,容器会直接被 OOM Kill
  • 资源配额:通过设置资源配额,Kubernetes 可以限制命名空间内可以创建的资源数量和消耗的资源总量,从而避免资源的过度使用
3、限制方法
  • 配置 Container 限制
代码语言:javascript
复制
apiVersion: apps/v1
kind: Deployment
metadata:
  nanme: demo-deployment
spec:
...
    spec:
      containers:
...
        resources:
          limits:
            cpu: 1000m
            memory: 1Gi
            ephemeral-storage: 10Gi
          requests:
            cpu: 100m
            memory: 100Mi
            ephemeral-storage: 1Gi
 
 
🔔 说明1:如果没有设置 requests,则其值与 limits 的值相同
🔔 说明2:如果没有设置  limits, 则其值默认为 0,即没有限制
 
cpu:'1'=1c=1000m
memory:单位 k/Mi/Gi;无单位是字节,1000=1k
ephemeral-storage:单位 k/Mi/Gi,定义临时存储的需求和限制
  • 配置 namespace 限制(即资源配额)
代码语言:javascript
复制
# 定义资源配额对象
# resourcequota.yaml
apiVersion: v1
kind: ResourceQuota
metadata:
  name: quota-demo
spec:
  hard:
    requests.cpu: 1000m
    requests.memory: 1000Mi
    limits.cpu: 4000m
    limits.memory: 8000Mi
    requests.storage: "1Gi" 
    persistentvolumeclaims: "2"
 
# 创建对象
kubectl apply -f resourcequota.yaml
 
# 查看对象
kubectl get resourcequotas
 
NAME         AGE    REQUEST                                                                                                              LIMIT
quota-demo   4m5s   persistentvolumeclaims: 15/2, requests.cpu: 3050m/1, requests.memory: 12912Mi/1000Mi, requests.storage: 1316Gi/1Gi   limits.cpu: 63700m/4, limits.memory: 148200Mi/8000Mi
  • 配置默认限制
代码语言:javascript
复制
# 定义 LimitRange 对象
# limitrange.yaml
apiVersion: v1
kind: LimitRange
metadata:
  name: demo-limit-range
spec:
  limits:
  - type: Container
    default:
      cpu: 500m
      memory: 1000Mi
    defaultRequest:
      cpu: 100m
      memory: 200Mi
 
# 创建对象
kubectl apply -f limitrange.yaml
 
# 查看对象详情
kubectl describe limitranges
 
Name:       demo-limit-range
Namespace:  lanhuapp
Type        Resource  Min  Max  Default Request  Default Limit  Max Limit/Request Ratio
----        --------  ---  ---  ---------------  -------------  -----------------------
Container   cpu       -    -    100m             500m           -
Container   memory    -    -    200Mi            1000Mi         -

服务质量等级

服务质量等级(Qos,即 Quality Of Service)用于为不同 Pod 提供不同等级的资源供应保障。

服务质量等级分为以下三种:

  • Guaranteed:Limits 和 Requests 的值相同,等级最高
  • Burstable:Limits 和 Requests 的值不同
  • Best-Effort:Limits 和 Requests 的值没有设置 ,等级最低

需要长时间以稳定状态运行的 Pod,可以配置为 Guaranteed 级别,以确保节点资源不足时 Pod 保持稳定运行而不会被驱逐,而其它 pod 则可以配置为 Burstable 甚至 Best-Effort 级别

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-09-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 实施运维知识交流 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 3、限制方法
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档