Kubernetes是用于自动部署、扩展和管理容器化(containerized)应用程序的开源系统。
图1:Prometheus通过K8s API实现动态目标发现,经四阶段处理链完成数据采集
在 Kubernetes 生产环境中,超过 40% 的存储相关故障可追溯至持久化卷性能问题。当应用吞吐量从 1,000 IOPS 骤增至 50,000 IOPS...
#mermaid-svg-BWyUMeBSWTWQKXIW {font-family:"trebuchet ms",verdana,arial,sans-ser...
本文深入探讨了Kubernetes节点故障自愈方案,结合Node Problem Detector(NPD)与自动化脚本,提供技术细节、完整代码示例及实战验证。...
在Kubernetes生产环境中,我们曾遇到一个典型故障:某Node上的Pod间歇性无法访问Service,但tcpdump和kubectl describe ...
在现代云原生架构中,Kubernetes 作为容器编排的事实标准,其性能表现直接影响业务系统的稳定性和资源利用效率。根据我们跟踪的 50+ 生产集群数据,未经优...
结合 eBPF 技术演进 与 Cilium 实战落地 的完整教程,构建高性能、低侵入的 Kubernetes 可观测性平台,助力云原生网络安全与 DevOps ...
本文详细介绍了如何通过Kubernetes中的Go语言调用API Server来实现创建Job任务。该功能需要实现创建Job执行任务、任务完成后提取日志中的JS...
记录因CPU配置变更导致的K8s节点容器初始化故障排查过程,涉及kubelet的static CPU管理策略与超线程配置冲突问题。
本文档整理了在 Kubernetes 集群上部署 chutes-miner 的步骤,包括集群初始化、钱包准备以及节点管理等操作。
我们团队部署了一个关键词监测任务,意图在平台搜索“AI创业”相关内容并采集前50条热门动态,用于后续的数据分析。
云原生(Cloud Native)是一种构建和运行应用程序的方法论,根据CNCF(Cloud Native Computing Foundation)的官方定义...
大约在 2012 到 2013 年,在系统管理员社区,我开始经常听到一种名为 “Borg” 的技术。显然,它是谷歌内部的一种 Linux 容器系统,运行着他们所...
管理K8s 多个集群时难免会切换窗口、反复敲命令行的时候。前不久偶然刷到 Kite 这个项目,这是一个轻量的Kubernetes Dashboard,不搞花里...
在数字化浪潮席卷全球的今天,应用已成为企业创新和业务增长的核心驱动力。然而,许多企业在迈向应用现代化的征途中,却发现道路布满荆棘。传统的IT架构,尤其是仍广泛存...
本文由 [编码如写诗-天行1st] 原创编写,有任何问题可添加作者微信 [sd_zdhr] 获取帮助。
Kubernetes Cluster = N Master Node + N Worker Node:N主节点+N工作节点; N>=1
在介绍 HAMi 的 device-plugin 前,先了解一下 K8s 中的 Pod 是怎么使用 GPU 的。
Kubernetes集群的安全框架主要由以下认证、鉴权和准入控制三个阶段组成。这三个阶段的关系如下图所示。