暂无搜索历史
作者:wanger 公众号:运维开发故事 博客:https://devopstory.cn
作者:乔克 公众号:运维开发故事 博客:https://jokerbai.com
github:https://github.com/orgs/sunsharing-note/dashboard
前面我们介绍了 《开发 K8s Chat 命令行工具》,实现了通过和 Kubernetes 进行交互的方式进行运维,虽然文章中所描述的功能比较简单,但是可以以此...
熟悉我的朋友或者关注《运维开发故事》公众号的朋友都知道我喜欢写作,时常在公众号上发布分章,除此之外呢,我对博客也挺感兴趣。
!! 大家好,我是乔克,一个爱折腾的运维工程,一个睡觉都被自己丑醒的云原生爱好者。
讲 AIOps 的时候为什么要讲 基础设施即代码(Infrastructure as Code,简称IaC) 呢?
在正式进入AIOps实践之前,先简单普及下相关的理论知识,我们会从以下几个方面进行介绍:
目前,大部分公司都采用Prometheus + Grafana这一套来做指标监控,所以在Prometheus中也有大量的指标数据。为了满足日常工作中的巡检,可以...
目前GPU卡资源紧张且业务需求逐渐递增,存在整卡不够分配或GPU利用率低造成资源浪费的情况。
模型上下文协议(Model Context Protocol)是由Anthropic等提出并开源的标准协议,⽤于连接⼤模型与外部应用和数据源 ,被誉为AI世界的...
Kubernetes(简称K8s)的普及让开发和运维工作变得更加高效,但它的复杂性却让许多人在使用时面临挑战。从网络配置到故障排查,每一步都需要深入的技术积累。...
在《告警平台1.0》中,我们实现了告警平台,可以实现纳管通过AlertManager推送的告警信息,然后进行灵活的告警通知发送。
亲和性与反亲和性通过节点亲和性(NodeAffinity)和Pod亲和性(PodAffinity/PodAntiAffinity)实现。
作为一名Kubernetes管理员,你是否经历过: ✅ 服务正常却找不到CPU飙升的根本原因? ✅ 容器进程异常但无法快速定位根源? ✅ 缺乏完整的进程级监控体...
heapdump文件是Java应用遭遇OOM后的诊断报告,记录了某一时刻 JVM 堆中对象的详细使用情况,是 JVM 堆内存的一个快照。通过分析 heapdum...