
原文
郭子龙 发表于 2025/11/18
Agent 自动完成排查,也可以再通过继续对话交互深入分析。
技术指导(如 K8s 最佳实践咨询)和需求支持(如资源配额调整建议)。
1. @机器人 排查告警信息。自动回复结构化诊断结论、建议和关键日志片段

2. @机器人,提出任何k8s相关需求,如资源优化。

3. @机器人 排查容器异常退出。


FROM xxx-registry.cn-shanghai.cr.aliyuncs.com/public-test/alpine:3.21
# 下载 kubectl 和 kubectl-ai
# RUN wget https://dl.k8s.io/release/v1.33.0/bin/linux/amd64/kubectl -O /bin/kubectl && chmod +x /bin/kubectl && \
# wget https://github.com/GoogleCloudPlatform/kubectl-ai/releases/download/v0.0.26/kubectl-ai_Linux_x86_64.tar.gz && tar -xzf kubectl-ai_Linux_x86_64.tar.gz -C /bin/ && rm kubectl-ai_Linux_x86_64.tar.gz
# 复制本地文件(如果存在)
COPY ./deploy/kubectl-ai /bin/kubectl-ai
COPY ./deploy/kubectl /bin/kubectl
# 设置权限并安装依赖
RUN chmod +x /bin/kubectl-ai && \
chmod +x /bin/kubectl && \
apk add bash && rm -rf /var/cache/apk/*
ENTRYPOINT [ "/bin/kubectl-ai" ]12345678910111213141516apiVersion: apps/v1
kind: Deployment
metadata:
name: kubectl-ai
namespace: kubectl-ai
labels:
app: kubectl-ai
spec:
replicas: 1
selector:
matchLabels:
app: kubectl-ai
template:
metadata:
labels:
app: kubectl-ai
spec:
serviceAccountName: kubectl-ai
containers:
- name: kubectl-ai
image: xxx.cn-shanghai.cr.aliyuncs.com/public-test/devops:kubectl-ai-latest
imagePullPolicy: Always
args:
- --llm-provider=openai
- --model=qwen3-coder-plus
- --skip-permissions=true
- --max-iterations=20
- --v=4
- --alsologtostderr
- --mcp-server
- --mcp-server-mode=streamable-http
- --http-port=9080
envFrom:
- secretRef:
name: kubectl-ai
resources:
requests:
cpu: 100m
memory: 128Mi
limits:
cpu: 1000m
memory: 512Mi
livenessProbe:
tcpSocket:
port: 9080
initialDelaySeconds: 30
periodSeconds: 10
timeoutSeconds: 5
readinessProbe:
tcpSocket:
port: 9080
initialDelaySeconds: 5
periodSeconds: 5
timeoutSeconds: 3
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354---
# ServiceAccount for kubectl-ai deployment
apiVersion: v1
kind: ServiceAccount
metadata:
name: kubectl-ai
namespace: kubectl-ai
labels:
app: kubectl-ai
---
# ClusterRoleBinding to grant the ServiceAccount cluster-wide read-only access
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
name: kubectl-ai-readonly-binding
labels:
app: kubectl-ai
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: kubectl-ai-readonly
subjects:
- kind: ServiceAccount
name: kubectl-ai
namespace: kubectl-ai
---
# ClusterRole with all read-only permissions
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
name: kubectl-ai-readonly
labels:
app: kubectl-ai
rules:
# Core API resources - 基于内置 view ClusterRole
// ... 略
12345678910111213141516171819202122232425262728293031323334353637飞书 aily workflow配置入口:

Agent配置:
通过 kubectl-ai + 飞书 aily workflow,我们把多步骤命令行操作简化为一个按钮,让运维经验沉淀为可复用的自动化能力。
Agent 能解决日常大部分琐碎问题,显著提高排查效率,但个别疑难杂症仍需人工介入 —— 它是第一道防线和效率工具,而非完全替代。
期待与基础平台团队深化合作,将 Agent 能力与 OnCall 告警系统等深度集成,共同构建更智能的研发协作体验。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。