首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >CLI-Anything:一行命令把任意软件变成 AI Agent 能用的 CLI

CLI-Anything:一行命令把任意软件变成 AI Agent 能用的 CLI

作者头像
Immerse
发布2026-05-11 15:31:40
发布2026-05-11 15:31:40
3460
举报
文章被收录于专栏:沉浸式AI沉浸式AI

大家好,我是 Immerse

专注分享 AI 玩法独立开发AI 出海的 AGI 实践者,更多干货欢迎关注公众号 #沉浸式AI 或访问 yaolifeng.com


Agent 它们很擅长推理,但调不动真正的专业软件。

想让 Claude 帮你用 Blender 渲个图、用 GIMP 批处理图片、用 LibreOffice 出份 PDF,一般只有两条路——要么搞 UI 自动化截图点击(脆、慢、动不动就挂),要么为每个软件手写一套 Python 封装(贵、重复造轮子)。

港大数据科学实验室开源的 CLI-Anything 给了一个方法:用 Claude Code 插件自动给任意软件生成完整的 CLI 包装,让 Agent 像调用函数一样调用它。

MIT 协议,仓库在 HKUDS/CLI-Anything

它做了什么

一句话:你把一个软件的代码仓库丢给它,它跑 7 阶段流水线,给你吐出一个带 ClickREPL--json 输出的完整 Python CLI,并写好测试、自动发布到 PATH

7 个阶段分别是:分析源码 → 设计命令组 → 实现 CLI → 规划测试 → 写测试 → 写文档 → 打包发布。全过程自动,中间不需要你干预。

生成的 CLI 长这样:

代码语言:javascript
复制
cli-anything-gimp project new --width 1920 --height 1080 -o poster.json
cli-anything-gimp --json layer add -n "Background" --type solid --color "#1a1a2e"
cli-anything-gimp  # 直接回车进入 REPL 交互模式

最快上手

用 Claude Code 的话,两行命令:

代码语言:javascript
复制
/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything

然后就能这样用:

代码语言:javascript
复制
# 给 GIMP 生成完整 CLI
/cli-anything:cli-anything ./gimp

# 也支持直接丢 GitHub 仓库
/cli-anything:cli-anything https://github.com/blender/blender

# 跑一遍之后觉得覆盖不够?用 refine 迭代扩能力
/cli-anything:refine ./gimp "I want more CLIs on image batch processing and filters"

Pi、OpenCode、OpenClaw、Codex、Qodercli、GitHub Copilot CLI、Goose 也都有对应的安装方式,README 里每个都有命令。Windows 用户要装 Git for Windows 或用 WSL,原生命令行会挂在 cygpath 上。

几个关键设计决策

和其他"给 AI 补工具"的方案比,CLI-Anything 有几个选择挺硬核:

不做替代实现,直接调真软件。生成的 CLI 不是用 Pillow 重新实现一个 GIMP,而是调 GIMP 真正的 Script-Fu 后端;不是自己渲 3D,而是起一个 blender --background 进程。依赖缺了不降级、不 fallback,测试直接失败。这让生成的能力和原生软件完全对齐。

**每个 CLI 自带 SKILL.md**。装进 Python 包里,REPL 启动时横幅会直接打出这个文件的绝对路径,Agent 一看就知道去哪读使用指南。pip install 完不需要再配置任何东西。

**所有命令天生支持 --json**。REPL 模式给人看,JSON 模式给 Agent 看,互不打扰。

CLI-Hub 元技能。这个挺有意思——装一个 cli-anything-hub 元技能后,Agent 可以自己浏览官方注册表,看 20 多个现成的 CLI,按任务需要自己 pip install,装完再去读那个 CLI 的 SKILL.md。你只要说"用 CLI-Hub 里合适的工具完成 X",剩下的它自己搞。

已经跑通了哪些软件

目前专业验证过的 16+ 个主力软件,每个都带真实后端和完整测试:

  • 创作类:Blender(208 测试)、GIMP(107)、Inkscape(202)、KritaAudacity(161)
  • 办公类:LibreOffice(158)、ZoteroMubu(96)
  • 视频/直播:OBS Studio(153)、Kdenlive(155)、Shotcut(154)、Openscreen(101)、VideoCaptioner(26)
  • 游戏:Godot Engine(24)、Slay the Spire II
  • 图表:Draw.io(138)、Mermaid(10)
  • AI 生态:ComfyUI(70)、Ollama(98)、NotebookLM(21)、AnyGen(50)、Exa(40)
  • 通信:Zoom(22)
  • 网络:AdGuard Home(36)

合计 2130 个测试,100% 通过率。分 unit test、用真实后端跑的 E2E test、subprocess.run 调装好的命令三层验证。

什么情况下它会不好用

README 里自己列了三条限制:

  • 依赖前沿模型。作者建议 Claude Opus 4.6Sonnet 4.6GPT-5.4 这一档的基础模型。小模型生成的 CLI 质量会明显下降,要大量人工修改
  • 依赖开源源码。只有二进制的闭源软件效果差很多,反编译路径上的信息损耗逃不掉
  • 需要迭代。一次 /cli-anything 跑完不一定覆盖所有能力,往往要跑几轮 /refine 才能把常用路径才能补齐

仓库:https://github.com/HKUDS/CLI-Anything

CLI-Hub:https://hkuds.github.io/CLI-Anything/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 非同质前端札记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 它做了什么
  • 最快上手
  • 几个关键设计决策
  • 已经跑通了哪些软件
  • 什么情况下它会不好用
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档