大家好,我是 Ai 学习的老章
昨天谷歌放了个大招,掀翻了 AI 编程领域的餐桌
这就是 GEMINI CLI
https://github.com/google-gemini/gemini-cli
闲话少叙,我们直接看看如何在 Terminal 中安装使用,还有在 VSCode 中与 Gemini Code Assist 的互补玩法。
根据官方博客介绍
Gemini CLI 是 Google 推出的开源 AI 工具,直接集成在开发者的终端(命令行)中,主要特点如下:
Google 确实财大气粗,这个免费额度(每分钟 60 次和每天 1000 次模型请求)真遥遥领先了。
调用的模型也是遥遥领先的——Gemini 2.5 Pro,这个模型大家应该知道它的实力,我之前做过实测
大模型写高考作文,状元是 DeepSeek,榜眼是 Qwen3,探花是_Gemini_
实测,大模型谁更懂数据可视化?Gemini 2.5 Pro 是最强大的代码模型,毫无争议
大模型天梯图:https://llm.homeworkkun.top
Gemini CLI 安装很简单
npx https://github.com/google-gemini/gemini-cli
CLI 运行后,即可通过命令行与 Gemini 交互
,时长00:30
Gemini 2.5 Pro是多模态大模型,安装CLI之后,你甚至可以在Terminal中生成视频
谷歌 Github 上介绍了一些编程方面用法:
1、新建目录启动项目:
$ cd new-project/
$ gemini
> 请为我编写一个Gemini Discord机器人,它能根据我提供的FAQ.md文件回答问题
2、探索新代码库
首先通过cd
命令进入现有或新克隆的代码库,然后运行gemini
。
> 描述该系统架构的主要组成部分。
> 当前部署了哪些安全机制?
3、处理现有代码
> 为GitHub第123号问题实现初版方案。
> 协助我将代码库迁移至最新Java版本,请先制定迁移计划。
4、自动化工作流
使用 MCP 服务器将本地系统工具与企业协作套件集成。
> 生成展示最近7天git历史的幻灯片,按功能点和团队成员分组呈现。
> 开发全屏网页应用,用于墙面显示屏展示GitHub上互动量最高的问题。
5、系统交互
> 将此目录下所有图片转换为png格式,并使用exif数据中的日期重命名。
> 按支出月份整理我的PDF发票。
我拿出了自己准备的专门用于文档解析的 PDF
解析完成后桌面上就出现了 test.md
效果好的离谱,远比专业解析模型(我如我已经测过的 Nanonets 和 Dolphin)强多了
Google 前几个月还放出过一个免费的 VSCode 插件——Gemini Code Assist
,时长01:13
主要功能
我也安装试了一下,背后对应的应该是 Gemini Flash,感觉其权限和模型能力都没有 Terminal 中运行的 Gemini CLI 大
两者结合使用或许会好很多,最终界面如下:
这里看个人喜欢,Gemini Code Assist 默认是在左侧的,和文件目录冲突了,我习惯在左右侧 chat,就像 Cursor 和 Windsurf 一样。
移动它也很简单,点击右上角辅助测栏,然后鼠标点击 GEMINI CODE ASSIST:CHAT 这里,拖动到左右侧就行了
然后在 VSCode 中打开终端,再装一下 Gemini CLI 就行了
总结:
就目前我的使用情况,Gemini 2.5 Pro 这个模型是绝对没问题的,尤其是编程领域,与 Claude 3.7 不相上下。
谷歌也足够豪气,感觉可以尝试替换掉 20 美元每月的 Cusor 或 10 美元每月的 Windsurf 了。
缺点嘛,1 是网络要畅通,你要有谷歌账号。2 是 CLI+Code Assist 还是不如 Cusor/Windsurf 使用方便。