我的工具盒里，Gemini称王，GLM落寞，chatGPT沦落为翻译工具

www.tangshuang.net

发布于 2025-12-29 16:20:29

1770

大家好呀，好久没有更新了，最近忙着上新网站，没有时间写东西。除了公众号更新慢，我的播客更新更慢。今天来聊一聊我所认识的大模型现在的发展情况。

在过去几个月里，特别是DeepSeek发布R1之后，大模型领域的变化是肉眼可见的。随着时间的流逝，以前某些流行的大模型落幕了，而有些新模型却莫名登顶。接下来就让我一一数来。

DeepSeek

今年的春节，属于深度求索和宇树科技这两家杭州公司。DeepSeek投掷的重磅炸弹R1直接把对岸炸开锅，我们在看转手绢的时候，他们却在热锅上爬圈圈。为什么R1这么厉害？因为这是当时全球唯二在深度思考上做成的大模型。虽然国内其他大模型厂商也在训练Zero类模型，但是比起R1，都差得远，可以说掉了两个档次。另外当一家公司顶着open的名头，连基础模型都不开源时，deepseek却完全开源免费了满血版参数的R1模型。随后，阿里、腾讯、字节等等一众国内厂商，都部署上线了R1，使得14亿人（全球总人口的17.4%）可以免费且便捷的使用上全球最先进的人工智能。但是，对于我而言，由于deepseek网页端速度慢，且时常无服务器繁忙，导致它在我这里的评分不高，毕竟对于个人而言，用得上才是关键。

Qwen

现在，Qwen成为我的主力后端模型（淘汰了之前的GLM），包括在编程上通义灵码里，Qwen也是我的主力模型。Qwen一直有着不错的评分，虽然只是偶尔冒头，大部分时候都是平凡模样，但是它从来不掉队，从它频繁推出的新版本就能看出，其持续稳定的迭代是不会突然哪天说跑路的。虽然它不是最尖子生，但是在班里总是排前10，且稳定的变态。下次考试，第一名永远没人知道是谁，但是前10里面一定有Qwen。有阿里这棵大树背靠，Qwen具有稳定的tokens输出，很少遇到抽风的情况。

豆包

我已经弃用豆包作为后端，包括生图模型。豆包的模型智能程度不够，生图模型基于SD微调，SD的老问题（手指）还常出现。但是，在日常生活中，作为语音对话，豆包又是我的首选项，流畅稳定的语音交流，领跑除了chatGPT外的全部app。

GLM

曾经我非常喜爱chatGLM，除了它早期的开源贡献外，GLM的超高性能也缓解了我tokens速率焦虑。但是在今天的众多大模型中，GLM家族的智能程度不够，英文中间夹杂中文，中文中间夹杂乱码，成为硬伤。现在，我只调用它的免费模型为后端一些节点任务服务，基本上已经将它淘汰了。

文心

百度千帆生态的重要成员，如果不是因为飞桨，基本上不用。

混元

不用，自己都上deepseek了，看不到未来。

纵然曾经再牛bee，如今已过往，何以孤舟争乾坤，无奈念晚殇。

MiniMax

我只听说了星野和海螺，大语言模型上没用过。

阶跃星辰

听说setup系列超级牛，就是没用过。

Kimi

曾经梦想仗剑走天涯，如今在何方？技术没跃进就烧钱打广告，还是玩老一套资本游戏，现在还玩吗？

讲完了国内的大模型，接下来聊一聊国外的。

GPT

没有进步，200刀的订阅费，动不动就搞“实现AGI”“超智能”的新闻，真正落地普慧的没有。从模型的适用性来讲，没有什么特别的地方需要用到GPT，而且价格那么贵，毫无持续使用的兴趣。我现在唯一在用的，是他的桌面app，主要作用是挂在那里随时用来做文本翻译，毕竟它的输出非常稳定，桌面app非常干净，其他模型厂家找不到替代品。

Claude

没有跟进o1不知道官方团队是怎么想的，难道R1的成功不正好证明了深度思考方向的正确性吗？新的3.7版本说是有thinking，但是和国内某些厂商搞qwq没啥区别，本质上你需要提升智能才行啊。而且由于claude对国内用户的疯狂封号，导致现在claude就像违禁品一样。我现在除了cursor中用到claude，其他情况下没有用。

Gemini

网页端免费版是真神，现在是我的主力，浏览器常年有一个gemini的页面挂着。最近推出的多模态能力虽然被吹爆，但落到我个人似乎没有什么应用场景，待开发。我现在基本上做一些思考，都只会用到deepseek+Gemini，而且是先用gemini，在没有得到满意的答复下，才会尝试deepseek。之前看有同学博客说，升级到Advanced之后，反而智能不如免费版。反正Gemini就目前为止，是我认为大模型的天花板，那种免费的tokens飞奔的感觉，像极了天女飞仙，任何其他模型都比不上。Google DeepMind真正做到了王者归来。不过可惜的就是，它的API接入不容易，外加付费流程对国内不友好，做后端比较麻烦。

Grok

传说中的存在，没有氪金能力，没用过。

LLaMA

差点都忘记你的存在了，曾经的王者，如今的街边客。虽然开源精神可嘉，但是落地有什么场景必须得用你呢？

Mixtral

如果不是因为你是美国之外唯一全球流行的大模型，你都不会上榜。

以上就是我兜里所有的大模型，以及我的看法。

从2023年到现在2025年，大模型领域起起伏伏，行业里也涌现过很多思潮，例如“小模型”思潮、MoE思潮、深度CoT思潮，有些被证明是对的，有些逐渐被时间淘汰。就像我们的人生，此刻坚信不移的真理，或许过个几年就会反省自己真蠢。当我们观察市场时，就会发现，如今，很难再出现一个新的大模型突然间名震天下，未来的霸主几乎只能在上面这些模型里面出现。这是因为模型预训练时代已经终结了，现在唯一留下的尾巴就是，究竟是“堆算力”还是“技术架构优化”的路线之争。虽然有些不情愿，但是我猜最后还是“堆算力”赢。

其实一个时代这么快结束，是我所不愿意看到的，这意味着这一轮AI已经发展到头了，这种技术领域快速结束一个时代的情况越来越常见，其实是非常令人悲伤的。大模型之争结束，我们接下来将进入新的应用时代，claude的母公司Anthropic提出了MCP协议，基于MCP协议，可以将大模型和硬件软件串起来，未来可以帮助我们开发出更多有意思的应用。其实，一个时代既要靠底层技术，也要靠广泛应用来支撑。就像当年移动互联网一样，要有4G和安卓的底层技术支撑，也更要有广大手机App来支撑。或许2025年开始，我们又能看到应用市场百舸争流的景象。这又让我有点期待。

作为开发者，这么多模型接入起来其实也挺费劲的，最近我上线了 developround.com，它是一个统一平台，对于中国开发者，可以方便接入国外的模型，为出海应用快速上线提供便捷，对国外开发者，可以有机会尝试中国的模型，感受中国价格屠夫们的诚意。如果你也在做自己的应用或站点，特别是境外的，可以试试我的这个平台。如果想有优惠，可以在公众号后台私信，随机抽送8折接入许可证。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2025-03-18，如有侵权请联系 cloudcommunity@tencent.com 删除

工具