首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >我的工具盒里,Gemini称王,GLM落寞,chatGPT沦落为翻译工具

我的工具盒里,Gemini称王,GLM落寞,chatGPT沦落为翻译工具

作者头像
否子戈
发布2025-12-29 16:20:29
发布2025-12-29 16:20:29
30
举报

大家好呀,好久没有更新了,最近忙着上新网站,没有时间写东西。除了公众号更新慢,我的播客更新更慢。今天来聊一聊我所认识的大模型现在的发展情况。

在过去几个月里,特别是DeepSeek发布R1之后,大模型领域的变化是肉眼可见的。随着时间的流逝,以前某些流行的大模型落幕了,而有些新模型却莫名登顶。接下来就让我一一数来。

DeepSeek

今年的春节,属于深度求索和宇树科技这两家杭州公司。DeepSeek投掷的重磅炸弹R1直接把对岸炸开锅,我们在看转手绢的时候,他们却在热锅上爬圈圈。为什么R1这么厉害?因为这是当时全球唯二在深度思考上做成的大模型。虽然国内其他大模型厂商也在训练Zero类模型,但是比起R1,都差得远,可以说掉了两个档次。另外当一家公司顶着open的名头,连基础模型都不开源时,deepseek却完全开源免费了满血版参数的R1模型。随后,阿里、腾讯、字节等等一众国内厂商,都部署上线了R1,使得14亿人(全球总人口的17.4%)可以免费且便捷的使用上全球最先进的人工智能。但是,对于我而言,由于deepseek网页端速度慢,且时常无服务器繁忙,导致它在我这里的评分不高,毕竟对于个人而言,用得上才是关键。

Qwen

现在,Qwen成为我的主力后端模型(淘汰了之前的GLM),包括在编程上通义灵码里,Qwen也是我的主力模型。Qwen一直有着不错的评分,虽然只是偶尔冒头,大部分时候都是平凡模样,但是它从来不掉队,从它频繁推出的新版本就能看出,其持续稳定的迭代是不会突然哪天说跑路的。虽然它不是最尖子生,但是在班里总是排前10,且稳定的变态。下次考试,第一名永远没人知道是谁,但是前10里面一定有Qwen。有阿里这棵大树背靠,Qwen具有稳定的tokens输出,很少遇到抽风的情况。

豆包

我已经弃用豆包作为后端,包括生图模型。豆包的模型智能程度不够,生图模型基于SD微调,SD的老问题(手指)还常出现。但是,在日常生活中,作为语音对话,豆包又是我的首选项,流畅稳定的语音交流,领跑除了chatGPT外的全部app。

GLM

曾经我非常喜爱chatGLM,除了它早期的开源贡献外,GLM的超高性能也缓解了我tokens速率焦虑。但是在今天的众多大模型中,GLM家族的智能程度不够,英文中间夹杂中文,中文中间夹杂乱码,成为硬伤。现在,我只调用它的免费模型为后端一些节点任务服务,基本上已经将它淘汰了。

文心

百度千帆生态的重要成员,如果不是因为飞桨,基本上不用。

混元

不用,自己都上deepseek了,看不到未来。

Yi

纵然曾经再牛bee,如今已过往,何以孤舟争乾坤,无奈念晚殇。

MiniMax

我只听说了星野和海螺,大语言模型上没用过。

阶跃星辰

听说setup系列超级牛,就是没用过。

Kimi

曾经梦想仗剑走天涯,如今在何方?技术没跃进就烧钱打广告,还是玩老一套资本游戏,现在还玩吗?

讲完了国内的大模型,接下来聊一聊国外的。

GPT

没有进步,200刀的订阅费,动不动就搞“实现AGI”“超智能”的新闻,真正落地普慧的没有。从模型的适用性来讲,没有什么特别的地方需要用到GPT,而且价格那么贵,毫无持续使用的兴趣。我现在唯一在用的,是他的桌面app,主要作用是挂在那里随时用来做文本翻译,毕竟它的输出非常稳定,桌面app非常干净,其他模型厂家找不到替代品。

Claude

没有跟进o1不知道官方团队是怎么想的,难道R1的成功不正好证明了深度思考方向的正确性吗?新的3.7版本说是有thinking,但是和国内某些厂商搞qwq没啥区别,本质上你需要提升智能才行啊。而且由于claude对国内用户的疯狂封号,导致现在claude就像违禁品一样。我现在除了cursor中用到claude,其他情况下没有用。

Gemini

网页端免费版是真神,现在是我的主力,浏览器常年有一个gemini的页面挂着。最近推出的多模态能力虽然被吹爆,但落到我个人似乎没有什么应用场景,待开发。我现在基本上做一些思考,都只会用到deepseek+Gemini,而且是先用gemini,在没有得到满意的答复下,才会尝试deepseek。之前看有同学博客说,升级到Advanced之后,反而智能不如免费版。反正Gemini就目前为止,是我认为大模型的天花板,那种免费的tokens飞奔的感觉,像极了天女飞仙,任何其他模型都比不上。Google DeepMind真正做到了王者归来。不过可惜的就是,它的API接入不容易,外加付费流程对国内不友好,做后端比较麻烦。

Grok

传说中的存在,没有氪金能力,没用过。

LLaMA

差点都忘记你的存在了,曾经的王者,如今的街边客。虽然开源精神可嘉,但是落地有什么场景必须得用你呢?

Mixtral

如果不是因为你是美国之外唯一全球流行的大模型,你都不会上榜。

以上就是我兜里所有的大模型,以及我的看法。

从2023年到现在2025年,大模型领域起起伏伏,行业里也涌现过很多思潮,例如“小模型”思潮、MoE思潮、深度CoT思潮,有些被证明是对的,有些逐渐被时间淘汰。就像我们的人生,此刻坚信不移的真理,或许过个几年就会反省自己真蠢。当我们观察市场时,就会发现,如今,很难再出现一个新的大模型突然间名震天下,未来的霸主几乎只能在上面这些模型里面出现。这是因为模型预训练时代已经终结了,现在唯一留下的尾巴就是,究竟是“堆算力”还是“技术架构优化”的路线之争。虽然有些不情愿,但是我猜最后还是“堆算力”赢。

其实一个时代这么快结束,是我所不愿意看到的,这意味着这一轮AI已经发展到头了,这种技术领域快速结束一个时代的情况越来越常见,其实是非常令人悲伤的。大模型之争结束,我们接下来将进入新的应用时代,claude的母公司Anthropic提出了MCP协议,基于MCP协议,可以将大模型和硬件软件串起来,未来可以帮助我们开发出更多有意思的应用。其实,一个时代既要靠底层技术,也要靠广泛应用来支撑。就像当年移动互联网一样,要有4G和安卓的底层技术支撑,也更要有广大手机App来支撑。或许2025年开始,我们又能看到应用市场百舸争流的景象。这又让我有点期待。

作为开发者,这么多模型接入起来其实也挺费劲的,最近我上线了 developround.com,它是一个统一平台,对于中国开发者,可以方便接入国外的模型,为出海应用快速上线提供便捷,对国外开发者,可以有机会尝试中国的模型,感受中国价格屠夫们的诚意。如果你也在做自己的应用或站点,特别是境外的,可以试试我的这个平台。如果想有优惠,可以在公众号后台私信,随机抽送8折接入许可证。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 唐霜 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档