智谱AI刚开源了GLM-4.7-Flash,300亿参数的轻量款
性能和效率都是同级别SOTA,目标是替换上一代GLM-4.5-Flash
它最绝的地方,是一个混合思考模型,总参数量为30B,激活参数量为3B
可能有人问了,什么是混合思考模型?
混合思考模型是智谱科技 GLM-4.7-Flash 采用的创新 AI 架构,核心是混合专家系统 (MoE)+ 动态参数激活的智能融合,它让模型能像人类一样根据任务复杂度灵活调整 "思考深度"—— 总参数量达 30B 提供能力基础,而每次运算仅激活 3B 参数 (约 10%),通过门控机制智能选择适配的 "专家模块",简单任务快速响应 (少激活参数)、复杂任务深度推理 (多激活参数)
这种设计既够强,又不费设备,比上一代快了40%。32GB内存的苹果笔记本,都能流畅跑,彻底打破了大模型只能靠服务器的说法。
性能很顶:同级别里属上游
实测下来它表现很出色,尤其写代码的能力,比同级别其他开源模型强不少,领先优势很明显。
不管是调用工具、做数学题,它都不弱。实际开发时,适配常用的开发工具,写的代码八成以上能直接用,省不少事。
使用指南:
https://docs.bigmodel.cn/cn/guide/models/free/glm-4.7-flash
接口文档:
https://docs.bigmodel.cn/api-reference/
模型-api/对话补全
Hugging Face:
https://huggingface.co/zai-org/GLM-4.7-Flash