首页
学习
活动
专区
圈层
工具
发布

GLM-4.7-Flash开源了!300亿参数轻量模型,普通电脑也能跑!

智谱AI刚开源了GLM-4.7-Flash,300亿参数的轻量款

性能和效率都是同级别SOTA,目标是替换上一代GLM-4.5-Flash

它最绝的地方,是一个混合思考模型,总参数量为30B,激活参数量为3B

可能有人问了,什么是混合思考模型?

混合思考模型是智谱科技 GLM-4.7-Flash 采用的创新 AI 架构,核心是混合专家系统 (MoE)+ 动态参数激活的智能融合,它让模型能像人类一样根据任务复杂度灵活调整 "思考深度"—— 总参数量达 30B 提供能力基础,而每次运算仅激活 3B 参数 (约 10%),通过门控机制智能选择适配的 "专家模块",简单任务快速响应 (少激活参数)、复杂任务深度推理 (多激活参数)

这种设计既够强,又不费设备,比上一代快了40%。32GB内存的苹果笔记本,都能流畅跑,彻底打破了大模型只能靠服务器的说法。

性能很顶:同级别里属上游

实测下来它表现很出色,尤其写代码的能力,比同级别其他开源模型强不少,领先优势很明显。

不管是调用工具、做数学题,它都不弱。实际开发时,适配常用的开发工具,写的代码八成以上能直接用,省不少事。

使用指南:

https://docs.bigmodel.cn/cn/guide/models/free/glm-4.7-flash

接口文档:

https://docs.bigmodel.cn/api-reference/

模型-api/对话补全

Hugging Face:

https://huggingface.co/zai-org/GLM-4.7-Flash

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O4Vf7_kco_MdXMLozRWe2JxQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券