首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >大模型榜单周报(2026-01-04)

大模型榜单周报(2026-01-04)

原创
作者头像
KAI智
发布2026-01-07 22:43:35
发布2026-01-07 22:43:35
4850
举报
文章被收录于专栏:AI早知道AI早知道

1. 本周概览

DeepSeek在市占率方面表现突出,份额增加显著。同时,通义实验室开源了GUI智能体MAI-UI,涵盖从端侧小模型到云端大模型的多个尺寸版本。此外,DeepSeek提出了名为「mHC(流形约束超连接)」的新架构,能够在增加极少训练时间开销的情况下实现显著性能提升。

2. 重点关注事件

  • 通义实验室于12月26日开源GUI智能体MAI-UI,提供从2B端侧小模型到235B云端大模型四个尺寸版本,覆盖全场景部署需求,论文地址:https://arxiv.org/abs/2512.22047
  • DeepSeek于12月31日提出名为「mHC(流形约束超连接)」的新架构,在27B参数模型上,仅增加约6.7%的训练时间开销,即可实现显著性能提升,论文地址:https://arxiv.org/abs/2512.24880

3. 榜单变化

  • OpenRouter模型调用量变化:Grok Code Fast 1、Claude Sonnet 4.5保持前两位;小米发布的MiMo-V2-Flash (free)从第4名上升至第3名;编程调用量方面,Grok Code Fast 1保持第1,Devstral 2 2512 (free)上升6名至第2位,MiMo-V2-Flash新上榜位列第8。
  • OpenRouter公司市占率变化:Google保持第1位,DeepSeek份额上升3.7%(从9.6%增至13.3%),位列榜单第2名;xAI市占率下降3%(从14.4%降至11.4%),OpenAI市占率下降2.5%(从10.5%降至8.0%);小米、MistralAI、Qwen、z-AI保持第6-9名。
  • 大语言模型Text Arena榜单:GLM-4.7新晋榜单第17名,模型评分基于预发布测试,可能会随公开发布后社区反馈和投票的演变而发生变化。
  • 编程能力WebDev Arena榜单:minimax-m2.1-preview新晋榜单第6名,紧跟gemini-3-flash之后,超过glm-4.7,评分基于预发布测试。
  • 图像编辑能力Artificial Analysis Image Editing Leaderboard:Wan 2.6新晋榜单第7名,排名在Nano Banana之后。

4. OpenRouter排行榜

测评类型

第一名

第二名

第三名

模型调用量

Grok Code Fast 1

Claude Sonnet 4.5

MiMo-V2-Flash (free)

公司市占率

Google

DeepSeek

Anthropic

编程模型调用量

Grok Code Fast 1

Devstral 2 2512 (free)

Gemini 3 Flash Preview

各公司按不同能力领域排名汇总

测评类型

领先公司

大语言模型 Text Arena

Google、xAI、Anthropic、OpenAI、百度、智谱、阿里巴巴、月之暗面

编程能力 LMArena

Anthropic、OpenAI、Google

编程能力 LiveCodeBench

OpenAI、Anthropic、Google

代码工程任务能力 SWE-benchLite

OpenAI、Google、阿里巴巴、月之暗面等

图像编辑和生成能力 Image Edit Arena

OpenAI、Google、字节、Reve

文生图能力 Text-to-Image Arena

OpenAI、Google、Black Forest Labs、腾讯、字节

图像编辑和生成能力 Image Editing Leaderboard

OpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve

文生图能力 Text to Image Leaderboard

OpenAI、Google、Black Forest Labs、字节、ImagineArt

GPQA 榜单

OpenAI、Google、xAI、Anthropic、阿里巴巴

FrontierMath 榜单

OpenAI、Google、月之暗面、Anthropic、xAI

Humanity's Last Exam 榜单

Google、OpenAI、Anthropic

GAIA 榜单

Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org等


关注我,第一时间掌握更多AI前沿资讯!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 本周概览
  • 2. 重点关注事件
  • 3. 榜单变化
  • 4. OpenRouter排行榜
    • 各公司按不同能力领域排名汇总
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档