DeepSeek在市占率方面表现突出,份额增加显著。同时,通义实验室开源了GUI智能体MAI-UI,涵盖从端侧小模型到云端大模型的多个尺寸版本。此外,DeepSeek提出了名为「mHC(流形约束超连接)」的新架构,能够在增加极少训练时间开销的情况下实现显著性能提升。
测评类型 | 第一名 | 第二名 | 第三名 |
|---|---|---|---|
模型调用量 | Grok Code Fast 1 | Claude Sonnet 4.5 | MiMo-V2-Flash (free) |
公司市占率 | DeepSeek | Anthropic | |
编程模型调用量 | Grok Code Fast 1 | Devstral 2 2512 (free) | Gemini 3 Flash Preview |
测评类型 | 领先公司 |
|---|---|
大语言模型 Text Arena | Google、xAI、Anthropic、OpenAI、百度、智谱、阿里巴巴、月之暗面 |
编程能力 LMArena | Anthropic、OpenAI、Google |
编程能力 LiveCodeBench | OpenAI、Anthropic、Google |
代码工程任务能力 SWE-benchLite | OpenAI、Google、阿里巴巴、月之暗面等 |
图像编辑和生成能力 Image Edit Arena | OpenAI、Google、字节、Reve |
文生图能力 Text-to-Image Arena | OpenAI、Google、Black Forest Labs、腾讯、字节 |
图像编辑和生成能力 Image Editing Leaderboard | OpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve |
文生图能力 Text to Image Leaderboard | OpenAI、Google、Black Forest Labs、字节、ImagineArt |
GPQA 榜单 | OpenAI、Google、xAI、Anthropic、阿里巴巴 |
FrontierMath 榜单 | OpenAI、Google、月之暗面、Anthropic、xAI |
Humanity's Last Exam 榜单 | Google、OpenAI、Anthropic |
GAIA 榜单 | Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org等 |
关注我,第一时间掌握更多AI前沿资讯!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。