首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Qwen3.5 要来了,字节、DeepSeek 春节或将发布旗舰大模型

Qwen3.5 要来了,字节、DeepSeek 春节或将发布旗舰大模型

作者头像
Ai学习的老章
发布2026-03-02 20:43:15
发布2026-03-02 20:43:15
80
举报

Qwen3.5、MiniMax2.2、字节跳动 Seed、DeepSeek-V4 都要来了吗?

最近,LMSYS Chatbot Arena(目前的“大模型盲测”权威榜单)上又热闹起来了。

除了大家熟知的名字,榜单上突然窜出了几个神秘的匿名模型,它们虽然披着代号的“马甲”,但在对话中却诚实地“自报家门”。

Qwen 3.5 现身:代号 "Karp"

在 Arena 上,代号为 Karp-001Karp-002 的模型,在被问及身份时,明确回答自己是 Qwen 3.5(阿里通义千问的下一代大版本)。

与之呼应的是,GitHub 上的 transformers 库中也悄然出现了 Qwen 3.5 的配置文件:

  • Qwen3.5-9B-Instruct
  • Qwen3.5-35B-A3B-Instruct

其中,35B 版本的 "A3B" 后缀引人遐想,这很可能暗示了 Active 3B(激活参数为 3B)的 MoE(混合专家)架构。如果属实,这将是阿里在轻量级 MoE 模型上的又一次重要尝试,兼顾了高性能与推理效率。

字节新动作:代号 "Pisces"

不仅仅是阿里,字节跳动似乎也有新动作。

竞技场上出现了 Pisces-llm-0206aPisces-llm-0206b,它们自称是字节跳动的 "Seed" 模型。这可能是 Seed 系列的全新迭代或测试版本,日期后缀 0206 暗示了这是非常新鲜的 checkpoint。

  • Karp-001:I'm Qwen3.5, developed by Tongyi Lab.
  • Pisces 系列:I'm Seed, a large language model developed by ByteDance.

Pisces 模型用不到 100 行代码就画出了一个很漂亮的 Xbox 手柄 SVG,而 Karp 用了 600+ 行还画得一般

暗示 Pisces 在代码/创意生成上明显更强

春节将至,大模型圈的“春招”似乎比人才市场还要火热。

阿里和字节不约而同地在竞技场上测试新模型,预示着新一轮的“千模大战”又要开始了。

字节系

  • Seed 2.0
  • Seed 2.0 Flash
  • Seed Code 2

阿里 Qwen 系

  • Qwen3.5 models

DeepSeek 系

  • DeepSeek-V4
  • DeepSeek-V4-Lite

大模型春节也要来了!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-02-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Qwen 3.5 现身:代号 "Karp"
  • 字节新动作:代号 "Pisces"
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档