
Qwen3.5、MiniMax2.2、字节跳动 Seed、DeepSeek-V4 都要来了吗?
最近,LMSYS Chatbot Arena(目前的“大模型盲测”权威榜单)上又热闹起来了。
除了大家熟知的名字,榜单上突然窜出了几个神秘的匿名模型,它们虽然披着代号的“马甲”,但在对话中却诚实地“自报家门”。

在 Arena 上,代号为 Karp-001 和 Karp-002 的模型,在被问及身份时,明确回答自己是 Qwen 3.5(阿里通义千问的下一代大版本)。
与之呼应的是,GitHub 上的 transformers 库中也悄然出现了 Qwen 3.5 的配置文件:
Qwen3.5-9B-InstructQwen3.5-35B-A3B-Instruct
其中,35B 版本的 "A3B" 后缀引人遐想,这很可能暗示了 Active 3B(激活参数为 3B)的 MoE(混合专家)架构。如果属实,这将是阿里在轻量级 MoE 模型上的又一次重要尝试,兼顾了高性能与推理效率。
不仅仅是阿里,字节跳动似乎也有新动作。
竞技场上出现了 Pisces-llm-0206a 和 Pisces-llm-0206b,它们自称是字节跳动的 "Seed" 模型。这可能是 Seed 系列的全新迭代或测试版本,日期后缀 0206 暗示了这是非常新鲜的 checkpoint。
Pisces 模型用不到 100 行代码就画出了一个很漂亮的 Xbox 手柄 SVG,而 Karp 用了 600+ 行还画得一般
暗示 Pisces 在代码/创意生成上明显更强

春节将至,大模型圈的“春招”似乎比人才市场还要火热。
阿里和字节不约而同地在竞技场上测试新模型,预示着新一轮的“千模大战”又要开始了。
字节系
阿里 Qwen 系
DeepSeek 系
大模型春节也要来了!