搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏白话互联
【claude code】claude code News | 9月26日速递
❤ 阿里巴巴推出Qwen-3 Max模型，瞄准代码和推理任务中国科技巨头发布万亿参数AI模型阿里巴巴发布了Qwen系列大型语言模型的最新版本Qwen-3 Max，这是该公司迄今为止最先进的版本，旨在增强推理 Qwen-3 Max是该系列中首个达到*超过一万亿参数*的模型，在36万亿个令牌上进行了训练，其上下文长度达到一百万个令牌。该模型在推理和编码方面与GPT-5、Gemini和Claude相匹配。阿里巴巴表示，Qwen-3 Max代表了公司在AI领域的重大进步，特别针对代码生成和复杂推理任务进行了优化，有望在开发者和企业市场中获得广泛应用。
19910编辑于 2025-11-19
来自专栏机器学习与统计学
大模型写高考作文，状元是DeepSeek，榜眼是Qwen3，探花是Gemini
Claude-3.7-sonnet 的作文得分差异较大，从 Qwen-3 给的45分到其他模型的52-54分。 Qwen-3 和豆包在评分时似乎有更严格的标准，或者说更容易发现并扣分于他们认为的不足之处。 Qwen-3-235B-A22B: 自评分: 54 他人平均分: 56.5 结论: Qwen-3 的自评分 (54) 低于他人平均分 (56.5) 约2.5分。这可能表明 Qwen-3 对自己的评价相对保守，或者其他模型对其作文更为认可。豆包: 自评分: 57 他人平均分: 56.0 结论: 豆包的自评分 (57) 略高于他人平均分 (56.0) 1分。
34810编辑于 2025-06-08
来自专栏杂谈
「生成式AI前沿观察」：办公革命、医疗突破与技术伦理的十字路口
更值得关注的是，LongCat-Flash-Exp解锁了1M上下文窗口，能轻松处理百万字长文档，性能超越同类模型Qwen-3，为律师、研究员等需要处理长文本的人群提供了高效工具。
16710编辑于 2026-01-22
每周AI论文速递（250908-250912）
通过对Llama-3.1 8B和Qwen-3 8B进行微调，我们证明SBD能够将生成所需的前向传播次数减少至1/3到1/5，同时达到与等效NTP训练方法相同的性能表现。
23910编辑于 2025-11-20

【claude code】claude code News | 9月26日速递

大模型写高考作文，状元是DeepSeek，榜眼是Qwen3，探花是Gemini

「生成式AI前沿观察」：办公革命、医疗突破与技术伦理的十字路口

每周AI论文速递（250908-250912）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐