首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏白话互联

    【claude code】claude code News | 9月26日速递

    ❤ 阿里巴巴推出Qwen-3 Max模型,瞄准代码和推理任务 中国科技巨头发布万亿参数AI模型 阿里巴巴发布了Qwen系列大型语言模型的最新版本Qwen-3 Max,这是该公司迄今为止最先进的版本,旨在增强推理 Qwen-3 Max是该系列中首个达到*超过一万亿参数*的模型,在36万亿个令牌上进行了训练,其上下文长度达到一百万个令牌。该模型在推理和编码方面与GPT-5、Gemini和Claude相匹配。 阿里巴巴表示,Qwen-3 Max代表了公司在AI领域的重大进步,特别针对代码生成和复杂推理任务进行了优化,有望在开发者和企业市场中获得广泛应用。

    19910编辑于 2025-11-19
  • 来自专栏机器学习与统计学

    大模型写高考作文,状元是DeepSeek,榜眼是Qwen3,探花是Gemini

    Claude-3.7-sonnet 的作文得分差异较大,从 Qwen-3 给的45分到其他模型的52-54分。 Qwen-3 和 豆包 在评分时似乎有更严格的标准,或者说更容易发现并扣分于他们认为的不足之处。 Qwen-3-235B-A22B: 自评分: 54 他人平均分: 56.5 结论: Qwen-3 的自评分 (54) 低于他人平均分 (56.5) 约2.5分。 这可能表明 Qwen-3 对自己的评价相对保守,或者其他模型对其作文更为认可。 豆包: 自评分: 57 他人平均分: 56.0 结论: 豆包的自评分 (57) 略高于他人平均分 (56.0) 1分。

    34810编辑于 2025-06-08
  • 来自专栏杂谈

    「生成式AI前沿观察」:办公革命、医疗突破与技术伦理的十字路口

    更值得关注的是,LongCat-Flash-Exp解锁了1M上下文窗口,能轻松处理百万字长文档,性能超越同类模型Qwen-3,为律师、研究员等需要处理长文本的人群提供了高效工具。

    16710编辑于 2026-01-22
  • 每周AI论文速递(250908-250912)

    通过对Llama-3.1 8B和Qwen-3 8B进行微调,我们证明SBD能够将生成所需的前向传播次数减少至1/3到1/5,同时达到与等效NTP训练方法相同的性能表现。

    23910编辑于 2025-11-20
领券