Claude突然更新。Sonnet 4.6正式登场,直接取代了上一代的主力位置。
这一次,Anthropic把100万token上下文窗口下放到了Beta版。
价格没变,依旧是每百万token 3美元/15美元。
但在代码能力上,它不仅大幅超越前代,甚至有59%的早期用户认为,它比2025年11月发布的旗舰模型Opus 4.5还要好用。
这就是通常需要Opus级模型才能处理的重活,现在Sonnet 4.6就能干,而且更便宜。
核心升级点非常集中:代码、计算机操作(Computer Use)、长上下文推理以及Agent规划。
开发者反馈最直接:不偷懒,不瞎编,逻辑复用能力大幅提升。
在Claude Code环境测试中,70%的用户相比Sonnet 4.5更倾向于使用新模型。
前端代码和财务分析表现尤其突出,生成的视觉效果布局更合理,甚至自带设计感和动效。
计算机操作能力(Computer Use)是这次的重头戏。
不依赖专用API,模型像人一样看屏幕、动鼠标、敲键盘。
在OSWorld基准测试中,Sonnet 4.6不仅刷分,还在复杂电子表格导航和多步网页表单填报上,展现出了人类水平。
虽然距离顶尖人类专家还有差距,但相比早期版本那种笨重感,进化速度肉眼可见。
安全性方面,针对Prompt Injection(提示词注入)攻击的防御力大幅提升,表现与Opus 4.6持平。
长窗口不再只是能装,更在于能想。
在Vending-Bench Arena商业模拟测试中,它学会了放长线钓大鱼。
前10个月疯狂烧钱扩产能,最后阶段极速转向盈利模式,最终利润碾压对手。
这种跨度极大的时间规划能力,得益于新的上下文压缩技术。
当对话接近上限时,模型会自动把旧信息打包摘要,给新思考腾出空间。
开发者平台同步解锁了自适应思考和扩展思考。
API端的搜索工具现在学会了自己写代码清洗数据,只把有用的信息喂给模型,既省Token又提效。
Excel插件也打通了MCP协议。
S&P Global、FactSet这些专业金融数据,不出表格就能直接调取,Pro和Enterprise用户即刻可用。
目前,Claude.ai、API以及各大云平台已全线实装。
免费版用户这次也被强制升级为Sonnet 4.6,并解锁了文件创建和连接器功能。
想尝鲜的开发者,API代码claude-sonnet-4-6已经可以跑起来了。
--end--
最后记得⭐️我,每天都在更新:如果觉得文章还不错的话可以点赞转发推荐评论