首页
学习
活动
专区
圈层
工具
发布

用opus4.8肝5天后,聊聊我的真实体验

用opus4.8写了5天代码了,用下来最大的感觉是:这次基模能力的提升体感并不明显,反而新出的动态工作流对我帮助很大,今天来和大家分享一下我的使用体验。1.模型能力提升有限,后端、服务器场景不如gpt5.5表现丝滑。我自己在写项目的时候会把任务拆成多路,然后把不同的任务分别交给opus4.8和gpt5.5来跑,整体用下来我的感觉是这样的:前端设计依旧是opus4.8最强,各种好看的样式设计一点就透;但是在后端逻辑开发、服务器运维部署上,我觉得gpt5.5更丝滑。一个项目本地开发、测试完后,opus4.8在部署的时候总是会有幺蛾子,有的时候会中断,有时会给我指令让我来部署,就这还比opus4.7强了一些,但gpt5.5基本上都是一次搞定,不需要人类的任何中途参与。我还点测了抽取数据库做测算、本地数据包部署服务器等任务,感觉opus4.8都不如gpt5.5丝滑。也不是说opus4.8不能用,就是任务最后肯定都能完成,只是过程没那么快、那么舒服,托管程度会弱一点。我现在的策略是:重后端、部署运维的事情优先交给gpt5.5来搞;前端和交互还是opus4.8来搞定。2.动态工作流是这次更新我觉得最惊喜的功能。这个功能我觉得超级赞,最近我一直在用它review我写的各种代码,来修复各种离谱的bug和逻辑问题。之前Claude的subagent作业逻辑,是主agent可以唤起多个subagent来做任务,因此我会把subagent用到prd文档审核、代码测试上,来提升文档和代码质量。但单个subagent终究能够处理的场景复杂度是有限的。比如我最近做的项目架构优化,光prd就写了15个版本了,很难用一个subagent来进行整体的prd和代码review,多个subagent又没法串起来一起干。动态工作流很好的解决了这个问题。这时候只需要开一个动态工作流,它会自己拆分成多个环节,每个环节派出多个subagent作业,一个环节结束了下一个环节承接,最后输出一个高质量的结果。但动态工作流真的巨消耗tokens,我刚开始还以为它的上百个Agent是个纯宣传语,直到有一次review代码它用了60多个subagent,我发现真的可以调用这么多,但我的claude的5h限制直接被打满了。还是推荐大家多用用这个功能,对于项目的review帮助真的很大了,用在调研需求对比上也很不错,但写代码、讨论需求这些简单场景就别用它了,效果反而不如普通对话好。opus4.8用下来的体验还是比较一般吧,看看这个月opus5和gpt6能不能发出来,还是比较期待基模再次往前走一大步~

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OOp14mjmGs9crJ4yY-Z3GojA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券