
昨天Gemini3发布,今天OpenAI就来精准狙击了。放出了两个跑分,我们可以对比一下。SWE跑分,openai得分79.9,gemini3得分76.2。

Terminal bench上,OpenAI得分58.1,Gemini3得分54.2!

除了跑分,本次codex发布还额外对wondows powershell支持!之前有小伙伴在windows上吐槽用不了,现在支持了!

此外,新模型效率更高了,在swe上完成同等任务,新模型可节省30%token。

同时,此次还上线了压缩功能,会话在遇到上下文窗口时候,即可启动压缩,从而能够让agent模式一直运行几个小时!