今天OpenAI正式推出Operator,一款能够通过自身浏览器为你自动化执行任务的智能助手,让这一切成为可能。
如何使用Operator?
使用Operator非常简单。只需向它描述你希望完成的任务,它就能自动完成。比如,你可以让它帮你填表、订餐、购买杂货等。如果遇到需要输入敏感信息(如密码、支付信息等)的操作,Operator会主动请求你接管,确保信息安全。而且,它还支持保存常用任务的快捷指令,像补充杂货、定制商品等重复性任务都能轻松应对。
遗憾的是,目前只有美国Pro用户可用。
背后的技术:CUA(Computer-Using Agent)
Operator的核心技术是CUA(Computer-Using Agent)模型。CUA结合了GPT-4的视觉能力与强化学习推理,能够通过截图“看”网页,并使用鼠标和键盘进行交互。这使得Operator无需依赖复杂的API集成,就能直接在浏览器中操作,极大地拓展了AI的应用场景。他们计划很快将CUA开放到API中,供开发者创作自己的智能体。
OpenAI正在构建生态
OpenAI还与类似Uber这样的打车软件进行合作,或许这是最简单的,因为没有太多选择。不像购物其实有很多选择与偏好。
当前合作伙伴有:DoorDash, Instacart, OpenTable,Priceline, StubHub, Thumbtack, Uber等。