首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI推出AI智能体Operator,能否真正实现人般网页浏览?

近期,OpenAI在人工智能领域迈出了重要一步,推出了名为Operator的AI智能体,这款创新产品能够模拟人类操作网页浏览器的行为,为用户带来前所未有的便捷体验。

Operator的智能表现令人印象深刻。在OpenAI的演示中,它能够精准地接收并执行各种指令,自主地完成打字、点击、滚动等一系列复杂的网页交互任务。不仅如此,Operator还能轻松应对在线表单填写、网络购物、表情包制作等日常操作,甚至能够处理繁琐的重复性浏览器任务,极大地提升了工作效率。

Operator的推出受到了广泛关注。据OpenAI透露,从1月23日开始,美国的ChatGPT Pro用户已经能够体验到Operator的“预览版”。未来,这款智能体将逐步拓展至更多区域的Pro用户,并在几个月后向ChatGPT Plus用户开放。

Operator的强大功能得益于其背后的技术支持。据OpenAI官网介绍,Operator由全新的CUA(Computer-Using Agent)模型驱动,这一模型结合了GPT-4o的视觉能力,并通过强化学习实现了高级推理功能。这使得Operator能够“看见”网页内容,并像人类一样使用鼠标和键盘与网页进行互动。在遇到难以解决的问题时,Operator会调用其强大的推理能力进行自我纠正,如果仍然无法解决,则会将控制权交还给用户,确保操作的准确性和安全性。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O3bBfvoGDhOW7S7928qXCSFw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券