首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ChatGPT重大升级,离多模态的AI Agent又近了一步

ChatGPT 刚推出两个最新的测试版功能。一个是支持包括PDF在内的多种文件,你可以上传文件,然后围绕文件进行聊天。另一个是你不用再切换不同的模式。现在你使用ChatGPT时,需要在默认模式、网络搜索、高级数据分析和DALL-E 3图像生成中选择,以后ChatGPT会自动决定需要使用什么模式和工具来完成你的任务。

第二个是真正让人兴奋的,这几乎就实现了AI Agent,一个会自动使用多个软件来完成任务的人工智能助手。

现在只有少部分用户已经用上了这两个新功能,从用户分享的使用实例来看,相当惊艳。

一位用户上传了一张水豚的真实照片,请ChatGPT生成一张皮克斯(Pixar)动画电影风格的图像,效果如下:

更惊人的是,这位用户又上传了一张滑板的照片,再请ChatGPT接着生成一张水豚手持滑板的图像,就得到了下面的成果:

目前市场上其它的text-to-image(文生图)工具,从Midjourney到Adobe, 都不能做到这样用自然语言准确地合成和编辑图像。这体现了最领先的多模态理解能力和图像生成能力的结合。

至于分析总结PDF等文件的任务,我之前会用ChatGPT的竞争者Claude或者ChatPDF和Poe等套壳应用来操作。ChatGPT具备了这个能力后,我就不太会离开它去使用其它工具了。

而且,新版本 ChatGPT的知识库截止日期也有了重大更新,之前是2021年9月,现在是2023 年 9 月。ChatGPT的过时的知识库一度也是用户选择其它AI应用的理由,但现在它的这个劣势也消除了。

ChatGPT的这一次升级,巩固了自己全能AI助手的地位。有悲观的评论者说ChatGPT这样不断扩展能力圈的话,会杀死大多数ChatGPT的第三方插件和垂直领域的应用。

但从OpenAI一直以来坚持的AI助手的定位来看,ChatGPT更可能像一个通用交互界面或者说AI Agent,帮助我们调用不同软件应用来完成任务,而不是内化所有的能力。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OmaEBLCHfjazBJDLwCgcAcIw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券