ChatGPT 刚推出两个最新的测试版功能。一个是支持包括PDF在内的多种文件,你可以上传文件,然后围绕文件进行聊天。另一个是你不用再切换不同的模式。现在你使用ChatGPT时,需要在默认模式、网络搜索、高级数据分析和DALL-E 3图像生成中选择,以后ChatGPT会自动决定需要使用什么模式和工具来完成你的任务。
第二个是真正让人兴奋的,这几乎就实现了AI Agent,一个会自动使用多个软件来完成任务的人工智能助手。
现在只有少部分用户已经用上了这两个新功能,从用户分享的使用实例来看,相当惊艳。
一位用户上传了一张水豚的真实照片,请ChatGPT生成一张皮克斯(Pixar)动画电影风格的图像,效果如下:
更惊人的是,这位用户又上传了一张滑板的照片,再请ChatGPT接着生成一张水豚手持滑板的图像,就得到了下面的成果:
目前市场上其它的text-to-image(文生图)工具,从Midjourney到Adobe, 都不能做到这样用自然语言准确地合成和编辑图像。这体现了最领先的多模态理解能力和图像生成能力的结合。
至于分析总结PDF等文件的任务,我之前会用ChatGPT的竞争者Claude或者ChatPDF和Poe等套壳应用来操作。ChatGPT具备了这个能力后,我就不太会离开它去使用其它工具了。
而且,新版本 ChatGPT的知识库截止日期也有了重大更新,之前是2021年9月,现在是2023 年 9 月。ChatGPT的过时的知识库一度也是用户选择其它AI应用的理由,但现在它的这个劣势也消除了。
ChatGPT的这一次升级,巩固了自己全能AI助手的地位。有悲观的评论者说ChatGPT这样不断扩展能力圈的话,会杀死大多数ChatGPT的第三方插件和垂直领域的应用。
但从OpenAI一直以来坚持的AI助手的定位来看,ChatGPT更可能像一个通用交互界面或者说AI Agent,帮助我们调用不同软件应用来完成任务,而不是内化所有的能力。
领取专属 10元无门槛券
私享最新 技术干货