
OpenAI最近在周四宣布,想免费用户也开始推送轻量版的Deep Research。这个功能由o4-mini 模型版本提供支持。虽然其能力不及“完整版”深度研究工具,但 OpenAI 称其运行成本更低,因此可以提高用户的使用上限。

这次的Deep Research功能有如下几个优点:

免费用户现在打开网页就可以看到这个功能了:

Deep Research到底有多牛?看看这俩测试就明白了:在Humanity’s Last Exam和GAIA这两个权威大考里,它的成绩直接碾压了其他竞品和老一代AI模型。


不过要强调的是,Deep Research虽然很厉害,但它离真正的通用人工智能(AGI)还差得远呢。它只是一个辅助工具,不能代替人类研究员。 这也说明,AI还有很长的路要走。
分析一下最近特斯拉的股价情况

首先它会需要你回到要查询“特斯拉”哪些方面的情况。比如想了解最近一个月特斯拉的股价情况等等。
可以从右边栏看到chatgpt的活动,它在不断的读取外网对于“特斯拉”股价的信息。

在查询的过程中也在不断调用python工具进行分析,同时也具有一定的纠正功能。看起来确实初步的Agent能力已经到达了。

最后来看看它生成的效果:它用python先画了具体的图片,表示了一下近一个月特斯拉的股价信息。

然后也从具体的影响,未来走势等等进行了相应的总结,最后给出了投资建议:

下面是给出的prompt,需要它帮我们找到回忆中的电影。

根据一幕线索顺藤摸瓜出一部冷门电影,OpenAI 成功检索出电影名《布宜诺斯艾利斯 100 公里 (Buenos Aires 100 km)》
本文选取测评镜头并非电影关键情节,并且描述极尽简单,OpenAI 能够在极其有限信息的情况下,展开多源网页搜索,验证了其主打的“小众内容检索能力”确实一骑绝尘。

五一假期快要到了,可以直接用Deep Research帮我们制定一个旅游计划:
可以看到,Deep Research 首先会快速拆分你的需求,明确了出发地、目的地、时间长度、预算范围和偏好类型:

接着,它调用了外部旅游资源(包括马蜂窝、大众点评、携程、穷游等开放数据源),并结合时下热门指数,规划出了一条适合的轻量自由行路线:

这种普通的论坛代码设计基本上对于它来说没有难度:

最后生成的网站效果还是不错的:

整体体验下来,轻量版 Deep Research虽然基于 o4-mini,在模型规模上不及旗舰版,但在实际应用中,特别是:
这些核心环节上,表现已经非常接近完整版 Deep Research 的水准了。
对于免费用户来说,这次升级可以说是非常良心的。无论是日常的信息查询、科研辅助、还是规划旅行、金融分析,都能带来前所未有的便捷体验。
当然也要注意,目前它仍然局限于“任务型AI”,对于深度推理、复杂创新类任务,还需要人类研究员进行最后把关。期待未来 Deep Research 正式进化成一款真正意义上的通用智能助手!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。