前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Deep Research 这个神器,查股价、定旅游、搜冷门电影全搞定!

Deep Research 这个神器,查股价、定旅游、搜冷门电影全搞定!

原创
作者头像
算法一只狗
发布于 2025-05-11 14:41:24
发布于 2025-05-11 14:41:24
970
举报
文章被收录于专栏:算法一只狗算法一只狗

OpenAI正式向免费用户推出轻量版 Deep Research 功能。该功能由 o4-mini 模型提供支持,虽然性能略逊于完整版,但成本更低,用户可享受更高的使用额度。

本次发布的 Deep Research 具有以下突出优势:

  • 模型架构:基于 o4-mini 模型,具备多模态推理能力。
  • 成本效率:单次查询成本仅为标准版的五分之一,支持实时动态资源调度,有效减轻服务器负载。
  • 响应速度:通过混合精度计算和缓存机制,处理复杂任务的响应时间缩短约 40%。
  • 功能兼容性:保留标准版约 90% 的核心功能,针对免费用户需求适度简化部分高级功能。

免费用户打开网页即可体验这一新功能。

超越文本的性能表现

Deep Research 的实际表现究竟如何?以下两项权威测试能充分说明问题:在 Humanity’s Last Exam 和 GAIA 两项考试中,其表现显著超过了其他竞品和上一代 AI 模型。

需要强调的是,尽管 Deep Research 已经非常强大,但距离真正的通用人工智能(AGI)仍有较大差距。它更适合作为辅助工具,而非取代人类研究者,这也体现了人工智能的发展之路仍然漫长。

Deep Research 实际测试案例

股价分析

示例任务:分析特斯拉近期的股价情况。

首先,Deep Research 会询问具体的查询需求,例如特斯拉最近一个月的股价走势。

右侧活动栏显示 ChatGPT 正在实时读取互联网中关于特斯拉股价的相关信息。

在检索过程中,Deep Research 持续调用 Python 工具进行分析,同时具备一定的纠错能力,展示了初步的 Agent 特性。

最终,它利用 Python 工具绘制出特斯拉近一个月的股价走势图,并进一步分析影响因素、未来走势,提供投资建议。

冷门电影检索

通过给定的一幕简单线索,Deep Research 成功检索出冷门电影《布宜诺斯艾利斯 100 公里(Buenos Aires 100 km)》。测试中选取的镜头并非电影关键情节,且描述极为简短,Deep Research 依然通过多源网页搜索成功确认电影名称,体现了卓越的小众内容检索能力。

旅游方案设计

五一假期即将到来,Deep Research 可快速帮助用户制定旅行计划。举例而言,它会迅速分解用户需求,明确出发地、目的地、旅行时长、预算及兴趣偏好:

  • 出发地:广州
  • 目的地:广西
  • 时间:3天
  • 偏好:自然风光
  • 预算:3000元

Deep Research 调用外部旅游数据源(如马蜂窝、大众点评、携程、穷游),结合当下热门指数,为用户规划出适合的自由行路线。

总结

经过整体体验,虽然轻量版 Deep Research 使用的是 o4-mini 模型,在规模上不及旗舰版本,但在综合检索、多源数据整合、小众领域检索和辅助分析总结等关键能力方面表现卓越,已经接近完整版 Deep Research 水准。

对免费用户而言,此次升级极具诚意,无论是日常信息查询、科研辅助,还是旅游规划和金融分析,都将带来前所未有的便捷体验。

当然,目前它仍然定位于任务型 AI,对于深度推理及复杂创新任务,还需人类研究人员把关。期待未来 Deep Research 能进一步进化,成为真正意义上的通用智能助手!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档