首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >英伟达×OpenAI深度植入AI内核,搜索框时代宣告终结?

英伟达×OpenAI深度植入AI内核,搜索框时代宣告终结?

原创
作者头像
算法一只狗
发布2025-07-15 22:23:24
发布2025-07-15 22:23:24
1120
举报
文章被收录于专栏:算法一只狗算法一只狗

目前AI领域已经发展到下半场,也就是通过各种AI大模型赋能给下游的不同场景。其实最容易改变或者受到影响的,就是传统的浏览器。

英伟达与 OpenAI 双双进军浏览器领域,将 AI 能力深度嵌入浏览器内核,不再依赖传统搜索框,而是通过智能代理(agents)完成信息检索、摘要与任务执行;这意味着用户不再像以前一样利用搜索框搜索信息,用户获取信息的入口和方式将发生根本性变化,从而对谷歌等搜索引擎的流量分发、广告模式和数据采集形成直接冲击。

一、英伟达支持的 Comet 浏览器亮相

Comet 是由 AI 搜索初创公司 Perplexity AI 推出的首款 AI 驱动网页浏览器,目前已经在 2025 年 7 月 9 日正式面向 Perplexity Max 订阅用户上线。

Comet具体的功能是怎么样的呢?

全场景 AI 搜索:打开任意网页,能够跟AI进行全面的对话,比如打开谷歌地图,就可以唤醒AI进行搜索

又或者对于个twitter的内容进行总结和评价。这就相当于AI无所不在,而且能够读取网页中的任何信息。

过去需要多种工具的任务,例如研究、总结、电子邮件、管理标签页、预订会议、比较产品,甚至进行购买,现在可以在一个智能流程中完成。AI助手可以汇总电子邮件和日历事件,代表您发送电子邮件,并通过对话界面自动化复杂的工作流程。

二、OpenAI “Operator” 浏览器的待发力

OpenAI 也正在开发基于 Chromium 的 AI 浏览器,内部代号 “Operator”,预计将于暑期内面向美国付费用户测试。

其实之前OpenAI就已经演示过“Operator”的一些能力。这个智能体能够像人类一样操作电脑,完成一些最基本的任务。它能够在浏览器页面中,给定一些需求然后帮助你完成相应的操作。

也就是它可以自己使用浏览器查询,查看网页并通过键入、点击和滚动与之交互。目前OpenAI发出的是预览版,仅提供给Pro用户(200美元一个月)进行使用,所以我这个普通的plus用户还没有资格体验到。

在官方演示的案例中,它能够自动填写表格内容、上网购物、创建相应的表情包、在浏览器中处理大部分重复性任务。

那么它到底是怎么工作的呢?

它内部使用了一个新模型叫computer-using agent(CUA)。CUA结合了GPT-4o的视觉能力和通过强化学习的高级推理,经过训练,可以与图形用户界面(GUI)进行交互——即人们在屏幕上看到的按钮、菜单和文本字段。

CUA其背后的流程如下所示。本质上就是通过处理原始像素数据理解屏幕状态,同时利用鼠标和键盘执行相应的命令。能够执行多步骤任务,处理错误,并适应意外变化,使其能够在多种数字环境中运行,无需专门的 API 支持即可完成诸如填写表单、浏览网页等任务。

从图上看,它的输入包含了用户的命令输入和当前扫描到的屏幕状态信息。然后利用COT思维链的方式总结出需要执行的步骤,最后操作浏览器执行相应的步骤信息。

整体的工作流程像这样:

  • 感知(Perception):CUA 通过截取屏幕截图,将当前计算机状态的视觉快照纳入模型的上下文。

这些截图为其提供环境信息,使其能够实时了解任务进展。

  • 推理(Reasoning):利用链式思维(chain-of-thought),结合当前与过往的截图和操作步骤进行推理。这种“内部独白”帮助模型评估观察结果、追踪中间步骤,并动态调整操作策略,提高任务完成的准确性和灵活性。
  • 操作(Action):行点击、滚动、输入等操作,直到判断任务完成或需要用户进一步指令。对于敏感操作(如输入登录信息或处理 CAPTCHA),CUA 会寻求用户确认,确保安全性和隐私保护。

我们知道,传统的要执行这样步骤的操作,往往需要调用相关的API进行相应的命令。但是Operator通过结合 GPT-4o 的视觉能力和强化学习驱动的高级推理功能,为用户执行网页任务。其核心模型 CUA能够像人类一样与图形用户界面(GUI)交互,而无需依赖特定的操作系统或网页 API,从而实现灵活的数字任务处理。

三、AI正在重塑对搜索引擎生态

截止至25年7月来看,目前AI搜索还没有大规模得取代传统得搜索引擎。

但是AI助手如 ChatGPT、DeepSeek 等确实正在 改变人们的信息获取方式

根据一份覆盖 2023 年 4 月至 2025 年 3 月的研究数据,AI聊天助手的流量确实快速增长(同比 +80.9%,达到 552 亿次访问)。这进一步说明AI已经慢慢的渗透到日常生活中的方方面面

随着 Comet、The Browser Company 和 Brave 等 AI 浏览器加入战场,传统浏览器必须加速内置 AI 能力(如 Google 的 Bard、微软的 Copilot)才能保持竞争优势

四、结论

不可否认,AI 大模型和聊天助手正在快速改变我们的工作方式和知识获取习惯。从最初的“搜索 + 阅读 + 总结”,到如今可以直接对话式获取整合答案、代码框架和应用方案,对于算法工程师、程序员、内容创作者,AI 已成为不可或缺的辅助工具。

英伟达与 OpenAI 强势切入浏览器市场,将 AI 能力前置至信息入口层,极可能改变用户的搜索与浏览习惯,重塑广告生态和数据控制格局。

对于我们每一个人而言,这场 AI 革命带来的不仅仅是工作效率的提升,更是一个需要不断学习、不断验证、不断利用工具强化自身的时代。

未来 AI浏览器是否能够取代传统的浏览器,尚且无法定论,但可以确定的是——善用 AI 的人,正在取代不会用 AI 的人。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、英伟达支持的 Comet 浏览器亮相
  • 二、OpenAI “Operator” 浏览器的待发力
  • 三、AI正在重塑对搜索引擎生态
  • 四、结论
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档