目前AI领域已经发展到下半场,也就是通过各种AI大模型赋能给下游的不同场景。其实最容易改变或者受到影响的,就是传统的浏览器。
英伟达与 OpenAI 双双进军浏览器领域,将 AI 能力深度嵌入浏览器内核,不再依赖传统搜索框,而是通过智能代理(agents)完成信息检索、摘要与任务执行;这意味着用户不再像以前一样利用搜索框搜索信息,用户获取信息的入口和方式将发生根本性变化,从而对谷歌等搜索引擎的流量分发、广告模式和数据采集形成直接冲击。
Comet 是由 AI 搜索初创公司 Perplexity AI 推出的首款 AI 驱动网页浏览器,目前已经在 2025 年 7 月 9 日正式面向 Perplexity Max 订阅用户上线。
Comet具体的功能是怎么样的呢?
全场景 AI 搜索:打开任意网页,能够跟AI进行全面的对话,比如打开谷歌地图,就可以唤醒AI进行搜索
又或者对于个twitter的内容进行总结和评价。这就相当于AI无所不在,而且能够读取网页中的任何信息。
过去需要多种工具的任务,例如研究、总结、电子邮件、管理标签页、预订会议、比较产品,甚至进行购买,现在可以在一个智能流程中完成。AI助手可以汇总电子邮件和日历事件,代表您发送电子邮件,并通过对话界面自动化复杂的工作流程。
OpenAI 也正在开发基于 Chromium 的 AI 浏览器,内部代号 “Operator”,预计将于暑期内面向美国付费用户测试。
其实之前OpenAI就已经演示过“Operator”的一些能力。这个智能体能够像人类一样操作电脑,完成一些最基本的任务。它能够在浏览器页面中,给定一些需求然后帮助你完成相应的操作。
也就是它可以自己使用浏览器查询,查看网页并通过键入、点击和滚动与之交互。目前OpenAI发出的是预览版,仅提供给Pro用户(200美元一个月)进行使用,所以我这个普通的plus用户还没有资格体验到。
在官方演示的案例中,它能够自动填写表格内容、上网购物、创建相应的表情包、在浏览器中处理大部分重复性任务。
那么它到底是怎么工作的呢?
它内部使用了一个新模型叫computer-using agent(CUA)。CUA结合了GPT-4o的视觉能力和通过强化学习的高级推理,经过训练,可以与图形用户界面(GUI)进行交互——即人们在屏幕上看到的按钮、菜单和文本字段。
CUA其背后的流程如下所示。本质上就是通过处理原始像素数据理解屏幕状态,同时利用鼠标和键盘执行相应的命令。能够执行多步骤任务,处理错误,并适应意外变化,使其能够在多种数字环境中运行,无需专门的 API 支持即可完成诸如填写表单、浏览网页等任务。
从图上看,它的输入包含了用户的命令输入和当前扫描到的屏幕状态信息。然后利用COT思维链的方式总结出需要执行的步骤,最后操作浏览器执行相应的步骤信息。
整体的工作流程像这样:
这些截图为其提供环境信息,使其能够实时了解任务进展。
我们知道,传统的要执行这样步骤的操作,往往需要调用相关的API进行相应的命令。但是Operator通过结合 GPT-4o 的视觉能力和强化学习驱动的高级推理功能,为用户执行网页任务。其核心模型 CUA能够像人类一样与图形用户界面(GUI)交互,而无需依赖特定的操作系统或网页 API,从而实现灵活的数字任务处理。
截止至25年7月来看,目前AI搜索还没有大规模得取代传统得搜索引擎。
但是AI助手如 ChatGPT、DeepSeek 等确实正在 改变人们的信息获取方式
根据一份覆盖 2023 年 4 月至 2025 年 3 月的研究数据,AI聊天助手的流量确实快速增长(同比 +80.9%,达到 552 亿次访问)。这进一步说明AI已经慢慢的渗透到日常生活中的方方面面
随着 Comet、The Browser Company 和 Brave 等 AI 浏览器加入战场,传统浏览器必须加速内置 AI 能力(如 Google 的 Bard、微软的 Copilot)才能保持竞争优势
不可否认,AI 大模型和聊天助手正在快速改变我们的工作方式和知识获取习惯。从最初的“搜索 + 阅读 + 总结”,到如今可以直接对话式获取整合答案、代码框架和应用方案,对于算法工程师、程序员、内容创作者,AI 已成为不可或缺的辅助工具。
英伟达与 OpenAI 强势切入浏览器市场,将 AI 能力前置至信息入口层,极可能改变用户的搜索与浏览习惯,重塑广告生态和数据控制格局。
对于我们每一个人而言,这场 AI 革命带来的不仅仅是工作效率的提升,更是一个需要不断学习、不断验证、不断利用工具强化自身的时代。
未来 AI浏览器是否能够取代传统的浏览器,尚且无法定论,但可以确定的是——善用 AI 的人,正在取代不会用 AI 的人。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。