Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Agentic AI是新的Web应用程序,您的AI策略必须发展

Agentic AI是新的Web应用程序,您的AI策略必须发展

作者头像
云云众生s
发布于 2025-03-06 01:22:03
发布于 2025-03-06 01:22:03
1160
举报
文章被收录于专栏:云云众生s云云众生s

AI 的未来在于自主代理 — 由可扩展的、无服务器架构提供支持。

译自:Agentic AI is the New Web App, and Your AI Strategy Must Evolve 作者:Kevin Cochrane

在生成式 AI 革命两年后,为 ChatGPT 和 Claude 等工具提供支持的 LLM 变得异常强大。然而,根据 Salesforce 首席执行官 Marc Benioff 的说法,它们可能正在达到极限。根据 Benioff 的说法,下一个进化不一定是更智能的 LLM,而是利用 LLM 独立执行任务的自主 AI 代理。

Benioff 对 Agentic AI 非常重视,去年推出了 Agentforce,旨在为 Salesforce 客户带来数百万个 AI 代理。他并不孤单:想想前 Forrester 分析师、现任风险投资家的 Jeremiah Owyang 预测,很快就会有比人类更多的 AI 代理,每人甚至可能拥有100 个 AI 代理。即使这些预测只有一小部分成为现实,也会对电子商务的未来产生深远的影响。

想象一下这样一个世界:AI 代理接管客户与供应商互动的双方。面向客户的资产(如网站和 Web 应用程序)可以被广泛地替换为 — 或至少与 — 针对客户个性化的 AI 代理集成。然后,这些代理可以与客户的 AI 代理交互,通过代理之间的交易自动完成销售周期。

Salesforce 并不是唯一拥抱 Agentic AI 的公司。根据 CapGemini 对大型企业 1,100 名高管的调查,10% 的组织已经在使用 AI 代理,超过一半的组织计划在明年使用它们,82% 的组织计划在未来三年内将它们集成。64% 的高管预计 Agentic AI 将改善客户服务和满意度。Gartner 预测,到 2028 年,33% 的企业软件应用程序将包含 Agentic AI。

鉴于这些预测,客户期望 AI 代理向他们提供做出购买决定所需的信息,而不是自己搜索信息,这只是时间问题。

企业正在开发部署 Agentic AI 所需的架构,以期保持领先地位并将其集成到其 Web 应用程序中。具体来说,为了促进全球数千次客户互动,企业将需要在边缘部署低延迟 AI 推理的能力。

建支持边缘 Agentic AI 推理的架构

开发支持边缘低延迟推理的架构是大规模 Agentic AI 运营的关键前提,尤其是在电子商务中,AI 代理必须与全球客户实时交互。这种向边缘的转变已经在进行中:S&P Global Market Intelligence(由 Vultr 委托)最近的一项研究发现,在接受调查的 1,000 名 AI 和 IT 专业人士中,超过 80% 的人预计未来一年将增加其 AI 边缘运营。

然而,大多数企业没有支持大规模边缘 AI 推理的基础设施,而且他们永远也不会有。GPU 和其他专用 AI 芯片非常昂贵且很快就会过时,因此内部投资这些资源是不切实际的。

从边缘环境提供的 AI 推理需要不同的技术堆栈,以使大规模 AI 具有成本效益。对于大多数企业来说,用于 AI 推理的无服务器方法在成本和性能方面都是最佳的。

无服务器推理:成本和性能的最佳选择

为了避免采购很快就会过时的专用 AI 芯片的资本支出,无服务器方法利用云提供商管理的资源,使每个 AI 工作负载与适合该任务的最佳计算资源相匹配。简而言之,无服务器推理允许企业将基础设施问题留给每天处理此问题的云提供商。 利用无服务器方法,企业可以充分利用云提供商的硅多样性——AI计算芯片的超专业化,以满足AI模型生命周期每个阶段的独特计算需求。从客户的角度来看,无服务器方法可以根据AI工作负载和用例需求自动管理适当资源的扩展,从而优化成本和性能。

通过无服务器方法来管理计算资源和优化成本,下一步是开发支持低延迟数据流的架构,并建立数据治理控制,以确保客户数据的安全。

通过实时Agentic AI推理维护数据主权和隐私

为了超越像ChatGPT这样的通用AI应用程序,agentic AI应用程序需要访问敏感的专有数据。在电子商务环境中尤其如此,在电子商务环境中,客户数据对于AI代理向客户提供与上下文相关的信息至关重要。当然,每当AI模型利用专有数据时,企业都必须遵守当地的数据治理要求。

向量存储和检索增强生成(RAG)是维护数据治理控制的有效策略,可在数据所在的任何位置为agentic AI推理提供支持。在这种方法中,敏感数据保存在受本地数据治理控制保护的向量存储中,AI代理根据需要使用RAG访问这些数据,而不是直接在敏感数据上训练模型

向量存储和RAG可以在不将敏感数据暴露给第三方模型提供商的情况下,实现与上下文相关的洞察。无需重新训练整个模型即可补充向量存储的内容,从而降低了训练成本。这种方法还使模型更易于跨地域传输,同时遵守当地的数据主权要求。

除了数据治理之外,企业还需要低延迟的数据流来促进实时agentic AI交互。Apache Kafka是一个开源流数据平台,非常适合将实时流数据馈送到agentic AI应用程序中。借助RAG和向量存储,Apache Kafka可以在边缘实现低延迟的agentic AI应用程序,同时保持本地治理。

Agentic AI加剧了对正确架构方法的需求

与传统的AI相比,agentic AI将大大加重工程团队的负担,他们需要配置和维护复杂的基础设施,以支持分布在广阔地域和数千个边缘设备上的AI代理集群。唯一可行的方法是将无服务器推理与RAG和托管Kafka相结合,从而确保AI代理执行的任务能够准确、安全地执行,且没有明显的延迟。

通过将基础设施配置、配置和自动扩展的复杂性外包给云提供商,工程团队可以专注于构建强大的AI应用层,开发专门构建的AI代理,并优先考虑客户体验。用于AI基础设施的无服务器方法为构建客户旅程的全新agentic未来奠定了完美的基础。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-03-062,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI 本地化部署的详细方案
AI 本地化部署(On-Premise AI Deployment)指的是将 AI 模型、数据、基础设施和相关应用程序部署在企业自己的服务器、数据中心或边缘设备上,而不是依赖于第三方云服务提供商。这种方案在对数据隐私、安全性、成本控制、延迟和定制化有严格要求的场景中越来越受欢迎。
数字孪生开发者
2025/06/06
6410
AI 本地化部署的详细方案
Salesforce市值破万亿!爱因斯坦AI平台将大显身手,首席科学家却离职
想当年,Salesforce首次亮相的时候,公司市值才刚过10亿美金,一眨眼现在公司的市值已经到1694亿美元,折合人民币超万亿元。
新智元
2020/07/20
8190
大模型应用系列:两万字解读MCP
【引】AI Agent的实际效能高度依赖于其可集成的工具生态。当Agent无法接入关键数据源或功能接口时,其应用价值将大幅受限。这一核心挑战直接决定了Agent能否在真实场景中发挥作用。
半吊子全栈工匠
2025/04/26
92.3K60
大模型应用系列:两万字解读MCP
智能体评估工具:开发者对抗AI幻觉的新武器
一个名为“AI自主评估”的生成式AI新领域帮助开发者保护其AI应用免受幻觉的影响。
云云众生s
2025/02/19
2530
LLM Agent和 Agentic RAG 的最佳综述
代理式检索增强生成(Agentic RAG)通过在RAG管道中嵌入自主代理,代表了人工智能领域的重大飞跃。本仓库补充了综述论文《代理式检索增强生成(Agentic RAG):综述》,提供了以下方面的见解:
致Great
2025/01/22
5670
LLM Agent和 Agentic RAG 的最佳综述
跨越“演示”到“生产”鸿沟,亚马逊云科技开启AI Agents新纪元
从自主预定机票的“数字同事”,到主动编写并调试代码的编程助手,AI已经从简单的问答工具,向能够执行复杂任务的系统演进。
Alter聊科技
2025/07/20
1830
跨越“演示”到“生产”鸿沟,亚马逊云科技开启AI Agents新纪元
Agentic AI及其设计模式简介
微软推出 AI 代理,加深与 Salesforce 的竞争;这家总部位于华盛顿州雷德蒙德的软件制造商,周一表示,将推出 10 个自治agent,代表销售、客户支持和会计等领域的人员完成任务。
AIGC新知
2024/12/25
5600
Agentic AI及其设计模式简介
RAG科普文!检索增强生成的技术全景解析
增强生成 (RAG) 是塑造应用生成式 AI 格局的关键技术。Lewis 等人在其开创性论文中提出了一个新概念面向知识密集型 NLP 任务的检索增强生成之后,RAG 迅速成为基石,提高了大型语言模型 (LLM) 输出的可靠性和可信度。
致Great
2025/02/15
1.2K0
RAG科普文!检索增强生成的技术全景解析
揭穿SaaS应用程序可取代所有遗留系统这个神话
如今,软件即服务(SaaS)应用程序越来越多地应用于大企业。公司高管想要员工使用这种应用程序的两个首要原因是: * 节省成本:公司可节省IT团队扩建构建新应用程序需要的IT基础设施的高昂前期成本。扩建成本包括设立机房,以及聘请另外的编程人员、系统工程师和系统分析人员。SaaS提供商提供了运行SaaS应用程序所需的IT基础设施和虚拟机;公司从内部或外部的SaaS开发人员获得应用程序。 * 简化用户的数据相关任务:SaaS应用程序可帮助员工简化将数据交给公司高管的任务,高管需要数据帮助自己做出及时的决策,并且需
静一
2018/03/21
5840
推理是赌注,这对Ampere来说是件好事
这家半导体公司专注于支持云原生 AI 应用程序开发,提高规模化性能并消除“嘈杂邻居”。
云云众生s
2024/05/16
1180
一文读懂 Agentic RAG 技术点滴
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 提升大型语言模型(LLMs)的知识获取和生成能力的 Agentic RAG(智能增强检索生成)技术。
Luga Lee
2025/04/04
5210
一文读懂 Agentic RAG 技术点滴
NVMe-oF大幅降低数据访问延迟
随着企业继续在其数据中心构建类似超大规模的云架构,NVMe-oF 的采用率势必加快。
云云众生s
2025/02/06
2220
NVMe-oF大幅降低数据访问延迟
「应用架构」 EA874系列:企业应用集成概述
有预测称,公司在应用程序集成方面的支出将超过目前的支出。云、移动、社交和信息等力量之间的联系将有助于企业推动业务流程创新和改进,但也会使要集成的应用程序、设备、云服务和数据源的数量激增和复杂化。更为复杂的是,企业将与外部商业伙伴进行更多的B2B集成。
架构师研究会
2020/07/17
5010
Spring AI Transform Java以实现GenAI应用程序交付
机器学习 (ML) 和 AI 不再是新事物,但生成式 AI (GenAI)——使用 大型语言模型 (LLM) 生成图像、文本、音乐和其他媒体——在过去 18 个月中引起了相当大的关注,吸引了商业领袖和公众的想象力。
云云众生s
2024/09/19
1860
Spring AI Transform Java以实现GenAI应用程序交付
Agentic Workflow是什么?Agentic Workflow会成为下一个AI风口吗?
近年来,随着大语言模型(LLM)的兴起,AI Agent和Agentic Workflow成为人工智能领域的两大热点。然而,AI Agent的技术局限性和商业化落地的困难逐渐显现,而Agentic Workflow则因其更高的可实现性和实用性受到越来越多的关注。本文将从三个方面展开讨论:AI Agent 的技术挑战 、聚焦于Agentic Workflow 的核心优势 以及 Agentic Workflow 是否可能成为下一个AI风口 。
watermelo37
2025/06/13
2210
Agentic Workflow是什么?Agentic Workflow会成为下一个AI风口吗?
NEXT 2025:Nutanix,AI与多云新篇
Nutanix 于 2025 年举办的.NEXT 大会,标志着其从超融合基础设施(HCI)领导者向更广泛混合多云平台提供商的战略转型。本次大会聚焦人工智能(AI)、云原生技术、存储创新及生态合作,核心在于简化 IT 管理、加速 AI 应用落地,并在边缘、数据中心及公有云间实现应用与数据的无缝流转。Nutanix 致力于提供灵活、安全、可扩展的解决方案,以满足现代企业不断变化的需求,尤其是在 AI 和云原生领域的积极布局,预示着其在企业 IT 市场中将扮演更重要的角色。
数据存储前沿技术
2025/05/12
2220
NEXT 2025:Nutanix,AI与多云新篇
智能体间协作的"巴别塔困境"如何破解?解读Agent通信4大协议:MCP/ACP/A2A/ANP
AI 智能体的兴起触发了AI应用协作的新领域。这些智能体不再局限于被动的聊天机器人或独立的系统,它们现在被设计用于推理、计划和协作ーー跨任务、跨域甚至跨组织。但随着这一愿景成为现实,一个挑战很快浮出水面: 智能体如何以一种安全、可伸缩和可互操作的方式可靠地相互交流、共享上下文并共同做出决策?
半吊子全栈工匠
2025/05/19
6590
智能体间协作的"巴别塔困境"如何破解?解读Agent通信4大协议:MCP/ACP/A2A/ANP
为什么AI Agent需要一个运营数据库
一个专门为速度、可扩展性和低延迟而设计的平台,确保 AI 代理能够有效地收集、处理和交付上下文丰富的可观测性结果。
云云众生s
2025/02/15
1700
AI 程序员的学习与发展方向你应该学习的知识
数据库索引是一种派生结构,它将列值映射到表中行的物理位置。让我们看看一些关键的索引类型:
BUG弄潮儿
2025/07/20
730
AI 程序员的学习与发展方向你应该学习的知识
开发者现在可以访问世界上最快的AI芯片
Cerebras——英伟达的芯片竞争对手——推出了一个AI云服务,据称其速度比普通云提供商快10到20倍。
云云众生s
2024/09/05
1390
推荐阅读
相关推荐
AI 本地化部署的详细方案
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档