Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Llama Stack发布,助力开发者构建“代理应用”

Llama Stack发布,助力开发者构建“代理应用”

作者头像
云云众生s
发布于 2024-10-13 01:37:35
发布于 2024-10-13 01:37:35
1750
举报
文章被收录于专栏:云云众生s云云众生s

Meta 发布了 Llama Stack,旨在让开发者更轻松地使用 Llama 大型语言模型进行构建。这是为了实现 AI 工程标准化的一次尝试。

译自 Llama Stack Released To Help Developers Build 'Agentic Apps',作者 Richard MacManus。

在 2024 年的 Facebook Connect 大会上,Meta 的年度开发者大会,该公司发布了 Llama 3.2,其最新的大型语言模型。Meta 表示其 Llama LLM 是开源的,尽管其他人 并不完全同意。无论如何,Meta 的首席产品官 Chris Cox 将 Llama 3.2 称为“我们迄今为止最以开发者为中心的版本”,并在其 开发者主题演讲 中解释了这句话的含义。

“过去——Llama 1、Llama 2、Llama 3 和 3.1——我们一直非常关注模型性能,努力打造最智能的、最先进的模型,并将其开放给消费者和你们,”Cox 说。“对于这个版本,我们一直在努力解决我们从你们所有人那里听到的意见,[即]你们需要什么来改进你们的工具,并将行业提升到下一个水平。”

“Llama Stack 是一组参考 API,用于现代 LLM 系统部署的每个组件。” – Chris Cox,Meta

尽管 Llama 3.2 的新图像生成功能在活动期间和之后吸引了最多的社交媒体关注,但对于开发者来说,最重要的公告是 Cox 的最后一条。他解释了人们是如何向他抱怨使用 Llama 模型作为开发者太难了。

“你们就像把这些模型扔过墙,每个人都在做同样的事情,每个人都在做批次推理、合成数据,”他说,总结了一些抱怨。“每个人都在蒸馏模型,每个人都在做评估。拜托,让入门变得非常简单,也让这些东西模块化。”

为了回应这些批评,Meta 发布了“Llama Stack”,帮助开发者更轻松地开始使用其 Llama 模型。

“Llama Stack 是一组参考 API,用于现代 LLM 系统部署的每个组件,”Cox 说。“它也是一堆 PyTorch 和其他开发环境的库,可以帮助你立即开始。”

细枝末节

该堆栈包含一系列“构建块”,开发者可以使用这些构建块来构建 LLM 应用程序,从实际意义上讲,这意味着以下 API 集:

  • 推理
  • 安全
  • 内存
  • 代理系统
  • 评估
  • 训练后
  • 合成数据生成
  • 奖励评分

Meta 在 相关的 GitHub 存储库 中指出,每个 API 都是一组 REST 端点。API 提供者实际上可以是任何人——“云提供商或专门的推理提供商可以提供这些 API。”

Stack APIs; 来自 Meta 的图片

为了让开发者更容易使用,Meta 组织了一系列“发行版”,它表示这是“API 和提供商组合在一起,为最终应用程序开发者提供一致的整体”。目前,Docker 上有三个发行版可用:本地 GPU、本地 CPU 和本地 TGI + Chroma。

Llama Stack 发行版;图片来自 Meta

正如 Ahmad Al-Dahle,Meta 生成式 AI 的负责人,在 X 上所说,“我们的 Llama Stack 发行版是我们在如何通过单个端点支持开发者的道路上迈出的巨大一步。我们现在与社区分享简化且一致的体验,这将使他们能够在多种环境中使用 Llama 模型,包括本地、云、单节点和设备上。”

在 LinkedIn 上,Prashant Ratanchandani,Meta 生成式 AI 的工程副总裁,分享了他的想法。“Llama Stack 是我们试图定义和标准化所有构建块,以将 AI 应用程序带给用户的尝试。如今,要做到这一点,开发者需要考虑并选择多个构建块,而 LlamaStack 将这些构建块整合到一个简洁的包中——涵盖模型训练和微调、评估,以及最终构建和部署应用程序。”

同样有趣的是,看看 Meta 的企业合作伙伴如何实施 Llama Stack。例如,戴尔显然优先考虑代理应用程序 在其产品中。“通过将 Llama Stack 与戴尔的 AI 工厂相结合,组织可以获得企业级基础设施,使他们能够轻松地使用 Llama 模型原型化和构建基于代理的 AI 应用程序,”该公司声称。

戴尔和 Llama Stack;图片来自戴尔

代理系统 API

在当前可用的 API 中,“代理系统” API 显然是关键,因为 AI 代理的热潮 在 AI 开发者社区中。它恰好位于堆栈的顶部——对于 Meta 和戴尔来说——因此它很可能成为 AI 工程师想要定期使用的 API。

当 Llama Stack 最初在 7 月份作为 RFC 提出时,早期评论员 建议这是 Meta 的“代理框架”。Meta 本身使用“代理应用程序”一词来表示它设想使用 Llama Stack 构建的应用程序类型。

在 Llama Stack 正式发布之前,Meta 在 GitHub 上发布了一个仓库,“展示了在 Llama Stack 之上构建的应用程序示例”。从 Llama 3.1 开始,它表示,您可以构建能够执行以下操作的代理应用程序:

  • 将任务分解并执行多步推理。
  • 使用工具执行某些操作:
    • 内置:模型内置了对搜索或代码解释器等工具的了解。
    • 零样本:模型可以学习使用以前从未见过的上下文工具定义来调用工具。
  • 使用 Llama Guard 等模型提供系统级安全保护。

结论

现在确定开发人员想要使用 Llama Stack 构建哪些类型的应用程序还为时过早,但这只是 AI 开发工具标准化的另一个例子。使用 Llama Stack 以及 Meta 的 LLM 是使用独立 AI 工具(如 LangChainLlamaIndex)并寻找 Hugging Face 目录 中合适的 LLM 的替代方案。使用 Llama Stack,尤其是在用作分发时,所有这些选择都会为您做出。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-10-122,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
2024年人工智能工程五大趋势
2024年是AI软件(特别是AI编码工具)成熟、自动化(AI代理)发展、小型模型涌现等的一年。
云云众生s
2024/12/18
1630
2024年人工智能工程五大趋势
拉 DeepSeek 和通义“组队”斗 OpenAI?小扎首届 AI 大会变“大型商战现场”,和微软 CEO 疯狂互曝!
4 月 30 日凌晨,Meta 举行了其有史以来的首届 AI 开发者大会 LlamaCon。现场,该公司宣布推出一款面向消费者的独立 Meta AI 聊天机器人应用程序,这款应用将与 ChatGPT 展开竞争,同时还发布了一个面向开发者的 API,用于在云端访问 Llama 模型。
深度学习与Python
2025/05/01
580
拉 DeepSeek 和通义“组队”斗 OpenAI?小扎首届 AI 大会变“大型商战现场”,和微软 CEO 疯狂互曝!
开发者现在可以访问世界上最快的AI芯片
Cerebras——英伟达的芯片竞争对手——推出了一个AI云服务,据称其速度比普通云提供商快10到20倍。
云云众生s
2024/09/05
1050
「代理人战争」!微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱
大家或许容易想到文生图、云服务等,但是微软、OpenAI 、谷歌、Meta等科技大厂,纷纷瞄准了另一个赛道:Agent。
新智元
2024/05/06
1140
「代理人战争」!微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱
使用Conda和Ollama开始使用Meta的Llama堆栈
要设置 Meta 的新 Llama Stack 开发工具,您可以使用 Python 控制的环境或 Docker。我们选择了 Python 和 Ollama LLM。
云云众生s
2024/10/18
2010
使用Conda和Ollama开始使用Meta的Llama堆栈
AI开发者减少OpenAI,转向更多语言模型
继OpenAI最近的争议后,AI工程师和公司开始减少乃至完全摆脱对其API的依赖。
云云众生s
2024/03/27
1110
为什么红帽认为人工智能的未来是小语言模型
Red Hat 认为 AI 未来在于小型化!企业应拥抱定制化、低成本的 LLM 和 AI Agent。InstructLab 开源项目助力 GenAI 应用,通过指令调优和合成数据,简化 LLM 创建。vLLM 推理服务器和 PyTorch FSDP 加持,让 AI 在 OpenShift 上跑得飞起!
云云众生s
2025/03/17
490
AI正在快速发展 — 开发者如何才能跟上步伐
我与开发者密切合作多年,经历了许多技术阶段。我可以自信地说,AI 创新的速度与我们之前见过的任何事物都不同。效率是开发者跟上这一步伐的关键,也是行业达到 AI 可以为所有人带来益处的程度的关键。这是通过无缝的软硬件集成来部署基于 AI 的工作负载来实现的。
云云众生s
2025/02/12
910
开发者:为NVIDIA基于NIM的AI应用商店做好准备
NIM(NVIDIA 推理微服务)是一个虚拟化容器,用于提供 AI 功能;该技术将为 NVIDIA AI 应用商店提供支持。
云云众生s
2024/06/13
1340
AI Agents 技术栈
随着生成式人工智能(如 ChatGPT)的快速发展,AI Agents(人工智能体)正从概念走向大规模应用。2025 年被广泛视为“AI Agent 元年”,其技术栈的成熟标志着智能系统从“被动响应”向“自主决策”的跃迁。那么什么是 AI Agents 呢?构成 AI Agents 的技术栈有哪些关键组成部分?本文参考了一些资料,尝试解释这一概念,主要参考了以下内容:
云水木石
2025/02/12
3950
AI Agents 技术栈
AI代理和copilot:SAP推出更深层次的集成
随着新的协作代理的推出,SAP 反映了企业软件市场中使用生成式 AI 技术(利用大型语言模型)的更重大趋势。
云云众生s
2024/10/11
1730
AI堆栈的演变:从基础到代理
AI 技术栈,包含编程语言、模型、LLM 框架、数据库等,能够快速大规模构建 AI 应用。
云云众生s
2024/07/28
2010
AI堆栈的演变:从基础到代理
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
Llama 3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。
新智元
2024/05/06
2900
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
AI模型“大即好”的观点已经走不通了
原文链接:https://www.economist.com/science-and-technology/2023/06/21/the-bigger-is-better-approach-to-ai-is-running-out-of-road 译者:明明如月
明明如月学长
2023/07/10
2320
AI模型“大即好”的观点已经走不通了
[AI Meta Llama-3] 最强开源大模型Llama 3发布!
今天,我们很高兴地宣布Meta Llama 3的第一批模型已经推出,可供广泛使用。此次发布的模型具有8B和70B参数的预训练和指导微调语言模型,可以支持广泛的用例。这一代Llama展示了在广泛的行业基准测试中的最先进性能,并提供了改进的推理等新功能。我们相信这些是同类中最优秀的开源模型。为了支持我们长期以来的开放式方法,我们将Llama 3交到了社区的手中。我们希望推动AI在整个技术栈上的下一波创新——从应用程序到开发者工具再到评估和推理优化等方面。我们迫不及待地想看到您的构建,并期待您的反馈。
从零开始学AI
2024/04/19
8310
[AI Meta Llama-3] 最强开源大模型Llama 3发布!
作为合格的NVIDIA Jetson开发者需要知道的Jetson开发工具
NVIDIA Jetson平台通过全球最全面的人工智能软件堆栈和生态系统,实现了对边缘人工智能和机器人应用开发的广泛访问。它集成了可扩展的平台软件、现代化的人工智能堆栈、灵活的微服务和API、ROS包以及特定应用的人工智能工作流程。在本次讲座中,您将学习到使用新升级的NVIDIA Jetson软件堆栈加快开发视觉人工智能和工业机器人应用的技能。
GPUS Lady
2024/04/13
6640
作为合格的NVIDIA Jetson开发者需要知道的Jetson开发工具
SmolAgents:超级简单!3行代码构建一个代理,通过实时生成代码并执行,Agent的定义,终于开始收敛了。
这个过程反映了整个AI社区的探索:在过去18个月里,大家一直在思考如何构建代理,不断尝试,不断调整。
AI进修生
2025/01/09
4850
SmolAgents:超级简单!3行代码构建一个代理,通过实时生成代码并执行,Agent的定义,终于开始收敛了。
在Windows电脑上快速运行AI大语言模型-Llama3
近期 Meta 发布了最新的 Llama3 模型,并开源了开源代码。Meta Llama 3 现已推出 8B 和 70B 预训练和指令调整版本,可支持广泛的应用程序。
东风微鸣
2024/04/23
1.7K0
在Windows电脑上快速运行AI大语言模型-Llama3
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了?
新智元
2024/04/19
2200
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
探秘NVIDIA RTX AI:llama.cpp如何让你的Windows PC变身AI超人
想象一下,你的Windows PC突然拥有了超能力,能够迅速处理复杂的AI任务,就像电影里的超级电脑一样。这一切,都要归功于NVIDIA RTX AI平台和它的秘密武器——llama.cpp!
GPUS Lady
2024/10/04
8430
推荐阅读
相关推荐
2024年人工智能工程五大趋势
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档