Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >LLM 应用生态系统:有什么新变化以及云原生正在如何适应

LLM 应用生态系统:有什么新变化以及云原生正在如何适应

作者头像
云云众生s
发布于 2024-03-27 13:41:37
发布于 2024-03-27 13:41:37
1890
举报
文章被收录于专栏:云云众生s云云众生s

LLM 应用生态系统:有什么新变化以及云原生正在如何适应

Web3 未能重塑开发者生态系统,然而新兴的 LLM 堆栈正在推动云原生时代进行适应。我们将对其进展进行审视。

翻译自 LLM App Ecosystem: What’s New and How Cloud Native Is Adapting

AI 启用应用程序的开发生态系统正逐渐成熟,经过过去一年出现的诸如 LangChain 和 LlamaIndex 等工具。甚至现在已经有一个专门针对 AI 开发者的术语:AI 工程师,根据其倡导者 Shawn @swyx Wang 的说法,这是从“提示工程师”升级而来的下一步。他创建了一个巧妙的图表,展示了 AI 工程师在更广泛的 AI 和开发生态系统中的位置:

来自 swyx

大型语言模型(LLM)是 AI 工程师的核心技术。LangChain 和 LlamaIndex 都是扩展和补充 LLM 的工具,这并不是巧合。但除了 LLM 之外,还有哪些工具可供这个新的开发者类别使用呢?

我目前看到的关于 LLM 堆栈的最佳图表来自风险投资公司 Andreessen-Horowitz(a16z) 。以下是他们对“LLM 应用堆栈”的看法:

来自 a16z;点击图像查看全尺寸。

至关重要的数据层

不言而喻,在 LLM 堆栈中,最重要的是数据。在 a16z 的图表中,这是顶层。 "嵌入模型" 是 LLM 的运用领域 - 您可以选择使用 OpenAI、Cohere、Hugging Face 等几十种其他 LLM 选项,包括日益流行的开源 LLM

但甚至在使用 LLM 之前,a16z 暗示您需要设置一个“数据流水线” - 它列出了 Databricks 和 Airflow 作为两个示例,或者您可以选择将数据“非结构化”。虽然 a16z 没有提到,但我认为这部分数据周期中适合的工具是帮助企业在将数据提供给定制的 LLM 之前“清洁”或简单策划数据的工具。这种类型的“数据智能”公司,如 Alation,提供这种服务 - 它类似于企业 IT 堆栈中更知名的“业务智能”工具类别的衍生。

数据层的最后一部分是一类工具,允许您存储和处理 LLM 数据 - 向量数据库。根据 Microsoft 的定义,这是“一种将数据存储为高维向量的数据库,这些向量是特征或属性的数学表示。” 数据以通过一种叫做“嵌入”的技术存储为向量。

当我在五月份与领先的向量数据库供应商 Pinecone 交谈时,他们指出他们的工具通常与数据流水线工具(如 Databricks)一起使用。在这种情况下,数据通常存储在其他地方(例如数据湖),然后通过机器学习模型将其转化为嵌入来进行处理和分块。处理和分块数据后,产生的向量将被发送到 Pinecone。

提示和查询

接下来的两个层次可以总结为提示和查询 - 这是 AI 应用程序与 LLM 以及(可选地)其他数据工具进行交互的地方。

a16z 将 LangChain 和 LlamaIndex 都定位为“编排框架”,这意味着开发者一旦知道他们正在使用哪个 LLM,就可以使用这些工具。

根据 a16z 的说法,编排框架如 LangChain 和 LlamaIndex “抽象出了许多提示链接的细节”,这意味着在应用程序与 LLM 之间(们)进行查询和管理数据。这个编排过程中包括与外部 API 进行交互,从向量数据库检索上下文数据以及在多个 LLM 调用之间维护内存。

a16z 图表中最引人入胜的框是“playground”,其中包括 OpenAI、nat.dev 和 Humanloop。a16z 在博文中没有定义这是什么,但我们可以推断,“playground”工具帮助开发者进行所谓的“提示技巧”。这些是开发者可以尝试各种提示技术的地方。

Humanloop 是一家英国公司,其平台的特点之一是“协作提示工作区”。它进一步将自己描述为“用于将 LLM 功能投入生产的完整开发人员工具包”。因此,它允许您尝试 LLM 相关内容,然后在效果良好时将其部署到应用程序中。(我已经联系了该公司以安排一次采访,所以将会另外撰写更多有关这方面的内容。)

LLM 运营

在编排框的右侧是一系列操作框,包括 LLM 缓存和验证。还有与 LLM 相关的许多云和 API 服务,包括类似 Hugging Face 的开放 API 存储库,以及类似 OpenAI 的专有 API 提供商。

这也许是堆栈最像我们在“云原生”时代习惯的开发者堆栈的地方,不巧的是,许多 DevOps 公司已经将 AI 添加到他们的服务列表中。五月份,我与 Harness 的首席执行官 Jyoti Bansal 进行了交谈。Harness 是一个专注于 CI/CD 流程(持续集成和持续交付/持续部署)中的 “CD” 部分的“软件交付平台”。

Bansal 告诉我,AI 可以减轻与软件交付生命周期相关的乏味和重复任务,

从基于现有特性生成规范,到编写代码。此外,他表示,AI 可以自动执行代码审查、漏洞测试、错误修复,甚至可以创建用于构建和部署的 CI/CD 流水线。

根据我五月份的另一次交谈,AI 还在改变开发者的生产力。构建自动化工具 Gradle 的 Trisha Gee 告诉我,AI 可以通过减少在重复任务(如编写样板代码)上所花费的时间,加速开发,使开发者能够专注于更大的问题,如确保代码符合业务需求。

Web3 已死,人工智能堆栈万岁

在新兴的 LLM 开发者堆栈中,我们已经看到了许多新的产品类型 - 诸如编排框架(LangChain 和 LlamaIndex),向量数据库以及 Humanloop 之类的“playground”平台。所有这些都是扩展和/或补充这个时代的核心技术:大语言模型。

但我们也看到,几乎所有来自云原生时代的公司都在调整他们的工具,以适应 AI 工程师时代。这对于 LLM 堆栈的未来演进来说是一个好兆头。谚语“站在巨人的肩膀上”浮现在脑海中:在计算技术领域,最好的创新往往都是在前人的基础上建立的。也许这就是失败的“Web3”革命所做的事情 - 它不是在前一代基础上建立,而是试图篡夺它。

这个新的 LLM 应用程序堆栈是不同的;它是从云开发时代到基于人工智能的新型开发生态系统的桥梁。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-08-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
2023人工智能工程五大新方向
除了LLM的大量增加,AI开发工具也有了扩展。我们来看一下今年AI开发中的五个关键趋势。
云云众生s
2024/03/28
1260
2023人工智能工程五大新方向
LangStream: 面向LLM应用的基于事件驱动的开发者平台
译自 LangStream: an Event-Driven Developer Platform for LLM Apps 。
云云众生s
2024/03/28
2620
LangStream: 面向LLM应用的基于事件驱动的开发者平台
AI堆栈的演变:从基础到代理
AI 技术栈,包含编程语言、模型、LLM 框架、数据库等,能够快速大规模构建 AI 应用。
云云众生s
2024/07/28
2640
AI堆栈的演变:从基础到代理
Spring AI:赋能 Java 开发者,拥抱生成式 AI 革命
生成式人工智能(Generative AI)的浪潮,特别是大型语言模型(LLM)的兴起,正在通过自动化任务、增强用户体验和创造新的内容形式,深刻地改变着各个行业。这些模型能够生成与人类相媲美的文本、图像、音频和视频,其背后是海量数据的训练支撑。在当前 AI/ML(人工智能/机器学习)的开发领域,Python 凭借其丰富的库、成熟的生态系统以及在数据科学任务中的易用性,占据了绝对主导的地位。
磊叔的技术博客
2025/06/09
2.8K0
Spring AI:赋能 Java 开发者,拥抱生成式 AI 革命
Hugging Face 在开放 LLM 堆栈中的定位是什么?
翻译自 How Hugging Face Positions Itself in the Open LLM Stack 。
云云众生s
2024/03/27
2760
Hugging Face 在开放 LLM 堆栈中的定位是什么?
Vercel 的未来大计:为开发者提供 AI SDK 和加速器
在 2020 年代,很少有公司像 Vercel 这样对前端开发生态系统产生了如此大的影响, Vercel 是流行的 React 框架 Next.js 的管理者。当我首次写关于 Vercel 的文章时,那是在 2020 年 7 月,该公司刚刚拥抱了 Jamstack 趋势,并在其营销中广泛使用“无服务器”这个词汇。但随着 Jamstack 趋势的下降和无服务器不再是一个热词,Vercel 抓住了最新的“下一个大事”:生成式人工智能。
云云众生s
2024/03/28
4030
Vercel 的未来大计:为开发者提供 AI SDK 和加速器
一文读懂常见的几种 LangChain 替代品
在 LLM (大规模语言模型)应用开发领域,开源框架扮演着至关重要的角色,为广大开发者提供了强大的工具支持。作为这一领域的领军者,LangChain 凭借其创新设计和全面功能赢得了广泛赞誉。但与此同时,一些替代框架也应运而生,为不同场景下的需求提供了更优选择。
Luga Lee
2024/11/01
1.7K0
一文读懂常见的几种 LangChain 替代品
生产级RAG系统一些经验总结
本文将探讨如何使用最新技术构建生产级检索增强生成(RAG)系统,包括健壮的架构、向量数据库(Faiss、Pinecone、Weaviate)、框架(LangChain、LlamaIndex)、混合搜索、重排序器、流式数据接入、评估策略以及实际部署技巧。
致Great
2025/05/02
4020
大语言模型生态系统:助你自由调教 AI 模型
这些开源项目都是在语言模型领域具有重要影响力的优秀项目。它们共同的特点是强调了对大规模语言模型进行训练和推理的高效性、灵活性和可扩展性。无论是通过提供定制化的语言模型、支持并行计算和分布式训练,还是通过优化内存管理和硬件资源利用效率来提高运算速度,这些项目都致力于使得人工智能技术更加便捷、高效地应用于各个领域。如果您正在寻找一个功能强大且易于使用的开源语言模型项目,我强烈推荐阅读此篇文章。
小柒
2023/08/10
7410
大语言模型生态系统:助你自由调教 AI 模型
2024年人工智能工程五大趋势
2024年是AI软件(特别是AI编码工具)成熟、自动化(AI代理)发展、小型模型涌现等的一年。
云云众生s
2024/12/18
2040
2024年人工智能工程五大趋势
面向AI开发的无服务器:Modal的基于Python和Rust的平台
Modal 支持 AI 推理和数据处理等计算密集型任务,正在重新定义 LLM 和 GPU 时代的无服务器架构。
云云众生s
2025/01/24
1560
面向AI开发的无服务器:Modal的基于Python和Rust的平台
LlamaIndex——与LangChain类似但更专注于数据处理的LLM框架
LlamaIndex(前身为GPT Index)是一种用于LLM应用程序摄取、结构化和访问私有或领域特定数据的数据框架。
山行AI
2023/09/27
13.8K0
LlamaIndex——与LangChain类似但更专注于数据处理的LLM框架
可用于AI应用的5个开放式LLM推理平台
五个生成式 AI 推理平台,可使用开放式 LLM,如 Llama 3、Mistral 和 Gemma。有些还支持针对视觉的模型。
云云众生s
2024/06/08
5370
RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐
MaxKB = Max Knowledge Base,是一款基于 LLM 大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。它能够帮助企业高效地管理知识,并提供智能问答功能。想象一下,你有一个虚拟助手,可以回答各种关于公司内部知识的问题,无论是政策、流程,还是技术文档,MaxKB 都能快速准确地给出答案:比如公司内网如何访问、如何提交视觉设计需求等等
汀丶人工智能
2024/08/05
13.1K0
RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐
来了!10个构建Agent的大模型应用框架
随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。为了更便捷地构建这些基于大模型的应用程序,开源社区和产品开发者们正以前所未有的速度进行创新。
半吊子全栈工匠
2025/03/24
8.9K0
来了!10个构建Agent的大模型应用框架
大模型时代的系统语言:Rust vs Mojo
这十七年我虽然没有什么光彩履历,但却很幸运,我还能在这个行业坚守,并能不断成长。同样很幸运,我经历了桌面软件没落, Web 2.0 崛起,以及移动互联网的兴盛,当下基础设施系统软件开始复兴的诸多历程。
张汉东
2023/09/13
2.6K0
大模型时代的系统语言:Rust vs Mojo
当下大语言模型(LLM)应用的架构介绍
想要构建你的第一个大语言模型应用?这里有你需要了解的一切,以及你今天就能开始探索的问题领域。
轩辕镜像
2024/09/29
5030
当下大语言模型(LLM)应用的架构介绍
如何设计一个 JVM 语言下的 LLM 应用开发框架?以 Chocolate Factory 为例
本文将介绍 Chocolate Factory 框架背后的一系列想法和思路。在我们探索和设计框架的过程中,受到了:LangChain4j、LangChain、LlamaIndex、Spring AI、Semantic Kernel、PromptFlow 的大量启发。
Phodal
2023/09/26
1.1K0
如何设计一个 JVM 语言下的 LLM 应用开发框架?以 Chocolate Factory 为例
OpenAI 宣布采用竞对 Anthropic 协议,一夜将 MCP 送上热搜!Karpathy:赶紧歇了吧
美国当地时间 3 月 26 日,OpenAI CEO Sam Altman 在 X(原 Twitter)帖子中确认,OpenAI 将在旗下产品(包括 ChatGPT 桌面应用)中集成 Anthropic 的模型上下文协议(MCP)。
深度学习与Python
2025/03/31
1370
OpenAI 宣布采用竞对 Anthropic 协议,一夜将 MCP 送上热搜!Karpathy:赶紧歇了吧
使用SemanticKernel 进行智能应用开发(2023-10更新)
以OpenAI 的ChatGPT 所掀起的GenAI 快速创新浪潮,其中连接LLM 和 应用之间的桥梁的两大开源项目:LangChain[1]和Semantic Kernel[2] ,在半年前写过一篇文章 LangChain vs Semantic Kernel [3],这半年以来Semantic kernel 有了显着改进,这篇文章反应了最新的更新。
张善友
2023/10/03
1.6K0
使用SemanticKernel 进行智能应用开发(2023-10更新)
推荐阅读
相关推荐
2023人工智能工程五大新方向
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档