Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DevOps在LLM时代拥抱跨栈可观测性

DevOps在LLM时代拥抱跨栈可观测性

作者头像
云云众生s
发布于 2024-07-14 05:36:50
发布于 2024-07-14 05:36:50
1680
举报
文章被收录于专栏:云云众生s云云众生s

虽然没有人确切地知道人工智能将对软件开发和部署、CI/CD 以及 DevOps 产生什么影响,但在未来尘埃落定后,将取决于适当的可观察性流程、工具和实践来分析这一切。

译自 DevOps Embraces Observability Across Stacks for LLM Era,作者 B Cameron Gain。

纽约 - 人工智能的巨大影响、安全问题以及向云原生迁移带来的持续挑战,对 DevOps 构成了重大颠覆。所有这些都将在未来几个月或几年内,如果不是几个月的话,导致变化。

虽然 平台工程 看起来为应对与之相关的基础设施和数据爆炸以及应用程序管理提供了有希望的方法,但应对这些挑战的根本方法将涉及适当的 可观测性 和对 OpenTelemetry 的支持。这是 DASH 2024Datadog 最近在这里举办的年度用户大会的主要收获之一。

这个主题可能与任何用户或任何会议相关,因为社区正在寻找方法来应对数据和应用程序管理和观察的爆炸式增长,没有人确切地知道人工智能对软件开发和部署、CI/CD 以及 DevOps 和 IT 的总体影响。然而,可以争论的是,随着未来尘埃落定,将取决于适当的可观测性流程、工具和实践来分析并做出关于如何最好地利用 LLM 进行应用程序开发和其他 AI 辅助流程的正确决策。

“我们从你们中许多人那里听说,你们支持 LLM 的应用程序正在迁移到生产环境。一旦进入生产环境,就必须像任何其他承重机器一样对其进行监控,”Datadog 首席技术官兼联合创始人 Alexis Lê-Quôc 在 DASH 主题演讲中说。“但与它们不同的是,需要了解健康状况、性能和安全性的数据类型。”

为了标准化日志、跟踪和指标的检测,不仅针对 大型语言模型 (LLM),而且针对任何组织的整个堆栈和环境,OpenTelemetry——一个更具活力的开源项目——将变得更加重要。“OpenTelemetry 正在通过提供基于标准的基础为我们构建,从而彻底改变可观测性,释放整个行业的创新,”Datadog 工程总监 Gordon Radlein 在他的主题演讲中说。“这是一场让所有船只都受益的潮流。”

为了帮助 Datadog 用户以及那些正在考虑采用该平台的用户——OpenTelemetry 有助于更轻松地与现有解决方案混合和匹配——Datadog 在 DASH 上发布了一系列新产品和功能。这是对来自 187,000 次客户会议的一年多反馈的总结;导致大约 50 万次生产发布,涵盖 400 多种新产品和新功能,Datadog 联合创始人兼首席执行官 Olivier Pomel 在他的主题演讲中说。

LLM 和平

再说一次,LLM 安全是一个大问题,也是一个不同的动物,为此,Datadog 在 DASH 上发布了 Datadog LLM 可观测性。借助它,该平台旨在帮助组织更好地洞察和控制 LLM 数据的爆炸式增长,这些数据通常表现为单个组织中的多个 LLM。正如 Datadog 工程主管 Mohamed Alimi 所解释的那样,对 LLM 的实验“导致了许多行业的令人难以置信的创新,其中许多实验已经从简单的应用程序发展成为在生产环境中运行的更复杂的系统,使用多个 LLM,”用于编排框架、检索系统和 知识图谱。“但这同时也带来了新的挑战,”他说。

Alimi 说,随着应用程序参与 LLM 和更复杂的模式,它们变得更难排查。其次,由于 LLM 和人工智能组件的固有不可预测性,这些应用程序需要持续监控幻觉。最后,Alimi 说,这些应用程序可能会面临来自提示黑客和数据共享的重大风险。

在 DASH 的演示中,Alim 展示了如何使用 LLM 支持的电子商务聊天机器人,Datadog LLM 可观测性突出显示需要立即关注的问题。错误、潜在的幻觉、缓慢的响应、令牌计数和安全威胁都被标记出来。“它还突出了‘忠实度’,这是相对于给定上下文而言的正确性和准确性的衡量标准,”Alimi 说。“我们在这里使用忠实度作为幻觉的代理。”

在演示过程中,Alimi 使用该平台收集有关报告的幻觉的情報。提供的信息包括交互的持续时间、消耗的令牌计数和进行的 LLM 调用次数。“组织需要拥抱可观测性”,以便为安全性和性能正确管理 LLM,Alimi 说。

作为可观测性提供商,Datadog 对作为 OpenTelemetry 项目的主要贡献者以及使用 OpenTelemetry 提供的标准化使其工具与 OpenTelemetry 兼容有着浓厚的兴趣。

其理念是,通过此 OpenTelemetry 功能或仪器,用户组织可以立即无缝地连接并开始使用他们选择的可观测性平台。当然,可观测性提供商也会单独尽力通过 OpenTelemetry 使这种体验优于其他参与者。

OpenTelemetry 的优势之一是它有助于简化兼容性,并且随着社区的贡献,它允许开发更多可以利用此功能或允许解决方案可观测性提供商利用这种兼容性的功能。

OpenTelemetry 强劲

作为 OpenTelemetry 项目的前 10 名贡献者之一,Datadog 继续帮助构建该项目,而其产品开发继续超过 OpenTelemetry 兼容性。“由于 Datadog 在这个领域已经发展了很长时间,OTel OpenTelemetry 还没有支持所有提供的产品。随着 Datadog 的创新速度,这种情况预计会继续下去,即使差距正在缩小。这带来了一个困境:要么全力投入 Datadog,放弃 OpenTelemetry 带来的某些巨大好处,要么局限于 OTel 支持的产品,”Radlein 说。“自然而然地,问题出现了,为什么不两者兼得呢?Datadog 一直在努力解决这个问题,因为 Datadog 与 OpenTelemetry 结合更好,而 OpenTelemetry 与 Datadog 结合更好。”

在 DASH 期间,Radlein 描述了 Datadog 如何通过统一 Datadog 代理和 OpenTelemetry 收集器来迈出下一步。“现在,代理和收集器协同工作,形成一个大于其各部分之和的整体,丰富 OpenTelemetry 数据并启用产品套件,”Radlein 说。

Radlein 说,使用新代理,收集器用户将立即获得对完整产品套件和平台的访问权限。提供基于应用程序的收集器集群管理,“以及来自专用产品支持的安心。新代理用户还将获得对大量不断增长的社区贡献的集成访问权限,包括对越来越多的商业和开源工具的开箱即用支持,这些工具使用 OpenTelemetry 本地进行仪器化,”Radlein 说。“实现了可观测性集群中工具的更好互操作性,无论这些工具是基于供应商的还是开源的。提供对 OTLP 数据的控制,并完全访问收集器强大的路由和处理功能。”

云原生方式

LLMS 和 OpenTelemetry 虽然规模巨大,但只是在会议上宣布的十多个其他公告之一。其中包括 Datadog 如何加强可观测性以帮助缓解不断上升的云成本。正如 Datadog 容器Kubernetes 监控产品经理 Danny Driscoll 所说,超过 65% 的 Datadog 监控的 Kubernetes 容器仍然使用不到其请求的内存和 CPU 资源的一半。

使用 Datadog Kubernetes 自动缩放,优先考虑具有最大节省潜力的工作负载和集群,以便从 Datadog 平台直接采取行动来应用并自动执行大小调整建议,并观察和衡量您的完整自动缩放程序对您的关键成本和效率指标的影响。Driscoll 说,此公告旨在帮助用户在 Kubernetes 上构建平台以提供更有效的资源使用,这可以降低基础设施成本,并降低您的企业对能源消耗的影响。

相关文章:

  1. 人工智能如何增强可观测性
  2. OTel是DevOps成功秘诀
  3. Nautobot的力量和通往数据驱动未来的道路
  4. 流程自动化简化ITOps的5种方法
  5. KitOps将DevOps流水线转变为MLOps流水线
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-07-132,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
KubeCon上的可观测性和AI:新的连接
New Relic和Splunk在KubeCon + CloudNativeCon北美峰会上宣布了新的基于AI的功能,而OpenTelemetry正准备进入大型机。
云云众生s
2024/12/07
1070
KubeCon上的可观测性和AI:新的连接
使用 OpenTelemetry 和 SigNoz 实现 LLM 可观测性
在快速发展的大语言模型(LLM)世界中,确保最佳性能和可靠性比以往任何时候都更为关键。这就是'LLM 可观测性'的概念发挥作用的地方。这不仅仅是监控输出;更是深入洞察这些复杂系统内部运作的关键。
云云众生s
2024/03/28
6190
使用 OpenTelemetry 和 SigNoz 实现 LLM 可观测性
一文读懂 LLM 可观测性
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - LLM (大型语言模型)可观测性 ,本文将继续聚焦在针对 LLM 的可观测性进行解析,使得大家能够了解 LLM 的可观测性的必要性以及其核心的生态体系知识。
Luga Lee
2024/01/17
7880
一文读懂 LLM 可观测性
一文搞懂基于 OpenTelemetry 进行 Kubernetes 全链路观测
Hello folks,我是 Luga,今天我们来聊一下云原生生态核心技术—— 可观测性,即 “基于 OpenTelemetry 进行 Kubernetes 全链路观测” 。
Luga Lee
2023/09/25
4.1K1
一文搞懂基于 OpenTelemetry 进行 Kubernetes 全链路观测
Grafana 努力纠正可观测性的历史遗留问题
新推出的Grafana工具,如自适应指标和成本管理中心,可以帮助组织更好地处理可观测性数据的泛滥。
云云众生s
2024/03/28
1520
Grafana 努力纠正可观测性的历史遗留问题
基于OpenTelemetry进行全链路追踪
Hello folks,我是 Luga,今天我们来分享一下与云原生体系有关的话题- 云原生可观测性-OpenTelemetry。 作为一个云原生“核心”标准,OpenTelemetry在观测分布式微服务应用程序和云基础设施的可见性和控制自动化层面具有举足轻重的意义。
Luga Lee
2023/04/28
4K1
基于OpenTelemetry进行全链路追踪
告别监控盲区!如何做好可观测性的第一步?
在当今的数字环境中,传统的可观测性方法已经让位于行业领导者所认可的可观测性2.0。这个可观测性的新时代要求组织对其监控策略的思考和实施方式进行根本性的转变。
云云众生s
2025/02/19
1180
数据可观测性市场迫在眉睫的危机
一旦开放标准取代了专有系统,许多其他市场就蓬勃发展起来。可观测性市场也面临着同样的机遇。
云云众生s
2024/07/21
1340
塑造可观测性市场的关键趋势
随着人工智能导致数据复杂性和体积的增加,像 OpenTelemetry 这样的开源解决方案以及新的成本管理方法正在推动变革。
云云众生s
2024/10/17
1910
使用OpenTelemetry Operator解锁Kubernetes可观测性
随着 Kubernetes 环境规模和复杂性的增长,可观测性对于维持性能和可靠性至关重要。本文探讨了 OpenTelemetry Operator 如何简化遥测数据的收集,从而能够无缝监控 Kubernetes 本身以及在其上运行的应用程序。
云云众生s
2025/03/10
1600
使用OpenTelemetry Operator解锁Kubernetes可观测性
可观测性2024:更多OpenTelemetry,更少困惑
这对许多IT团队来说,如果不是大多数,都是充满混乱和挑战的一年。在各种挑战中,不断上升的云成本和优化云支出的压力尤为突出。节省成本的策略大多被委派给DevOps来实施。
云云众生s
2024/03/28
2520
OpenTelemetry Collector 如何扩展可观测性
在KubeCon+CloudNativeCon 2023的两场演讲中展示了可观测性领域中的各种工具和服务。
云云众生s
2024/03/28
2150
OpenTelemetry Collector 如何扩展可观测性
使用 Elastic 3 个步骤实现基于原生 OTel 的 K8s 和应用可观测性
最近,Elastic 发布了其 OpenTelemetry (OTel) 的 Elastic 发行版(EDOT),旨在增强标准 OpenTelemetry 发行版的能力,并改进现有的 Elastic 对 OpenTelemetry 的支持。EDOT 帮助 Elastic 提供了全新的统一 OpenTelemetry 体验。SRE 不再需要通过繁琐的步骤来配置和摄取 OTel 数据到可观测性中,而是可以通过简单的步骤来配置 OTel 收集器和应用程序,并将所有 OTel 数据摄取到 Elastic 中。这一体验的组成部分包括(详细信息请参阅概述博客):
点火三周
2024/12/27
1471
使用 Elastic  3 个步骤实现基于原生 OTel 的 K8s 和应用可观测性
可观测性就是对“监控”的包装?
作者:软件质量保障 知乎:https://www.zhihu.com/people/iloverain1024
互联网金融打杂
2022/08/01
6860
可观测性就是对“监控”的包装?
OpenTelemetry并非可观测性的“神奇按钮”
OpenTelemetry 已成为 可观测性体验的重要组成部分,随着其持续发展,它日益满足开发人员和运维人员的 DevOps 需求。然而,作为当前的主要开源项目之一,它仍需完善。它的功能——虽然可以说对于可观测性来说已经必不可少——仍处于进行中,其成功取决于社区持续的支持和辛勤工作。它的实用性还取决于与 OpenTelemetry 结合使用的 可观测性 工具和平台。
云云众生s
2024/05/28
1930
OpenTelemetry并非可观测性的“神奇按钮”
为什么多云可观测性如此昂贵?
由于云原生环境中数据量的爆炸式增长,各组织正面临着不断攀升的可观测性成本,这促使他们寻求具有成本效益的解决方案。
云云众生s
2025/03/11
910
统一遥测+可观测性:数据管理的未来
随着数字化体验成为客户忠诚度的主要战场,统一的智能而非碎片化的监控将使市场领导者脱颖而出。
云云众生s
2025/03/10
950
为什么 Grafana 需要 OpenTelemetry
Grafana Labs 不可避免地寻求将 OpenTelemetry 用于其著名的面板及其开源替代方案,包括 Grafana 开源工具
云云众生s
2024/03/27
3580
在OpenTelemetry中标准化可观测性的语言
OpenTelemetry标准化可观测性语言,解决工具间互操作难题。通过统一术语,避免指标命名混乱,提升问题检测速度。标准化语义约定助力构建预制仪表板,优化云支出,实现跨团队协作和数据民主化。拥抱OTel,加速可观测性生态系统互操作,提升应用性能。
云云众生s
2025/03/15
470
Kubernetes 中的 eBPF 代理能否成为提高可观测性的关键?
翻译自 Can eBPF Agent in Kubernetes Be the Key to Better Observability?
云云众生s
2024/03/27
1550
推荐阅读
相关推荐
KubeCon上的可观测性和AI:新的连接
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档