前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >KubeCon上的可观测性和AI:新的连接

KubeCon上的可观测性和AI:新的连接

作者头像
云云众生s
发布于 2024-12-07 04:16:56
发布于 2024-12-07 04:16:56
950
举报
文章被收录于专栏:云云众生s云云众生s

New Relic和Splunk在KubeCon + CloudNativeCon北美峰会上宣布了新的基于AI的功能,而OpenTelemetry正准备进入大型机。

译自 Observability and AI: New Connections at KubeCon,作者 Heather Joslyn; Lawrence E Hecht。

盐湖城——在KubeCon + CloudNativeCon 北美大会上,许多产品新闻和讨论中都暗流涌动着一个主题:AI 如何与许多已有的技术相连接。

例如:可观测性 公司New Relic思科旗下的 Splunk的公告。

New Relic 宣布其用于 Kubernetes 的全新一步式可观测性正式可用,该产品可自动将应用程序性能监控 (APM) 与 Kubernetes 部署连接,无需任何额外配置。该产品收集遥测数据(它提供对PrometheusOpenTelemetry的原生支持),并通过仪表板显示基于该数据的 AI 驱动的见解。

New Relic 的高级开发者关系总监在 KubeCon 大会上告诉 The New Stack,其好处在于可视化更容易。

“我们通过一步式可观测性所做的是,基本上消除了所有这些麻烦,” 说。“因此,您可以开箱即用地深入了解您的 Kubernetes 环境,以及部署到集群中的应用程序。”

它是如何工作的?“我们将拥有我们自己的容器,它将处理所有拉取或自动检测应用程序的工作。

“通过为您的基础设施层添加 New Relic,您已经可以开箱即用地获得这些功能。因此,现在您无需实际增强任何配置,它只会将其作为一种旁调用来运行,然后将所有数据整合在一起。”

New Relic 的
New Relic 的

New Relic 的 。(来源:Heather Joslyn)

在后续电子邮件中,详细介绍了该“容器”的工作方式:“在 Kubernetes 中,Mutating WebHook 会拦截将 Pod 部署到节点的 API 请求。它会根据指定的配置修改 Pod 规范,以使用独立的 newrelic-mutate-pod 添加 NR init 容器和环境变量。在建立 Pod 后,New Relic APM Agent 会无缝集成到用户 K8s Pod 中的应用程序中。”

在 KubeCon 大会上,Splunk 宣布其综合可观测性 产品组合的一些新功能正式可用。其中,Splunk Observability Cloud 的标签聚光灯功能现在具有 AI 增强功能,可以更细致地了解跨应用程序和最终用户体验中出现的常见问题,从而实现更快的故障排除和更好的事件解决。

思科的AppDynamics 指出,传统上服务于较旧的遗留系统。“目前,在我们 Splunk 可观测性部门中,重点在于与 AppDynamics 的集成,以及能够将人们在 AppDynamics 中非常喜欢的功能(如业务事务和快照结果等)带到 Splunk 可观测性中,供希望在那里使用它们的客户使用,同时增加我们对更多平台的 AppDynamics 的通用支持。”

减轻告警疲劳

对 AI 功能的投资是整合 Splunk 和 AppDynamics 产品的一部分。几乎每个人(97%)在 10 月份发布的一份报告中接受 Splunk 调查的人表示,他们使用 AI 和机器学习驱动的系统来增强可观测性操作。这比 2023 年研究版本的 66%有所上升。

深入研究数据后,在可观测性解决方案中肯定还有更多使用 AI 的空间。55% 的 Splunk 受访者使用 AI 和 ML 驱动的工具来完成调查并确定问题的根本原因

Splunk 报告基于 2024 年 5 月和 6 月对 1850 名 IT 专业人员的调查。 AI可以帮助解决的一个痛点是告警疲劳。在Splunk十月发布的一项调查中https://www.splunk.com/en_us/form/state-of-observability.html,57%的参与者表示他们将告警疲劳与可观测性解决方案联系起来。

过去,McLean表示,他曾担任值班工程师,他理解这种痛苦。

“告警疲劳非常残酷,”他说。“半夜被吵醒,你的手机开始疯狂震动,你看着它,也许很重要,也许不重要,你需要坐下来注册并决定这是否应该忽略或需要立即采取行动。

“一些组织对此有良好的规范,但这需要大量的体力劳动和流程来不断更新和修剪你的告警,以确保它们有效。我们可以做很多事情,我们正在投资Splunk来改进这一点,”

OpenTelemetry的下一步是什么?

McLean也是OpenTelemetry的联合创始人,这是一种收集可观测性数据(指标、日志和追踪)的标准化方式。他表示,OpenTelemetry性能分析信号的普遍可用版本发布,原计划于2024年底发布,现在可能会推迟到2025年中。

“在OpenTelemetry或任何类似的标准中,有很多工作是在指定行为方面进行的,”他说。“这不是代码,而是人们用人类语言书写。”

除了OTel的收集器代理之外,它还必须从使用JavaPython等语言的应用程序中捕获数据。

“所有这些都必须保持一致的行为,因为如果其中一个决定以不同的方式捕获数据,其形状与所有其他数据不同,你就无法处理它,”McLean告诉The New Stack。“你需要获得一致的数据。因此,性能分析方面仍然有一些规范工作正在进行。”

Morgan McLean, of Splunk, a Cisco Company.
Morgan McLean, of Splunk, a Cisco Company.

Morgan McLean,Splunk(思科公司)

将这些规范纳入OTel协议的大部分工作已经完成,但他表示,这项工作尚未完成。特定语言的实现仍然需要最终确定。

“许多剩余的工作是让我们的Java支持与内置的Java性能分析进行通信……这些都不是特别困难,但我们必须在每种语言上都这样做。”

议程上的另一件事:最终确定整数的语义约定。正如McLean提到的,团队正在创建规范,以确保OTel性能分析在不同语言中的工作方式保持一致。

“我们不仅需要这些实现保持一致的行为,还需要它们生成的数据具有完全相同的标签和属性等,这样你才能获得一些强大的分析,”他说。“这方面有很多工作正在进行。这可能被认为是一种枯燥的工作,但它确实非常关键。”

McLean表示,将性能分析信号引入开源OTel将帮助更多组织利用性能分析并降低成本,从而将一项潜在的利基功能推向主流。

“Splunk提供性能分析产品,”他指出。“许多可观测性供应商也这样做,但这通常只是产品的一小部分。”

他打了个比方:“分布式追踪在真正成为主流之前已经存在多年了,它成为主流的一个重要原因是开放性。如果你让它易于使用,性能分析也是类似的。”

去年一月,TNS预计OpenTelemetry的支持和采用将在2024年继续。

  • 在Splunk的研究中,58%的参与者表示他们的主要可观测性解决方案依赖于OpenTelemetry。这与我们的预期相符。
  • 然而,New Relic和Enterprise Technology Research十月发布的一项研究提供了更为悲观的景象,只有10%的1700多名受访IT专业人员表示他们使用集成了OpenTelemetry的开源解决方案。

至于OTel路线图上更远的目标,McLean提到了服务遗留系统。“OpenTelemetry即将进入大型机,”他说。“有一个工作组正在研究这个问题。我们正在添加对IBM z/OS、IBM Z Linux的支持。”

目标是帮助那些已经使用 OpenTelemetry 的“大型金融机构、航空公司及其他公司”——在其 Kubernetes 集群、虚拟机以及大部分现代基础设施上——这些公司仍然依赖于遗留系统,使用现代的而非特定于大型机的可观测性工具来捕获所有数据。McLean 说,那些遗留工具无法让这些组织全面了解其整个系统。

AIOps:衰落还是重新包装?

然而,来自 New Relic 和 Splunk 的新数据也指出了 AI 在可观测性领域的未来的一些担忧:

  • 在 Splunk 的调查中,只有 34% 的受访者表示他们的组织可以使用 AI/ML 解决大部分警报。然而,Splunk 发现,已经采用可观测性的公司更有可能达到这一里程碑。
  • 20% 的 Splunk 研究受访者广泛使用 AIOps 工具。
  • New Relic 的报告发现,其调查参与者中 24% 使用 AIOps 功能,低于 2023 年同一研究中的 41%。
  • 这种下降可能是对AIOps 的坏名声的回应,而AI 驱动的可观测性的重新包装更能体现实际的使用模式。

在给 TNS 的后续电子邮件中,New Relic 的 Sius 解释了人们部署 AIOps 功能下降的原因:“下降可能归因于 AI 技术的快速发展,新的创新,如大型语言模型 (LLM),正在重塑人们对‘AI’的定义。”

“2023 年,大多数人可能将 AIOps 视为一个涵盖广泛应用的总称。但随着过去一年 AI 的显著进步,2024 年的受访者对 AIOps 标签的理解可能大相径庭,更加具体。”

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-12-062,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
弹性分析代理提供第四个可观测性支柱
OpenTelemetry 的性能分析代理应该对用户很有用,因为它通过扩展到代码级别,可以更深入地进行可观察性分析。
云云众生s
2024/07/06
1040
聊聊可观测性Observability
自打去年以来,可观测性Observability这个概念又非常的火,按照我的感受,在运维领域,这个概念是近两年即AIOps之后,热度最高的一个了。 无论是国内还是海外的运维相关的公司,都给了自己一个新的定位,就是可观测性平台,或者叫做可观测云,相对应的产品也是层出不穷。 对于我来讲,我看一个趋势,往往会从落地的角度,从实际情况来分析,反向去看,而不是单纯地看技术多么酷炫。 所以,我观测了很久Observability之后,打算还是从实际情况入手来聊聊这个概念,看看可观测这个东西到底包含哪些内容?它们之间是
赵成
2022/03/25
1K0
使用 AI 助手、OTel 标准化、持续性能分析和增强日志分析来变革可观测性
Elastic Observability 提供精准的洞察,通过 AI 助手、基于 OpenTelemetry (OTel) 的标准化解决方案、扩展至性能分析功能以及增强的日志分析,加速问题解决。
点火三周
2024/10/14
1980
使用 AI 助手、OTel 标准化、持续性能分析和增强日志分析来变革可观测性
使用 Elastic 3 个步骤实现基于原生 OTel 的 K8s 和应用可观测性
最近,Elastic 发布了其 OpenTelemetry (OTel) 的 Elastic 发行版(EDOT),旨在增强标准 OpenTelemetry 发行版的能力,并改进现有的 Elastic 对 OpenTelemetry 的支持。EDOT 帮助 Elastic 提供了全新的统一 OpenTelemetry 体验。SRE 不再需要通过繁琐的步骤来配置和摄取 OTel 数据到可观测性中,而是可以通过简单的步骤来配置 OTel 收集器和应用程序,并将所有 OTel 数据摄取到 Elastic 中。这一体验的组成部分包括(详细信息请参阅概述博客):
点火三周
2024/12/27
1281
使用 Elastic  3 个步骤实现基于原生 OTel 的 K8s 和应用可观测性
DevOps在LLM时代拥抱跨栈可观测性
虽然没有人确切地知道人工智能将对软件开发和部署、CI/CD 以及 DevOps 产生什么影响,但在未来尘埃落定后,将取决于适当的可观察性流程、工具和实践来分析这一切。
云云众生s
2024/07/14
1620
OpenTelemetry:2019年北美KubeCon回顾
以下是几周前在北美KubeCon + CloudNativeCon的概况,以及与OpenTelemetry相关的活动。
CNCF
2019/12/10
8280
OpenTelemetry:2019年北美KubeCon回顾
塑造可观测性市场的关键趋势
随着人工智能导致数据复杂性和体积的增加,像 OpenTelemetry 这样的开源解决方案以及新的成本管理方法正在推动变革。
云云众生s
2024/10/17
1830
统一遥测+可观测性:数据管理的未来
随着数字化体验成为客户忠诚度的主要战场,统一的智能而非碎片化的监控将使市场领导者脱颖而出。
云云众生s
2025/03/10
900
告别监控盲区!如何做好可观测性的第一步?
在当今的数字环境中,传统的可观测性方法已经让位于行业领导者所认可的可观测性2.0。这个可观测性的新时代要求组织对其监控策略的思考和实施方式进行根本性的转变。
云云众生s
2025/02/19
1090
从可观测性数据中经济高效地挖掘相关性
总部位于旧金山的初创公司 Sawmills 帮助企业从海量的遥测数据中解脱出来,并控制其预算。
云云众生s
2025/03/05
620
从可观测性数据中经济高效地挖掘相关性
数据可观测性市场迫在眉睫的危机
一旦开放标准取代了专有系统,许多其他市场就蓬勃发展起来。可观测性市场也面临着同样的机遇。
云云众生s
2024/07/21
1310
五分钟了解 KubeGems 可观测性
可观测性 Observability 是近几年来随着应用微服务和容器化推进而引领出来的一个概念。其提出的最核心的三个方向 Monitoring 、Logging 和 Tracing 目前也已广泛的被各从业人员和SaaS 服务商接受,并应用在项目当中。当下具备一个可观测性分析的平台以及作为云原生时代微服务系统基础组件,不管是从 CNCF 社区还是公有云平台开放性与性能是决定平台价值的核心要素。在复杂的微服务场景下和多维度的监控数据,对 KubeGems 的可观测性设计实现带了诸多挑战。本次分享也从一个使用者的角度快速介绍当前 KubeGems 可观测性的功能。
云原生小白
2022/11/11
8450
五分钟了解 KubeGems 可观测性
OpenTelemetry Collector 如何扩展可观测性
在KubeCon+CloudNativeCon 2023的两场演讲中展示了可观测性领域中的各种工具和服务。
云云众生s
2024/03/28
2110
OpenTelemetry Collector 如何扩展可观测性
OTel 101:通过实践Workshop构建可观测性技能
教授云原生开发者如何使用 OpenTelemetry 通过分布式跟踪探索他们的服务。
云云众生s
2024/03/28
1200
OTel 101:通过实践Workshop构建可观测性技能
在OpenTelemetry中标准化可观测性的语言
OpenTelemetry标准化可观测性语言,解决工具间互操作难题。通过统一术语,避免指标命名混乱,提升问题检测速度。标准化语义约定助力构建预制仪表板,优化云支出,实现跨团队协作和数据民主化。拥抱OTel,加速可观测性生态系统互操作,提升应用性能。
云云众生s
2025/03/15
440
OTel是你将安装的最后一个可观测性Agent吗?
开源的 OpenTelemetry Collector 极大地挑战了可观测性供应商和最终用户之间的关系。
云云众生s
2025/03/06
490
腾讯蓝鲸 x DeepFlow 基于 eBPF 的可观测性实践
本文整理自腾讯 IEG 高级研发工程师刘文平在《蓝鲸 x DeepFlow 可观测性 Meetup》中的分享实录,详细阐述了蓝鲸可观测性平台如何有效地 融合了 OpenTelemetry 的标准化数据接入能力及 DeepFlow 的无插桩、全面覆盖的数据收集能力, 进而解决游戏业务在观测数据采集、数据孤岛、以及云原生基础设施观测等领域所面临的难题。并展望了通过 DeepFlow,构建适合腾讯游戏的专属观测场景。
深度学习与Python
2023/08/09
9180
腾讯蓝鲸 x DeepFlow 基于 eBPF 的可观测性实践
云原生环境中可观测性日益增长的重要性
云原生可观测性迎来AI驱动时代!预测性监控、异常检测助力快速定位问题。拥抱OpenTelemetry标准化遥测数据,降低运营成本。DevSecOps融合安全与可观测性,FinOps实现成本优化。未来可观测性将更智能、更安全、更经济!
云云众生s
2025/03/17
740
可观测性2024:更多OpenTelemetry,更少困惑
这对许多IT团队来说,如果不是大多数,都是充满混乱和挑战的一年。在各种挑战中,不断上升的云成本和优化云支出的压力尤为突出。节省成本的策略大多被委派给DevOps来实施。
云云众生s
2024/03/28
2320
Tetragon 1.0承诺开启Kubernetes安全与可观测性新纪元
译自 Tetragon 1.0 Promises a New Era of Kubernetes Security and Observability 。
云云众生s
2024/03/28
1150
推荐阅读
相关推荐
弹性分析代理提供第四个可观测性支柱
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档