Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >OpenTelemetry正在扩展到CI/CD可观测性

OpenTelemetry正在扩展到CI/CD可观测性

作者头像
云云众生s
发布于 2025-03-18 03:57:23
发布于 2025-03-18 03:57:23
890
举报
文章被收录于专栏:云云众生s云云众生s

OpenTelemetry 扩展至 CI/CD 可观测性!新版语义约定 v1.27.0 纳入 CI/CD 属性,标准化遥测数据。通过 CI/CD SIG 协作,对齐 SLSA 规范,实现 VCS 版本追踪和供应链安全。未来将聚焦指标约定、原型构建和 OTEP #258 实施,欢迎加入 CNCF Slack #cicd-o11y 频道共建。

译自:OpenTelemetry Is Expanding Into CI/CD Observability 作者:OpenTelemetry Authors; Docs CC BY

多年来,我们一直在讨论需要一种通用的“语言”来报告和观察 CI/CD 管道,最终,我们看到了这种语言的第一个“词”进入可观测性的“词典”——OpenTelemetry 开放规范。随着 OpenTelemetry 最新发布的 语义约定 v1.27.0,您可以找到 用于报告 CI/CD 管道的指定属性

这是 OpenTelemetry 中 CI/CD 可观测性特别兴趣小组 (SIG) 努力工作的结果。当我们完成第一阶段的核心里程碑时,我们认为现在是与世界分享它的好时机。

工程师需要了解 CI/CD 管道的可观测性

CI/CD 可观测性 对于确保软件高效且可靠地发布到生产环境至关重要。 良好运行的 CI/CD 管道通过缩短 变更前置时间 DORA 指标 并能够快速识别和解决损坏或不稳定的流程,从而直接影响业务成果。 通过将可观测性集成到 CI/CD 工作流程中,团队可以实时监控管道的健康状况和性能,从而深入了解瓶颈和需要改进的领域。 利用用于监控生产环境的相同成熟工具,组织可以扩展其可观测性能力以包括发布周期,从而培养软件交付的整体方法。 无论是开源工具还是专有工具,在为 CI/CD 管道选择可观测性工具链时,都无需重新发明轮子。

标准化的必要性

然而,CI/CD 工具的多样化格局给实现一致的端到端可观测性带来了挑战。 由于每个工具都有自己的方式、格式和语义约定来报告管道执行状态,因此工具链中的碎片化可能会阻碍无缝监控。 在工具之间迁移变得很痛苦,因为它需要重新实现现有的仪表板、报告和警报。

当您需要以统一的方式监控发布管道中涉及的多个工具时,事情会变得更具挑战性。 这就是 开放标准和规范变得至关重要的地方。 它们创建了一种通用的统一语言,一种与工具和供应商无关的语言,从而可以在不同的工具之间实现有凝聚力的可观测性,并使团队能够保持对其 CI/CD 管道性能的清晰而全面的视图。

标准化的需求与创建上述语义约定相关,即用于报告管道中发生的事情的语言。 标准化对于通过系统传播此报告的方式也是必需的,例如在管道执行期间生成进程时。 这促使我们推广使用环境变量进行进程之间的上下文和 baggage 传播的标准化,这是最近批准和合并的另一个重要里程碑。

OpenTelemetry:CI/CD 可观测性规范的天然家园

这种认识促使我们寻找正确的方法来创建规范。 OpenTelemetry 正在成为遥测生成和收集的标准。 OpenTelemetry 规范的任务正是解决这个问题:为遥测创建一个通用的、统一的且与供应商无关的规范。 并且它对云原生计算基金会 (CNCF) 的支持确保了它保持开放和供应商中立。 作为 OpenTelemetry 的长期倡导者,将其扩展到涵盖这个重要的 DevOps 用例是理所当然的。

我们从几年前的 OpenTelemetry 扩展提案 (OTEP #223) 开始,提出了我们扩展 OpenTelemetry 以涵盖 CI/CD 可观测性用例的想法。 与此同时,我们在 CNCF Slack 上开设了一个 Slack 频道,以聚集志同道合的爱好者,并开始集思广益,了解它应该是什么样子。 Slack 频道不断发展,我们很快发现这个问题在许多组织中都很常见。

根据技术监督委员会和 CNCF 内其他人的反馈,我们采取了要求授权的途径,即在 OpenTelemetry 的语义约定 SIG(简称 SIG SemConv)下为该主题启动一个专门的工作组。 在他们的祝福下,我们 启动了正式的 CI/CD 可观测性 SIG,以正式确定我们之前的 Slack 小组讨论和目标。

OpenTelemetry 的 CI/CD 可观测性 SIG

自 2023 年 11 月以来,该 SIG 一直积极与多家公司和开源项目的专家合作,致力于制定 CI/CD 可观测性语义标准。在成立之初,我们决定将重点放在 2024 年的几个关键领域:

  • CI/CD 系统的一组通用属性。
  • 开发原型,包括整体和特定于信号的属性。
  • 继续推进将环境变量作为上下文传播器添加到 OpenTelemetry 规范的提案 (OTEP #258)。
  • 一种将 OpenTelemetry 约定与 CDEventsEiffel 连接起来的策略。

起初,我们的 SIG 每周一在更大的语义约定工作组会议期间举行会议。这为我们提供了一个很好的机会来确定方向,因为我们研究和讨论了如何完成路线图上的目标。这也使我们能够了解更大的 OpenTelemetry 社区的许多成员,征求对我们设计的反馈,并获得有关如何进行的指导。OpenTelemetry 语义约定工作组一直非常支持 CI/CD 倡议。

在完成并发布其初始里程碑(见下文)后,我们的 SIG 获得了自己的 专用会议时段,在 OpenTelemetry 日历 上,每周四太平洋时间 06:00 举行。该小组在这里聚在一起讨论当前和未来的工作,然后再提交给周一举行的更大的语义约定会议。我们非常期待社区的持续支持和参与,因为我们将继续推动这一关键的标准化领域。

CI/CD 是最新 OpenTelemetry 语义约定的一部分

经过数月的迭代和反馈,第一组语义约定已合并 到 v1.27.0 版本中。此更改为 CICDartifactsVCStestdeployment 命名空间下的 CI/CD 引入了第一组基础语义。这是 CI/CD 可观测性 SIG 和整个行业的一个重要里程碑。这为我们小组所有其他目标的开始形成和实现奠定了基础。

但这实际上意味着什么?它提供什么价值?让我们考虑两个命名空间的真实示例。

跟踪来自版本控制系统 (VCS) 的发布修订

版本控制系统 (VCS) 属性 涵盖了 VCS 中常见的多个领域,例如引用和更改(拉取/合并请求)。vcs.repository.ref.revision 属性是一个关键的元数据。由于 GitHub 和 GitLab 等版本控制系统会发出事件,因此它们现在可以具有此语义兼容的属性。这意味着在集成代码、发布代码并将其部署到环境时,系统可以包含此属性,并更轻松地跨边界跟踪代码修订。如果部署失败,您可以快速查看代码的修订版本并将其追溯到有问题的版本。此属性实际上也是 DORA 指标 的关键元数据,因为您可以计算变更前置时间和失败部署恢复时间。

用于供应链安全的工件,与 SLSA 规范对齐

工件属性命名空间 在其首次实现中具有多个属性。此命名空间中的一组关键属性涵盖了与 SLSA 模型紧密对齐的 证明。这实际上是可观测性和软件供应链安全之间首次建立直接联系。考虑以下由 SLSA 定义的 供应链威胁模型

这些用于工件和证明的新属性有助于实时观察上图中建模的事件序列。实际上,今天存在的约定以及将来添加的约定可以使用可观测性语义实现核心软件交付能力(如安全性和平台工程)之间的互操作性。

CI/CD 可观测性工作组的下一步是什么

如前所述,我们达到的第一个主要里程碑是合并 OTEP,用于使用新属性扩展语义约定,该属性现在是 OpenTelemetry 语义约定最新版本的一部分。

第二个重要的里程碑是 OTEP #258,用于环境变量上下文传播,该提案已获得批准并合并。此 OTEP 为编写规范奠定了基础。

由于我们在最初的里程碑上取得了进展,因此我们更新了CI/CD 可观测性 SIG 2024 年剩余时间的里程碑。我们的目标是在年底前尽可能完成已定义的里程碑。值得注意的是,我们专注于:

  • 添加版本控制系统的指标约定
  • 在 CICD 系统中构建跟踪原型(例如,ArgoCD、GitHub、GitLab、Jenkins)。
  • 准备好OTEP #258以供实施,并添加到规范中。
  • 向注册表添加更多属性,涵盖更多领域。
    • Software outage incidents
    • System attributes around CI/CD runners
  • 开始处理跟踪和事件(日志)信号的具体细节,为其他规范之间的互操作性搭建桥梁。
  • 采纳实体和资源 OTEP的变更。
  • 启用供应商特定的扩展
  • 语义采纳的开源社区拓展策略。

到目前为止,所有提到的都只是开始!我们在CICD 项目看板上定义了很多工作,并且我们有正在进行的工作!我们将继续迭代为 2024 年剩余时间设定的上述里程碑。以下是一些需要注意的事项。

  • 版本控制系统指标——DORA 的领先指标
  • 来自 GitHub Actions 和审计日志的跟踪
  • 特别感谢以下人员使该组件成为可能:
    • Tyler Helmuth – Honeycomb
    • Andrzej Stencel – Elastic
    • Curtis Robert – Splunk
    • Justin Voss
    • Kristof Kowalski – Anz Bank
    • Mike Sarahan – Nvidia
  • GitHub Receiver 组件的相应版本,但在 GitLab 中实现

还有更多!

扩展 OpenTelemetry 需要集体的力量

哇,要做的事情真多!可以肯定的是,这个 SIG 将持续到 2024 年以后,并贯穿 2025 年。标准很难制定,但至关重要。而且,我们有一些很棒的人员参与了 SIG 并为这些标准做出了贡献!你可能会问是谁?

首先,我们要感谢 OpenTelemetry 领导委员会的关键成员,他们大力支持了我们迄今为止所做的工作,并将继续这样做。

在 OpenTelemetry 技术委员会中,我们有两位核心赞助商,分别是来自 Lightstep 的 Carlos Alberto 和来自 Google 的 Josh Suereth。Carlos 和 Josh 都非常支持 CICD 工作,真正指导我们完成成功所需的流程和细节。

在 OpenTelemetry 管理委员会中,来自 Microsoft 的 Trask Stalnaker 一直是一位杰出的盟友,而来自 Skyscanner 的 Daniel Blanco 现在担任我们的联络员。Trask 和 Daniel 在支持 SIG 并使我们能够在 OpenTelemetry 社区中拥有自己的会议方面发挥了重要作用。

除了这些人之外,我们还收到了以下关键人物的大量反馈、支持和贡献:

  • Yuri Shkuro – Jaeger 的创建者,OpenTelemetry 的联合创始人
  • Andrea Frittoli – Tekton CD 维护者,CDEvents 联合创建者,IBM
  • Emil Bäckmark – CDEvents 和 Eiffel 维护者,Ericsson
  • Magnus Bäck – Eiffel, Axis Communications
  • Liudmila Molkova – Microsoft
  • Christopher Kamphaus – Jemmic, Jenkins
  • Giordano Ricci – Grafana Labs
  • Giovanni Liva – Dynatrace, Keptn
  • Ivan Calvo – Elastic, Jenkins
  • Armin Ruech – Dynatrace
  • Michael Safyan – Google
  • Robb Kidd – Honeycomb
  • Pablo Chacin – Grafana Labs
  • Alexandra Konrad – Elastic
  • Alexander Wert – Elastic
  • Joao Grassi – Dynatrace
  • DJ Gregor – Discover

说了很多名字!我们非常感谢所有支持这项计划并帮助其实现的人!构建行业范围的标准需要大量的思考能力和时间。难题很难解决,但这些人已经迎接了挑战,使可观测性和 CICD 系统的世界变得更好、更具互操作性!

加入工作组讨论并产生影响

想了解更多?想参与塑造 CI/CD 可观测性吗?

我们邀请开发人员和从业者参与讨论,贡献想法,并帮助塑造 CI/CD 可观测性和 OpenTelemetry 语义约定的未来。讨论在 CNCF Slack 的 #cicd-o11y 频道中进行,您可以参与本文中提到的任何 GitHub issue,并加入 CICD SIG 每周四太平洋时间 06:00 举行的每周例会

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-03-172,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
CI/CD可观测性:OpenTelemetry的全新机遇
如果我们将可观测性重点转移到左侧,我们可以在问题升级之前解决 CI/CD 中的问题,正如两位 Grafana 工程师所述。
云云众生s
2024/05/07
1910
CI/CD可观测性:OpenTelemetry的全新机遇
可观测性2024:更多OpenTelemetry,更少困惑
这对许多IT团队来说,如果不是大多数,都是充满混乱和挑战的一年。在各种挑战中,不断上升的云成本和优化云支出的压力尤为突出。节省成本的策略大多被委派给DevOps来实施。
云云众生s
2024/03/28
2670
可观测性查询语言标准工作启动
2023年标志着可观测性领域的重大进步,关键的发展包括OpenTelemetry项目达到通用可用性和Elastic Common Schema合并到OpenTelemetry中。
云云众生s
2024/03/28
1400
OpenTelemetry与可观测性:展望未来
让我们探索一些令人兴奋的趋势,回顾我们目睹的一些情况,并考虑到我们对2024年的期望,看看可观测性领域正在发展的情况。
云云众生s
2024/03/28
1740
使用OpenTelemetry监控你的CI/CD流水线
今天的软件比 20 多年前的软件复杂了数个数量级,这给我们调试代码带来了新的挑战。幸运的是,通过在系统中实现可观测性,我们已经相当远程地理解了我们的应用程序正在执行什么以及问题正在发生在哪里。
云云众生s
2024/03/28
2120
使用OpenTelemetry监控你的CI/CD流水线
Elastic 向 OpenTelemetry 贡献 Elastic Common Schema (ECS),帮助用户采用基于 OTel 的可观测性和安全方案
如今,来自不同来源和模式的数据使得查明软件问题和理解问题的根本原因变得困难。通用模式有助于标准化数据,从而改进可观测性和安全解决方案中数据的分析、可视化和关联,从而加速根本原因分析。为了确保我们的客户和更广泛的社区能够从标准化中受益,Elastic 致力于基于 Elastic Common Schema (ECS) 和 OpenTelemetry (OTel) 开发指标、日志、跟踪和安全事件的通用架构。
点火三周
2023/08/03
1.5K0
Elastic 向 OpenTelemetry 贡献 Elastic Common Schema (ECS),帮助用户采用基于 OTel 的可观测性和安全方案
在组织内推广OpenTelemetry?
使用 OpenTelemetry 实现可观测性不仅仅是技术问题。了解成功推广的最佳实践非常重要。
云云众生s
2024/03/28
1660
KubeCon上的可观测性和AI:新的连接
New Relic和Splunk在KubeCon + CloudNativeCon北美峰会上宣布了新的基于AI的功能,而OpenTelemetry正准备进入大型机。
云云众生s
2024/12/07
1150
KubeCon上的可观测性和AI:新的连接
基于OpenTelemetry进行全链路追踪
Hello folks,我是 Luga,今天我们来分享一下与云原生体系有关的话题- 云原生可观测性-OpenTelemetry。 作为一个云原生“核心”标准,OpenTelemetry在观测分布式微服务应用程序和云基础设施的可见性和控制自动化层面具有举足轻重的意义。
Luga Lee
2023/04/28
4.1K1
基于OpenTelemetry进行全链路追踪
OpenTelemetry Collector 如何扩展可观测性
在KubeCon+CloudNativeCon 2023的两场演讲中展示了可观测性领域中的各种工具和服务。
云云众生s
2024/03/28
2220
OpenTelemetry Collector 如何扩展可观测性
什么是 CI/CD 可观察性,我们如何为更多可观察的管道铺平道路?
在这篇文章中,作者介绍了CI/CD可观测性的概念和重要性。通过使用可观测性,团队可以提前解决问题,做出更明智的决策,并增加对软件发布的信心。文章还提到了CI/CD系统中常见的问题,包括不稳定性、性能回归和配置错误。为了解决这些问题,作者介绍了GraCIe,这是一个基于Grafana构建的应用插件,旨在提供对CI/CD系统的易于理解的方式。GraCIe利用Grafana Tempo、Grafana Loki和Prometheus的功能,通过使用OpenTelemetry,可以与几乎任何CI/CD平台无缝集成,为用户提供无与伦比的洞察力。作者还展望了未来,希望CI/CD供应商能够朝着一个共同的标准发展,实现遥测数据的普遍可访问性。
DevOps云学堂
2023/12/19
2810
什么是 CI/CD 可观察性,我们如何为更多可观察的管道铺平道路?
在OpenTelemetry中标准化可观测性的语言
OpenTelemetry标准化可观测性语言,解决工具间互操作难题。通过统一术语,避免指标命名混乱,提升问题检测速度。标准化语义约定助力构建预制仪表板,优化云支出,实现跨团队协作和数据民主化。拥抱OTel,加速可观测性生态系统互操作,提升应用性能。
云云众生s
2025/03/15
550
统一云原生可观测性:Elastic 与 OpenTelemetry 的最佳实践指南
OpenTelemetry 不仅仅是成为可观测性的开放标准。作为云原生计算基金会(CNCF)下的主要项目之一,OpenTelemetry 得到了大量企业软件供应商和云服务提供商的支持。来自金融、保险、科技等行业的全球企业正在逐步标准化使用 OpenTelemetry。通过 OpenTelemetry,DevOps 团队可以一致地收集和摄取遥测数据,从而为可观测性提供事实上的标准。
点火三周
2024/10/14
6070
统一云原生可观测性:Elastic 与 OpenTelemetry 的最佳实践指南
OpenTelemetry 2023
OpenTelemetry(OTEL)始于 2019 年,当时围绕追踪的两个主要开源项目 OpenTracing 和 OpenCensus 合并,形成了 OpenTelemetry 。合并后的项目范围扩展到超越追踪,涵盖了所有的可观测性。OTEL 的使命是帮助组织交付高质量、无处不在且可移植的遥测数据。
云云众生s
2024/03/28
2530
OpenTelemetry 2023
平台工程的六大支柱之二:CI/CD 和 VCS 流水线
译自 The 6 Pillars of Platform Engineering: Part 2 — CI/CD & VCS Pipeline 。
云云众生s
2024/03/28
2370
平台工程的六大支柱之二:CI/CD 和 VCS 流水线
OpenTelemetry并非可观测性的“神奇按钮”
OpenTelemetry 已成为 可观测性体验的重要组成部分,随着其持续发展,它日益满足开发人员和运维人员的 DevOps 需求。然而,作为当前的主要开源项目之一,它仍需完善。它的功能——虽然可以说对于可观测性来说已经必不可少——仍处于进行中,其成功取决于社区持续的支持和辛勤工作。它的实用性还取决于与 OpenTelemetry 结合使用的 可观测性 工具和平台。
云云众生s
2024/05/28
1960
OpenTelemetry并非可观测性的“神奇按钮”
使用 OpenTelemetry 和 SigNoz 实现 LLM 可观测性
在快速发展的大语言模型(LLM)世界中,确保最佳性能和可靠性比以往任何时候都更为关键。这就是'LLM 可观测性'的概念发挥作用的地方。这不仅仅是监控输出;更是深入洞察这些复杂系统内部运作的关键。
云云众生s
2024/03/28
6670
使用 OpenTelemetry 和 SigNoz 实现 LLM 可观测性
可观测性的新构件
可观测性领域是一个动态且异质的领域。在这个生态系统中,商业巨头如Datadog、New Relic和Splunk与大型OS/免费堆栈(如ELK、Prometheus/Loki/Grafana和TIG(Telegraf/InfluxDB/Grafana))共存。然而,在近年来,三种技术趋势汇聚在一起,重塑了这一格局,为基于新一代强大开源技术和标准构建的新堆栈铺平了道路。可观测性周期表中的三个新元素是:
云云众生s
2024/03/28
1810
OpenTelemetry Metrics路线图
在 OpenTelemetry 规范 v1.0 发布之后,我们现在把更多的精力放在了指标规范上。以下是我们到目前为止所取得的进展,以及接下来几个月将要完成的事情。
CNCF
2021/03/15
1.7K0
从 eBPF 到 CI/CD:可观测性的 12 个新兴趋势
面对新冠的全球大流行,随着企业上云和加速数字化转型以更好地为客户和员工服务,运营复杂性也随之增加。为了解开这些复杂性并让高管能够了解 IT 生态系统,业务领导者越来越多地将可观察性解决方案视为一项战略投资。
点火三周
2022/03/08
2.3K0
从 eBPF 到 CI/CD:可观测性的 12 个新兴趋势
推荐阅读
相关推荐
CI/CD可观测性:OpenTelemetry的全新机遇
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档