Dynatrace 使用 Davis® AI 简化了 StatsD、Telegraf 和 Prometheus 的可观测性

Andreas Lehofer

Michael Kopp
可观测能力 · 产品新闻
2020 年 10 月 7 日

Dynatrace 为您的所有自定义指标带来规模化、零配置、自动 AI 驱动警报和根本原因分析 - 现在包括开源可观测能力框架,如 StatsD、Telegraf 和 Prometheus。

我们很高兴地宣布,通过开放 Dynatrace OneAgent 进行自定义指标的集成,Dynatrace 已能够对关键指标自动发出警报,并且无需维护 StatsD、Telegraf 和 Prometheus 的本地配置——即使在包括数十万个实例和容器的最复杂环境中。此外,Dynatrace 还引入了企业级安全功能和加密技术。

同时,您现在只需轻按一个开关即可开始体验可观测性,将来自这些工具的数据导入到 Dynatrace 平台,保住您的投资并可通过使用 Dynatrace 获得价值提升。

Tools into the Dynatrace platform

自动将开源指标源映射到我们的 Smartscape 模型用于 AI 分析

通过此次发布,Dynatrace 将其 AI 引擎的价值、Dynatrace OneAgent 的规模、安全性和自动化以及我们平台(可处理 50,000 台主机)的规模引入开源技术,相辅相成,至臻完美。

我们刚刚利用开放指标 API 增强了Dynatrace OneAgent。我们还启用了 Dynatrace OneAgent 作为 StatsD 的无缝替代品。为了证明其价值,我们添加了与 Telegraf 的集成,这使您可以从 Telegraf 提供的企业规模的 200 多个插件中受益。通过将这些捕获的指标自动输入我们的 Smartscape 拓扑模型Davis AI,借助于我们真实可信的自适应基线引擎,我们消除了数百个手动维护需求。

Dynatrace 解锁了 200 多项新技术集成

Dynatrace 软件智能平台已扩展到提取第三方指标,以下是您现在可以实现的目标快速概览。请继续关注即将发布的博客系列,我们将为您提供更多实践演练,让您了解如何从StatsD,Telegraf, Prometheus、脚本语言、或我们的集成 REST API 中提取任何类型的数据。

Davis AI 分析您的 StatsD 指标

StatsD是一种广泛采用的指标协议,用于收集、聚合开发者定义的应用指标并将其发送到单独的系统进行图形分析。

借助我们新的 DynatraceStatsD 协议,Dynatrace OneAgent 现在支持 StatsD,并为您提供一种将现有指标源引入 Dynatrace 平台的供应商中立方式。此外,Dynatrace 将这些指标完全集成到 Smartscape 中。所以您从一开始就得到自定义指标的自适应基线和 Davis 自动根本原因分析。通过这种方式,Dynatrace 将AIOps 带入了 StatsD。

对通过安全本地 REST API 提取的外部指标进行多维分析

虽然 StatsD 协议简单且使用广泛,但并非适用于所有组织。例如,StatsD 不支持维度和标记。当今的许多指标库,例如Spring micrometer, Dropwizard, 或 OpenMetrics 支持此类标签,而 StatsD 不支持这些标签。

为了解决这个问题,我们向 OneAgent 添加了一个新的基于线路协议的 REST API,以便充分利用 Dynatrace Smartscape 支持全部的多维指标。一旦您通过 OneAgent REST API 发送指标,相关主机就会自动丰富所有可用的监控维度。由于该方法基于 HTTP,因此您可以在任何地方使用它。由于这是 OneAgent 的一部分,您不必担心规模、加密、防火墙,甚至不必担心指标应该发送到何处进行分析——OneAgent 会为您处理所有这些问题。

该功能对于需要将可操作的性能和业务指标集成到 Dynatrace 软件智能平台的应用所有者最为有用。

通过简单的线路协议从 Bash 和 PowerShell 等脚本语言中提取和分析指标

StatsD 和 REST API 都非常适合集成到应用或现有后端服务中。然而,现网站可靠性工程师和运营团队通常对可通过命令行工具轻松获得的指标感兴趣,他们希望通过 Bash 或其他脚本语言(如 PowerShell 或 Cronjob)监测这些指标。

您现在可以使用 Dynatrace 脚本集成从这些来源中提取和分析指标。由于集成所采用的机制与上述用于 REST 和 StatsD 的相同,您可以使用它在同一位置绘制所有指标的图表,包括所有新引入的指标维度。我们的脚本集成采用与 REST API 相同的线路协议,因此是完全多维和 Smartscape 感知的。

有了这项触手可及的功能,网站可靠性工程师和运营团队现在可以将他们现有的知识和工具集与 Dynatrace 结合使用。这些团队确切地知道他们需要什么来运行他们的应用和服务,但他们也需要能够事半功倍。Dynatrace 可以自动执行观察和分析传入数据点的关键步骤。这意味着网站可靠性工程师和运营团队可以比以前更轻松地分析更多数据。

自动分析数百个 Telegraf 提供的数据并获得准确答案

TelegrafInfluxdata的开源代理。Telegraf 是一个基于插件的系统,用于收集、处理、聚合和写入指标。

由于 Telegraf 只关心以正确的形式将数据发送到某个地方,因此客户需要一种简单的方法来实时分析混乱数据并从 Telegraf 获得具有可操作性的建议。这是 Dynatrace 平台的工作。

通过向 Telegraf 添加 Dynatrace 支持,您现在可以将智能可观测能力自动根本原因分析用于 200 多种技术。您的数据将在 Dynatrace 平台和 OneAgent 支持的所有其他来源的背景信息中进行分析。这意味着您将自动看到一切是如何连接的——应用环境中每一层、组件和代码段之间的关系和相互依赖性。为此,Dynatrace 现在可作为后端的输出插件。

您需要做的就是将 Telegraf 与 Dynatrace OneAgent 一起安装并启用新的 Dynatrace 输出插件。通过这种方式,您可以轻松地将 200 个附加插件添加到您的数据分析中。

面向 Kubernetes 的可扩展且简单的 Prometheus 支持

Prometheus现在是Kubernetes空间的主要指标提供者和接收器。然而,许多客户都在为 Prometheus 提供的大量数据而苦恼,无论是在扩展 Prometheus 基础设施还是生产和维护其价值方面。毕竟,目标不是数据本身;目标是数据带来的可观测能力、它产生的警报以及它可以揭示的答案。

Dynatrace 现在为这一挑战提供了直接的解决方案。Dynatrace 通过直接自动从指标导出器提供 Prometheus 数据,解决了可扩展性问题。Dynatrace 不仅不会给 Prometheus 服务器带来压力,Dynatrace 本身也不需要服务器来为从您在 Kubernetes 中运行的所有支持服务或应用中提取的指标产生价值。此外,Dynatrace 将 Kubernetes pod 嵌入到更大的环境背景信息中,从而将 Prometheus 指标置于背景信息中,使您能够专注于重要的事情,获得您的应用和支持服务所需的答案和警报,而无需维护数百个不同的警报配置或不断调整监控解决方案以适应 Kubernetes 内运行的应用不断变化的拓扑结构。

自动和智能可观测能力通过 OpenTelemetry 指标为 Go 应用提供支持

OpenTelemetry现在无处不在,大多数人都在谈论它支持分布式跟踪,但许多客户使用它来获取应用中的指标。Dynatrace 正在开发一个 OpenTelemetry 指标导出器,它可以自动利用由 OpenTelemetry 插装公开的指标,将远程监测数据发送到 Dynatrace 分析引擎。敬请关注。

结束语

Dynatrace 不仅监测从主机到云的所有内容,它还围绕可观测能力的重要内容进行设计:跟踪、指标、事件和日志。Dynatrace 的独特之处在于它将指标提取与跨所有主机、进程、服务、pod、容器、云等的自动拓扑发现相结合。上述过程都是实时的。

Dynatrace OneAgent现在通过与 StatsD 和 Telegraf 指标的无缝自动安全集成来实现该价值。通过添加安全的本地 REST API,我们很快就会将其引入其他开源指标提供者,例如 Spring Micrometer 或 OpenTelemetry 指标。

Dynatrace 能够了解依赖关系、流量和交易流以及它们随时间变化的规律。我们的确定性 AI 为出现的任何问题提供影响和根本原因分析,而不仅仅是简单的警报。通过采用开源技术,我们也开放了Smartscape 拓扑Davis AI engines 以便您可以充分利用 Dynatrace 分析所有数据源。

眼见为实
刚接触 Dynatrace?现在免费尝试一下。已经是客户?进入您的帐户,体验 Dynatrace 如何帮助您从 Prometheus 和 StatsD 投资中获得最大收益。

下一步是什么

我们将为其他开源框架添加 Dynatrace 支持。下一个是 Spring micrometer,它已经支持 Dynatrace。我们将对其进行增强,使其能够充分利用我们内置的 OneAgent 多维指标 API。

Michael Kopp

The Author


Those who know me know that I'm passionate about 3 things: rock climbing, physics, and performance. I've worked in performance monitoring and optimizations in enterprise environments for the better part of the last 10 years. Now as a Product Manager I am doing my best to build those experiences into Dynatrace.