Files
KnowStreaming/docs/dev_guide/如何增加上报监控系统指标.md
2021-11-16 22:20:35 +08:00

2.1 KiB
Raw Permalink Blame History


kafka-manager-logo

一站式Apache Kafka集群指标监控与运维管控平台


如何增加上报监控系统指标?

0、前言

LogiKM是 一站式Apache Kafka集群指标监控与运维管控平台 当前会将消费LagTopic流量等指标上报到监控系统中从而方便用户在监控系统中对这些指标配置监控告警规则进而达到监控自身客户端是否正常的目的。

那么如果我们想增加一个新的监控指标应该如何做呢比如我们想监控Broker的流量监控Broker的存活信息监控集群Controller个数等等。

在具体介绍之前我们大家都知道Kafka监控相关的信息基本都存储于Broker、Jmx以及ZK中。当前LogiKM也已经具备从这三个地方获取数据的基本能力因此基于LogiKM我们再获取其他指标总体上还是非常方便的。

这里我们就以已经获取到的Topic流量信息为例看LogiKM如何实现Topic指标的获取并上报的。


1、确定指标位置

基于对Kafka的了解我们知道Topic流量信息这个指标是存储于Jmx中的因此我们需要从Jmx中获取。大家如果对于自己所需要获取的指标存储在何处不太清楚的可以加入我们维护的Kafka中文社区(README中有二维码)中今天沟通交流。


2、指标获取

Topic流量指标的获取详细见图中说明。

Topic流量指标采集说明


3、指标上报

上一步我们已经采集到Topic流量指标了下一步就是将该指标上报到监控系统这块只需要按照监控系统要求的格式将数据上报即可。

LogiKM中有一个monitor模块具体的如下图所示

指标上报

4、补充说明

监控系统对接的相关内容见:

监控系统集成

监控系统集成例子——集成夜莺