Files
KnowStreaming/docs/dev_guide/健康巡检.md
2022-08-18 17:04:05 +08:00

1.1 KiB
Raw Blame History

Logo

健康巡检

1、前言


2、已有巡检

2.1、Cluster健康巡检(1个)

2.1.1、集群Controller数错误

说明

  • 集群Controller数不等于1表明集群集群无Controller或者出现了多个Controller

配置


2.2、Broker健康巡检(2个)

2.2.1、Broker-RequestQueueSize被打满

说明

  • Broker的RequestQueueSize被打满

配置


2.2.2、Broker-NetworkProcessorAvgIdle过低

说明

  • Broker的NetworkProcessorAvgIdle指标当前过低

配置


2.3、Topic健康巡检(2个)

2.3.1、Topic 无Leader数

说明

  • 当前Topic的无Leader分区数超过一定值

配置

2.3.1、Topic 长期处于未同步状态

说明

  • 指定的一段时间内Topic一直处于未同步的状态

配置


2.4、Group健康巡检(1个)

2.4.1、Group Re-Balance太频繁

说明

  • 指定的一段时间内Group Re-Balance的次数是否过多

配置


3、自定义增强

如何增加想要的巡检?