Files
KnowStreaming/docs/user_guide/faq.md
2021-05-27 12:06:51 +08:00

9.3 KiB
Raw Blame History


kafka-manager-logo

一站式Apache Kafka集群指标监控与运维管控平台


FAQ

  • 0、支持哪些Kafka版本
  • 1、Topic申请、新建监控告警等操作时没有可选择的集群
  • 2、逻辑集群 & Region的用途
  • 3、登录失败
  • 4、页面流量信息等无数据
  • 5、如何对接夜莺的监控告警功能
  • 6、如何使用MySQL 8
  • 7、Jmx连接失败如何解决?
  • 8、topic biz data not exist错误及处理方式
  • 9、进程启动后如何查看API文档
  • 10、如何创建告警组
  • 11、连接信息、耗时信息、磁盘信息为什么没有数据
  • 12、逻辑集群申请审批通过之后为什么看不到逻辑集群
  • 13、heartbeat表关联业务和使用场景是什么
  • 14、集群的删除是否会真正的删除集群
  • 15、APP(应用)如何被使用起来?
  • 16、为什么下线应用提示operation forbidden
  • 17、删除Topic成功为什么过一会儿之后又出现了
  • 18、如何在不登录的情况下调用一些需要登录的接口
  • 19、为什么无法看到连接信息、耗时信息等指标
  • 20、Appid鉴权、生产消费配额不起作用

0、支持哪些Kafka版本

基本上只要所使用的Kafka还依赖于Zookeeper那么该版本的主要功能基本上应该就是支持的。


1、Topic申请、新建监控告警等操作时没有可选择的集群

缺少逻辑集群导致的在Topic管理、监控告警、集群管理这三个Tab下面都是普通用户视角普通用户看到的集群都是逻辑集群因此在这三个Tab下进行操作时都需要有逻辑集群。

逻辑集群的创建参看:


2、逻辑集群 & Region的用途

主要用途是进行大集群的管理 & 集群细节的屏蔽。

  • 逻辑集群通过逻辑集群概念将集群Broker按业务进行归类方便管理
  • Region通过引入Region同时Topic按Region纬度创建减少Broker间的连接

3、登录失败

  • 检查使用的MySQL版本8.0等版本暂不支持,具体版本辛苦查看 README 。

4、页面流量信息等无数据

  • 1、检查Broker JMX是否正确开启。

如若还未开启,具体可百度一下看如何开启,或者参看:Jmx连接配置&问题解决说明文档

helpcenter

  • 2、MySQL的版本是否过高。

建议使用MySQL 5.7版本。

  • 3、数据库时区问题。

检查MySQL的cluster表的gmt_modify字段做一个update动作看这个gmt_modify时间是否是当前时间如果不是那么就是时区问题了。时区不对问题具体可以搜索一下看如何解决。


5、如何对接夜莺的监控告警功能


6、如何使用MySQL 8


7、Jmx连接失败如何解决?


8、topic biz data not exist错误及处理方式

错误原因

在进行权限审批的时候可能会出现这个错误出现这个错误的原因是因为Topic相关的业务信息没有在DB中存储或者更具体的说就是该Topic不属于任何应用导致的只需要将这些无主的Topic挂在某个应用下面即可。

解决方式

可以在运维管控->集群列表->Topic信息下面编辑申请权限的Topic为Topic选择一个应用即可。

以上仅仅只是针对单个Topic的场景如果你有非常多的Topic需要进行初始化的那么此时可以在配置管理中增加一个配置来定时的对无主的Topic进行同步具体见动态配置管理 - 1、Topic定时同步任务


9、进程启动后如何查看API文档

  • 滴滴Logi-KafkaManager采用Swagger-API工具记录API文档。Swagger-API地址 http://IP:PORT/swagger-ui.html#/

10、如何创建告警组

告警组的创建需要到Logi-KM对接的监控系统中创建比如我们现在默认是对接了夜莺那么告警组需要到夜莺中创建如果没有安装夜莺那么需要安装一下夜莺并进行对接。当然这里也可以对接自己内部的监控系统不过需要实现一些接口。

具体的文档可见:监控功能对接夜莺监控功能对接其他系统

那么在夜莺中,如何创建告警组呢? 需要前往夜莺平台-用户资源中心-团队管理中新建团队。新建过团队之后再次回到Logi-KM中刷新页面就可以在该下拉框中选择告警接收组了。

11、连接信息、耗时信息、磁盘信息为什么没有数据

这块需要结合滴滴内部的kafka-gateway一同使用才会有数据滴滴kafka-gateway暂未开源。

12、逻辑集群申请审批通过之后为什么看不到逻辑集群

逻辑集群的申请与审批仅仅只是一个工单流程,并不会去实际创建逻辑集群,逻辑集群的创建还需要手动去创建。

具体的操作可见:kafka-manager 接入集群

13、heartbeat表关联业务和使用场景是什么

做任务抢占用的。

KM支持HA的方式部署那么部署多台的时候就会出现每一台都可能去做指标收集的事情这块就使用heartbeat表做KM的存活性判断然后进行任务的抢占或者是均衡。

更多详细的内容可以看一下源码中heartbeat表在哪里被使用了。

14、集群的删除是否会真正的删除集群

Logi-KM的运维管控集群列表中的集群删除仅仅只是将该集群从Logi-KM中进行删除并不会对真正的物理集群做什么操作。

15、APP(应用)如何被使用起来?

app在Logi-KM中可以近似理解为租户或者是kafka里面的一个账号的概念。

界面中显示的app信息、权限信息等在平台层面仅仅只是控制Topic或集群在平台上的可见性如果使用的是社区版本的Kafka那么实际上是不能真正的管控到客户端对Topic的生产和消费。

但是如果是使用的滴滴的Kafka-Gateway那么是可以做到对客户端的生产和消费的权限管控。滴滴的Kafka-Gateway暂未开源属于企业服务具体的可以入群交流群地址在README中。

16、为什么下线应用提示operation forbidden

原因一:

该应用还存在对Topic的权限因此导致下线失败。具体查看的位置在"Topic管理-》应用管理-》详情"可以看到应用对哪些Topic还有权限。

只有当权限全部去除之后,才可以下线应用。

原因二:

使用的是2.4.0之前的旧版本旧版本存在缓存更新的BUG建议升级至最新的版本或者简单粗暴的就是重启一下KM。

17、删除Topic成功为什么过一会儿之后又出现了

原因说明:

Logi-KM会去请求Topic的endoffset信息要获取这个信息就需要发送metadata请求发送metadata请求的时候如果集群允许自动创建Topic那么当Topic不存在时就会自动将该Topic创建出来。

问题解决:

因为在Logi-KM上禁止Kafka客户端内部元信息获取这个动作非常的难做到因此短时间内这个问题不好从Logi-KM上解决。

当然对于不存在的TopicLogi-KM是不会进行元信息请求的因此也不用担心会莫名其妙的创建一个Topic出来。

但是另外一点对于开启允许Topic自动创建的集群建议是关闭该功能开启是非常危险的如果关闭之后Logi-KM也不会有这个问题。

最后这里举个开启这个配置后,非常危险的代码例子吧:

for (int i= 0; i < 100000; ++i) {
    // 如果是客户端类似这样写的那么一启动那么将创建10万个Topic出来集群元信息瞬间爆炸controller可能就不可服务了。
    producer.send(new ProducerRecord<String, String>("logi_km" + i,"hello logi_km"));
}

18、如何在不登录的情况下调用一些需要登录的接口

具体见:登录绕过

19、为什么无法看到连接信息、耗时信息等指标

连接信息、耗时信息等指标是依赖于滴滴kafka-gateway是属于商业版的范畴暂未开源。如有需要可进行商业合作。

具体见:滴滴Logi-KafkaManager开源版和商业版特性对比

20、Appid鉴权、生产消费配额不起作用

Appid鉴权、生产消费配额是依赖于滴滴kafka-gateway是属于商业版的范畴暂未开源。如有需要可进行商业合作。

具体见:滴滴Logi-KafkaManager开源版和商业版特性对比