一、找到部署机器ip 二、排查问题 1、测试环境不能用topic能用,tcp报错如下图 (1)验证kafka是否可用 开启一个生产者和消费者查看kafka是否正常,如下 路径:cd /usr/local/kafka/1/bin 生产者:sh kafka-console-producer.sh --broker-list 10.30.200.155:15386 --topic CAR_NEARBY_DRIVER 消费者:sh kafka-cons...
Kafka重复消费问题通常是由于消息被多次消费或者消息被消费后未被正确处理导致的。以下是一些排查Kafka重复消费问题的步骤: 检查Kafka消费者代码:查看消费者代码是否存在多线程并发消费的情况,或者是否存在异常处理不当导致消费者重启并重新消费消息的问题。 检查Kafka配置:检查Kafka的配置,如消费者组ID、偏移量提交策略等是...
kafka问题的一次不负责任排查 2022的第一篇文章,分享总结下一个kafka问题的排查过程。 【问题现象】 元旦前,某测试环境因为网络不稳定,出现了kafka与zookeeper连接断开后,没有重连。 【问题定位】 初步查看了下日志,发现kafka与zookeeper之间出现了会话超时,第一次超时有正确进行重连,之后再次出现会话超时,在这之后就没...
Kafka 线上问题 订单宽表数据不同步 事情的起因是用户在 app 上查不到订单了,而订单数据是从 mysql 的 order_search 表查询的,order_search 表的数据是从 oracle 的 order 表同步过来的,查不到说明同步有问题 首先重启,同步数据,问题解决,然后查找原因。首先看日志,有如下两种情况 有的容器消费消息的日志正常打...
我们有一个flink任务,消费的kafka的数据,写入到es,非常简单的逻辑,但是出现了数据丢失的情况,之前没遇到过,初步猜想是转换逻辑或脏数据的影响,排查了一圈,未发现Exception等相关信息。猜想是写入频率太快,es写入的时候,出现了version conflict,也没找到相关证据。
【kafka运维】副本扩缩容、数据迁移、副本重分配、副本跨路径迁移 Kafka的灵魂伴侣Logi-KafkaManger(4)之运维管控–集群运维(数据迁移和集群在线升级) 如果你不想费那个精力,那直接看下面我画的这张图,你自己也能分析出来可能出现的问题;以及怎么排查 ...
本章节主要描述Kafka连接问题的排查和解决。 检查网络 在连接Kafka实例前,需要确保客户端与Kafka实例之间可以相互连接,如果无法连接,建议先检查网络连接是否正常。 已开启sasl_ssl访问的Kafka实例为例,执行如下命令: curl -kv {ip}:{port} 网络正常,如下: ...
kafka 的⽇常消息⽣产量在 260w/min。但是看 kafka 监控发现消费量只有180w/min。也就是说每分钟会堆积近 100w 条消息,积累了⼀段时间后,kafka 中堆积的数据量达到数亿条。kafka 消息⽣产消费监控 问题分析:经过电话沟通后,拿到了客户的 logstash 配置如下:logstash.conf 1.input{ 2.kafka{ 3.bo...
一次kafka 消息堆积问题排查 收到某业务组的小伙伴发来的反馈,具体问题如下: 项目中某kafka消息组消费特别慢,有时候在 kafka-manager 控制台看到有些消费者已被踢出消费组。 从服务端日志看到如下信息: 该消费组在短时间内重平衡了 600 多次。 从cat 查看得知,每条消息处理都会有 4 次数据库的交互,经过一番...
Kafka 常见问题及排查该如何进行?1. 报错“TimeoutException(Java)”或“run out of brokers(Go)”或“Authentication failed for user(Python)” 首先,请确保 servers 配置正确,然后通过 ping 以及 telnet 排除网络问题。假设网络运行正常,云上 Kafka 在建立连接时,会对客户端进行鉴权。鉴权方式(sasl_mechanism)...