什么？你告诉我 Kafka 会丢消息？-编程学习网

许多开发人员普遍认为，Kafka 的设计本身就能保证不会丢失消息。然而，Kafka 架构和配置的细微差别会导致消息的丢失。我们需要了解它如何以及何时可能丢失消息，并防止此类情况的发生。

下图显示了消息在 Kafka 的生命周期中可能丢失的场景。

图片

01 生产者（Producer）

当我们调用 producer.send() 发送消息时，消息不会直接发送到代理。

消息发送过程涉及两个线程和一个队列：

应用程序线程
消息累加器
发送线程（I/O 线程）

我们需要为生产者配置适当的 "acks "和 "retries"，以确保消息被发送到代理。

02 消息代理（Broker）

当代理集群正常运行时，它不应该丢失消息。但是，我们需要了解哪些极端情况可能会导致消息丢失：

为了提高 I/O 吞吐量，消息通常会异步刷到磁盘上，因此如果实例在刷新之前宕机，消息就会丢失。
Kafka 集群中的副本需要正确配置，以保持数据的有效副本。数据同步的确定性非常重要。

03 消费者（Consumer）

Kafka 提供了不同的提交消息的方式。自动提交可能会在实际处理记录之前确认对记录的处理。当消费者在处理过程中宕机时，有些记录可能永远不会被处理。

一个好的做法是将同步提交和异步提交结合起来，在处理消息的循环中使用异步提交以提高吞吐量，在异常处理中使用同步提交以确保最后的偏移始终被提交。

下图是这个方法的伪代码：

try {
    while (true) {
    ConsumerRecords records = consumer.poll(Duration.ofMillis(1000));

    for (ConsumerRecord record : records) {
        // process records one by one
    }

    consumer.commitAsync();
    }
} catch (Exception e){
    // exception handling 
} finally {
    try {
        consumer.commitSync();
    } finally {
        consumer.close();
    }      
}

文章详情

什么？你告诉我 Kafka 会丢消息？

01 生产者（Producer）

02 消息代理（Broker）

03 消费者（Consumer）

软考中级精品资料免费领

相关文章

猜你喜欢

什么？你告诉我 Kafka 会丢消息？

MQ为什么会丢消息？如何保证不丢失消息

我认为 Web3 是什么？让我来告诉你！

4 张图，9 个维度告诉你怎么做能确保 RocketMQ 不丢失消息

Build 2015大会是微软告诉我们的10件事是什么

应用程序安全性状态：统计数据会告诉我们什么

我试图通过这篇文章告诉你，什么是神奇的泛化调用

让我来告诉你，C# 线程本地存储为什么线程间值不一样

为什么我不推荐你使用RabbitMQ的消息转换功能

一文告诉你为什么代码提交要关联需求和任务信息

面试官问我：什么是消息队列？什么场景需要他？用了会出现什么问题？

为什么消息会重复消费，我从RocketMQ源码中扒出了7种原因，有点小坑

为什么你需要打包 ASP 日志？这篇文章会告诉你如何运用自然语言处理技巧。