Мы получаем случайные NetworkExceptions
и TimeoutExceptions
в нашей производственной среде:
Brokers: 3
Zookeepers: 3
Servers: 3
Kafka: 0.10.0.1
Zookeeeper: 3.4.3
Мы иногда получаем это исключение в моих журналах производителей:
Истекает 10 записей для TOPIC: XXXXXX: 5608 мс прошло с момента выпуска создание плюс время ожидания.
Количество миллисекунд в таких сообщениях об ошибках продолжает меняться. Иногда его ~ 5 секунд в других случаях это до ~ 13 секунд!
И очень редко мы получаем:
NetworkException: Server disconnected before response received.
Кластер состоит из брокеров 3 и 3 zookeepers. Сервер производителей и кластер Kafka находятся в одной сети.
Я делаю синхронные вызовы. Там есть веб-служба, к которой обращаются несколько пользовательских запросов на отправку своих данных. Веб-сервис Kafka имеет один объект-производитель, который выполняет всю отправку. Время ожидания запроса производителя составляло 1000 мс, которое было изменено на 15000 мс (15 секунд). Даже после увеличения периода ожидания TimeoutExceptions
все еще отображаются в журналах ошибок.
В чем может быть причина?