카프카 (Kafka)의 특정 주제에서 데이터를 소비하는 카프카 소비자 프로젝트가 있습니다. 레코드의 90 %는 처리 되 자마자 처리되지만 일부 레코드 (10 %)를 처리하는 지연이 있습니다.카프카 (Kafka) 두 개의 다른 체크 포인트가있는 한 명의 소비자
이러한 기록을 지연시켜야 기록을 커밋 할 수 없으므로 Kafka가 새 노드에 파티션을 재 할당 할 수 있습니다. 이를 방지하기 위해 동일한 주제를 두 번 읽고 두 번째 소비자에서 가져 오는 데이터 부분을 지연시킬 수는 있지만 두 번 더 직렬화가 필요하므로 오버 헤드가 발생합니다.
단일 소비자를 사용하지만 Kafka 소비자와 두 개의 별도 커밋이 가능합니까? 기본적으로 두 개의 서로 다른 소비자가 커밋 측면에서 비슷하지만 consumer.poll
이 단일 소비자로부터 호출되지만 각 일괄 처리에는 두 개의 consumer.commitSync
이 있습니다. 추가 비 직렬화 및 네트워크 비용을 피할 수 있도록 도와 드리겠습니다.
10 % 레코드를 별도의 주제로 넣을 수 있습니까? – amethystic
@amethystic 불행히도 없습니다. –