카프카를 사용하여 로그 이벤트를 처리하고 있습니다. 나는 간단한 커넥터와 스트림 변환을위한 Kafka Connect와 Kafka Streams에 대한 기본적인 지식을 가지고 있습니다.Kafka는 결합 된 로그 이벤트에 단일 로그 이벤트 라인을 집계합니다.
이제 I는 다음과 같은 구조의 로그 파일을 가지고
timestamp event_id event
로그의 이벤트 EVENT_ID로 연결된 복수의 기록 라인 (예를 들면 메일 로그)
예 가지고
을Examp :
1234 1 START
1235 1 INFO1
1236 1 INFO2
1237 1 END
그리고 일반적으로 는 여러 개의 이벤트가 있습니다 le :
1234 1 START
1234 2 START
1235 1 INFO1
1236 1 INFO2
1236 2 INFO3
1237 1 END
1237 2 END
시간 창 (START와 END 사이)은 최대 5 분이 될 수 있습니다.
은 결과적으로 내가 원하는
event_id combined_log
예와 같은 주제 :
1 START,INFO1,INFO2,END
2 START,INFO2,END
이를 달성 할 수있는 적절한 도구가 무엇입니까? 나는 카프카 스트림으로 그것을 풀려고했지만 어떻게 생각해 낼 수 있습니다.
답변 주셔서 감사합니다. 프로세서 API를 살펴 보겠습니다. 주문 문제도 고려해야합니다. – imehl
프로세서 API가 해결책입니다 - 다시 한 번 감사드립니다! – imehl
@imehl : 어쩌면 해결책을 찾았을 때 실제로 문제를 해결하기 위해 한 일에 대한 정보로 위의 질문을 업데이트하고 싶습니까? –