Kafka 스트림 또는 Kafka 소비자 API 또는 Kafka 연결에 대한 내게 가장 좋은 것이 무엇인지 알고 싶습니다.무엇을 사용해야합니까 : Kafka Stream 또는 Kafka 소비자 API 또는 Kafka 연결
주제에서 데이터를 읽은 다음 일부 처리를 수행하고 데이터베이스에 쓰기를 원합니다. 그래서 나는 소비자를 만들었지 만 Kafka 스트림 어플리케이션을 작성하고 변경을 수행하고 내 소비자 코드를 제거하고 db 코드를 작성해야하는 데이터베이스에 그것을 쓰는 Stateful 프로세서를 사용할 수 있다고 생각합니다. 내 기록을 삽입 할
데이터베이스는 다음과 같습니다 HDFS - (원시 JSON을 삽입) MSSQL이 - (처리 JSON)
또 다른 옵션은 카프카가 연결되어 있지만 내가 찾은의 어떠한 JSON 지원은 이제 없다 hdfs 싱크 및 jdbc 싱크 커넥터. (나는 avro로 쓰고 싶지 않다.) 그리고 스키마를 생성하는 것은 복잡한 중첩 된 메시지의 고통이다.
또는 사용자 정의 Kafka를 작성하여 연결해야합니다.
Kafka 소비자 또는 Kafka 스트림이나 Kafka를 연결해야하는지에 대한 의견이 필요합니까? 성능면에서 무엇이 좋고 오버 헤드가 적습니까?
내가 시도 HDFS는 JSON에 대한 싱크하지만 ** org.apache을 사용할 수없는 볼 수 있습니다 브로 사용하도록 강요하지 않습니다. kafka.connect.json.JsonConverter **하지만 ** org.apache.kafka.connect.storage.StringConverter ** 작동하지만 문자열 이스케이프 형식으로 json 객체를 작성합니다. 예를 들어. ** { "name": "hello"} ** ** "{\"name \ ": \"hello \ "}"로 hdfs로 작성되었습니다 ** ** –
그래서 나는 동일한 쓰기를 제안 할 사람이 필요합니다 kafka 소비자 또는 kafka 스트림 또는 사용자 정의 kafka 연결. –
기본 검증과 몇 가지 필드 값 변환이 필요합니다. –