나는 DataStream
을 가지고 있으며 그것에 창 집계를 계산해야합니다. 일반 창 집계를 수행 할 때 네트워크 IO가 매우 높습니다. 그래서 네트워크 IO를 줄이기 위해 로컬 사전 집계를 수행하고 싶습니다.Apache Flink : 로컬 사전 집계를 사용하여 창을 계산하려면 어떻게해야합니까?
작업 관리자에서 로컬로 사전 집계 (즉, 레코드를 셔플 링하기 전에) 한 다음 전체 집계를 수행 할 수 있는지 궁금합니다. Flink의 DataStream API로 이것이 가능합니까?
내 코드는 다음과 같습니다
DataStream<String> dataIn = ....
dataIn
.map().filter().assignTimestampsAndWatermarks()
.keyBy().window().fold()
감사합니다. Fabian – Chen