2016-07-09 2 views
1

Flink (DataStream docs)에 DataStream에 대한 외부 조인이 없다는 것에 놀랐습니다. 대한Flink : DataStream에 외부 조인이 없습니까?

DataSet 모든 옵션이 있습니다 떨어져 일반 join (DataSet docs)에서 leftOuterJoin, rightOuterJoinfullOuterJoin을. 그러나 DataStream의 경우 일반 올드 조인 만 있습니다.

DataStream의 근본적인 속성 때문에 외부 조인이 불가능합니까? 아니면 우리는 가까운 미래에 이것을 기대할 수 있습니까?

내가 실제로 작업하고있는 문제에 대해 DataStream에서 외부 조인을 사용할 수 있습니다. 유사한 문제를 해결할 방법이 있습니까?

답변

0

DataStream.coGroup() 변환을 사용하여 외부 조인을 구현할 수 있습니다. CoGroupFunction은 특정 키의 모든 요소를 ​​제공하고 일치하는 요소가 없으면 비어있을 수있는 두 개의 반복자 (각 입력에 하나씩)를받습니다. 이를 통해 외부 조인 기능을 구현할 수 있습니다.

Flink의 다음 릴리스 중 하나에서 DataStream API에 외부 조인의 최우선 지원이 추가 될 수 있습니다. 나는 그런 노력을 지금 당분간 알지 못한다. 그러나 Apache Flink JIRA에 문제를 만들면 도움이 될 수 있습니다.

+0

좋아요, 문제가 생겼습니다. [jira] (https://issues.apache.org/jira/browse/FLINK-4188). 나는'coGroup'을 시도 할 것이다. :) – houcros