데이터 스트림 당 여러 개의 데이터 스트림과 여러 연산자를 처리 할 때 Flink의 런타임 측면을 이해하려고합니다.아파치에서 데이터 스트림/연산자와 스레드 사이의 상관 관계 flink
사용 사례 : 단일 플립 크 작업 (각각의 데이터 스트림은 서로 다른 시간 대기 시간을 갖는 하나의 장치를 나타내는 각각의 데이터 스트림)에서 N 개의 데이터 스트림으로 구성되며 각각의 데이터 스트림은 두 개의 스트림으로 분할됩니다.이 중 하나는 CEP 연산자 및 프로세스 함수로 변환합니다.
질문 : 런타임시
- 는, 엔진이 데이터 스트림 당 하나 개의 스레드를 만들 것인가? 또는 연산자 당 하나의 스레드?
- 작업이 시작될 때 런타임에 동적으로 데이터 스트림을 만들 수 있습니까? (예 : 작업이 시작될 때 파일에서 N을 읽고 해당 N 스트림을 작성해야하는 경우)
- N 파티션과 달리 많은 스트림 (N ~ 10000)이 작성되면 특정 성능에 영향이 있습니까? 단일 스트림 내에서?