다음 작업을 수행 할 것 Google 클라우드 데이터 흐름의 파이프 라인 구축을 위해 노력하고있는 파일에서 읽기 :Google 클라우드 데이터 흐름 : 동적 파일 이름
- 이 Pubsub 가입에 대한 이벤트를 수신을
- 은에서 파일 이름을 추출 이벤트 텍스트
- (Google 클라우드 스토리지 버킷에서) 파일을 읽어
의 BigQuery에서
Pipeline pipeline = //create pipeline
pipeline.apply("read events", PubsubIO.readStrings().fromSubscription("sub"))
.apply("Deserialise events", //Code that produces ParDo.SingleOutput<String, KV<String, byte[]>>)
.apply(TextIO.read().from(""))???
나는 3 단계를 고민하고있다 : 다음은 코드입니다. 다음을 생성하는 코드를 작성하려고 시도했습니다.
그러나 후속 단계에서 파일 내용을 읽을 수 없습니다.
누구나 제 3 단계 및 4 단계에서 작성해야 파일을 한 줄씩 소비하여 BigQuery에 출력하거나 저장할 수 있습니다.
참조하는 메서드가 존재하지 않습니다. TextIO.read(). from()은 String 또는 ValueProvider에만 적용됩니다. write()의보다 동적 인 메소드와 혼동했을 수도있다. –
jkff