2017-11-03 4 views
0

데이터 흐름/빔에서 Python SDK를 사용하여 PCollection에있는 항목의 샘플을 가져 오려고합니다.Dataflow/Beam with Python

설명되어 있지는 않지만 Sample.FixedSizeGlobally(n)이 있습니다.

테스트, 그것은 는 단일 항목과 PCollection에게 돌아 보인다 때 : 오히려 샘플과 PCollection보다, 샘플을 포함하는 목록을. 그 맞습니까?

이 단일 항목을 PCollection으로 바꾸는 가장 좋은 방법은 항목의 PCollection입니까?

| Sample.FixedSizeGlobally(sample_size) 
| beam.FlatMap(lambda x: x) 
+0

네, 그게 최선의 방법입니다. 자신을 알아 냈으니 대답으로 추가해야합니다.) – Pablo

+0

OK. 감사합니다. @pablo Beam Gods가 파이썬에 샘플을 축복 할 수 있습니까? 그리고 이것들에 대한 문서가 있습니까? – Maximilian

+0

문서가 부족하여 죄송합니다. 우리가 해결할 것입니다! 샘플 - 뭐라 구요? – Pablo

답변

1

현재 예. Sample.FixedSizeGlobally() 변환은 단일 목록 요소를 사용하여 PCollection을 반환합니다. 당신이 말한 것처럼 당신은 하나의 요소 PCollection으로 바꿀 수 있습니다

Sample.FixedSizeGlobally(sample_size) 
| beam.FlatMap(lambda x: x) 

우리는 PC-PC 변환을 추가해야합니다 것입니다 - 그리고 우리는 또한 빔로 기여 환영합니다 :)를 - 그러나 한편에서, 그게 우리가 가진거야.