TL을 읽기 번역 쓰기, DR을 : 우리는 읽고 난 그 일반적으로 프로젝트에서 일하고 있어요 같은 HDF 에서 기록 DASK와 팬더 코드를 병렬화 문제가있는 읽기, 번역 (또는 데이터 결합) 및이 데이터 쓰기의 세 단계가 필요합니다. 맥락에서 우리는 의료 기록을 가지고 일하고 있으며, 다양한 형식의 주장을 받고이를 표준화 된 형식으로 번역 한 다음 디스크에
dask.delayed 작업이 주어지면 해당 작업에 대한 모든 입력 (부모)의 목록을 얻고 싶습니다. 예를 들어 , from dask import delayed
@delayed
def inc(x):
return x + 1
def inc_list(x):
return [inc(n) for n in x]
task = delayed(
dask에서 dask.array을 만드는 가장 효율적인 방법은 무엇입니까? 이 시리즈는 300 만 개 목록으로 구성되어 있습니다. 현재이 파티션은 500 개의 파티션으로 나뉩니다. 는 현재 내가 노력하고 있어요 :는 pt = [delayed(np.array)(y)
for y in
[delayed(list)(x)
for x i