0
dask에서 dask.array
을 만드는 가장 효율적인 방법은 무엇입니까? 이 시리즈는 300 만 개 목록으로 구성되어 있습니다. 현재이 파티션은 500 개의 파티션으로 나뉩니다. 는 현재 내가 노력하고 있어요 :은 dask에서 효율적으로 dask.array를 만듭니다. 목록의 계열
pt = [delayed(np.array)(y)
for y in
[delayed(list)(x)
for x in series.to_delayed()]]
da = delayed(dask.array.concatenate)(pt, axis=1)
da = dask.array.from_delayed(da, (vec.size.compute(), 300), dtype=float)
아이디어는 dask.array
에 함께 사람들을 nupy 배열로 각 파티션을 변환하고 바느질하는 것입니다. 이 코드는 계속 실행됩니다. 충분한 데이터가있는 한 순식간에이 데이터에서이 데이터로 빠르게 배열을 만들 수 있습니다.