과학 컴퓨팅 프로젝트 (확률 론적 행주 기법 described here 일 수 있음)를 듣고 현재 조사원이 50 개 노드 클러스터에서 4 개월이 걸릴 것이라고 조사하면 조사관이 나에게 요청했습니다. 다른 옵션을 검토하십시오. 이 프로젝트는 현재 병렬 파이썬을 사용하여 4d 어레이 청크를 여러 클러스터 노드에 분배하고 처리 된 청크를 다시 함께 배치합니다.병렬 Python 코드를 클라우드로 이동
현재 작업하고있는 작업은 너무 거칠게 처리되어 있습니다 (5 초에서 10 분, 병렬 파이썬에서 시간 초과 기본값을 늘려야 함). 프로세스 속도를 2-4 (데이터를 분할하고 다시 함께 사용하는 것은 너무 오래 걸리며 병렬화되어야합니다). 대부분의 작업은 numpy 배열로 수행됩니다.
2-4 번으로 충분하지 않다고 가정하고 로컬 하드웨어에서 코드를 가져 오기로 결정했습니다. 이와 같은 높은 처리량 컴퓨팅의 경우 상용 옵션은 무엇이며 코드를 수정해야합니까?
또는 암시 적으로 누가이 정보를 이미 작성했으며 어떻게 얻을 수 있습니까? – Thomas