MPI 응용 프로그램에 대한 다음과 같은 간단한 시나리오를 고려해보십시오. 루트 프로세스가 일부 매개 변수 (수십 바이트 - 고정 크기)를 브로드 캐스팅 한 다음 모든 노드가 일부 계산을 시작한 후 루트가 결과를 수집합니다 (MPI_Gather
- 가능합니다. 매우 큰 데이터 세트). 루트가 데이터를 저장하면 프로그램이 종료됩니다.MPI 스타 (허브 앤 스포크) 커뮤니케이터는 MPI_COMM_WORLD보다 성능이 뛰어 납니까?
가상 스타 토폴로지를 사용하여 생성 된 커뮤니케이터를 사용하면 MPI_COMM_WORLD
을 사용하는 것보다 성능이 향상됩니다 (프로세스 수, 대기 시간 등). 커뮤니케이터는 실제 채널에 대해 지연 초기화를 사용합니까? 즉, 처음으로 파이프, 소켓 등을 열어야 만합니다. 이 동작은 구현에 종속적입니까?
참고 : 나는 openmpi1.4.3-2
을 사용하고 있는데 일반 C.