openmp

1열

1답변

LLVM/Clang을 사용하여 Win10에서 OpenMP를 사용하는 Cuda

Win10에서 Cuda, OpenMP 및 LLVM/Clang을 사용하는 간단한 응용 프로그램을 사용하려고했습니다. 온라인에서 발견 한 다양한 문서 및 파워 포인트 프리젠 테이션을 통해이 기능이 어떤 방식 으로든 지원된다고 생각하지만, Win10에서 지원되는지 여부와 주 릴리스인지 확실하지 않습니다. 나는 LLVM 4.0.0rc1을 사용하고있다. 여러 가지

13열

1답변

스레드 안전 :: random_device

I가이 같은 비트 보이는 몇 가지 코드 : 이 std::random_device 스레드 안전한가요 : std::random_device rd; #pragma omp parallel { std::mt19937 gen(rd()); #pragma omp for for(int i=0; i < N; i++) { /

1열

1답변

암시 적 장벽에서 OpenMP 태스크 완료를 기다리고 있습니까?

OpenMP 작업을 많이 만들고 taskwait을 사용하지 않으면 프로그램에서 해당 작업이 완료 될 때까지 기다리지 않습니까? 다음의 예를 생각해 #pragma omp parallel { #pragma omp single { for (int i = 0; i < 1000; i++) { #pragma omp task

1열

1답변

OpenMP 런타임은 무엇을 위해 필요합니까?

저는 아치 리눅스를 사용하고 있습니다. C와 Fortran 둘 다이 기계에서 몇 가지 OpenMP 프로그램을 실행하여 이상하거나 예상치 못한 것을 전혀 발견하지 못했습니다. 정확한 수의 스레드가 항상 사용되었습니다. extra/openmp 3.9.1-1 LLVM OpenMP Runtime Library 무엇인가의 OpenMP 런타임의 OpenM

0열

1답변

C - 병렬화 되풀이 ompl

문제가 있습니다.이 코드를 OMP와 병렬 처리해야합니다. 데이터 종속성의 문제점이 있으며 해결 방법을 모르겠습니다. 제안 사항이 있으십니까? for (n = 2; n < N+1; n++) { dz = *(dynamic_d + n-1)*z; *(dynamic_A + n) = *(dynamic_A + n-1) + dz * (*(dynamic_

4열

2답변

Cython : 스레드 병렬을 안전하게 만든다.

Cython 스타터가 여기있다. 여러 스레드를 사용하여 특정 쌍 통계 (여러 개의 저장소)로 계산 속도를 높이려고합니다. 특히, 내부적으로 openMP를 사용하는 cython.parallel에서 prange를 사용하고 있습니다. 다음 최소 예제는 문제를 설명합니다 (Jupyter 노트북 Cython 마법을 통해 컴파일 됨). 노트북 설정 : %load_ex

0열

1답변

내가 스파 스 매트릭스 형식 (특히 압축 행 형식) I가 작동 희소 행렬 코비가</p> <p>를 사용하여 코비 방법을 병렬화 할 수있는 방법이 있는지 확인하기 위해 노력하고있어 코비

OpenMP의 스파 스. 내가 ! $ OMP 평행하게 배치 x는 모두에 기록하고 읽어되고 있기 때문에 중간에 지침은 루프를 수행 할 수 있을지 모르겠어요. 내부 루프가 가질 수 있다고 생각하지만 동일한 t가 덮어 쓰여 지므로 거기에 가능 할지도 모릅니다. 나는 무엇인가 여기에서 멀리 바라보고 있냐? 감사. x(:) = 0 do p = 1, numItera

0열

1답변

OpenMP를 사용한 병렬 프로그래밍에 대한 도움이 필요하십니까?

지금은 OpenMP를 사용하여 멀티 코어 머신에서 병렬 프로그래밍을하고 있습니다. 나는 새로운 병렬 프로그래밍이다. 틸 지금은 것은 다음했을 : 변화와 다른 시스템에서 스레드의 수를 실행 시간을 계산 OpenMP를를 사용 100 만 X 1 백만 행렬 곱셈 프로그램 (corei5 등, corei3) 나는 thread = 4가 없으면 코드를 실행하는 데 최소

0열

1답변

/MPI 내가 하이브리드의 OpenMP/MPI 프로그램을 작성

프로그램은 내가 ncores 비 공유 메모리 프로세스의 수입니다 다음 mpirun -np ncores --bind-to none -x OMP_NUM_THREADS=nthreads ./program (MPI 같이 호출)이고 nthreads는 공유 메모리 스레드 (OpenMP)의 수입니다. 즉, 각 ncores에서 프로그램은 nthreads에서 실행됩니다.

0열

1답변

OpenMP를 사용하여 벡터의 행렬 요소를 벡터로 작성

OpenMP에서는 다소 새로운 개념입니다. 나는 OpenMP 쓰레딩을 사용하여 큰 매트릭스의 모든 요소를 벡터에 작성하여 속도를 높이고 싶다. 내 시리얼 코드에서 는 단순히 일을 오전 다음 !$OMP PARALLEL DO PRIVATE(k,i,p,j) ! bla bla !$OMP END PARALLEL DO : 이제 m=1 DO k=1,