openmp

5열

2답변

Mac OS X (sierra)에서 clang으로 OpenMP 지원 활성화

Mac OS X Sierra를 사용하고 있는데 clang (LLVM 버전 8.1.0 (clang-802.0.38))이 OpenMP를 지원하지 않음을 발견했습니다. clang -fopenmp program_name.c를 실행, 나는 다음과 같은 오류 있어요 : clang: error: unsupported option '-fopenmp' 을 그 연타가 -fo

0열

1답변

Linux에서 OpenMP 코드의 메모리 사용을 측정하는 방법은 무엇입니까?

OpenMP 코드의 메모리 사용을 어떻게 측정합니까? 나는 메모리 사용량이 스레드 수와 함께 줄어들 것이라고 믿는다. 저는 Linux와 Intel Fortran 컴파일러를 사용하고 있습니다.

1열

1답변

openmpi에서 openmp의 이상한 작업 동작

저는 8 코어 + HT (16 스레드)의 i7-5960X CPU가있는 스탠드를 가지고 있습니다. 그리고 여기 OpenMP와 OpenMPI를 모두 사용하려고하는 프로그램이 있습니다. 다음과 같이 호출 : # mpirun -np <NN1> -x OMP_NUM_THREADS=<NN2> <my_prog> 여기서 NN1과 NN2는 다양합니다. 1 그래서 #1,

-1열

1답변

OpenMP로 루프 용 멀티 스레딩

멀티 스레딩에 openmp를 사용하려고합니다. 다음과 같이 보는 그 코드를 이렇게 아주 쉽게 #pragma omp parallel for collapse(2) for (int n = 0; n < 1000; ++n) for (int m = 0; m < 20; ++n) 방법은 다음과 같은 구조를 가지고 코드에 대한 : int test, z; f

1열

1답변

omp 병렬 섹션의 스레드가 섹션에서 분리되지 않는 이유는 무엇입니까?

OpenMP 라이브러리에서 병렬 pragma omp를 사용하여 삼항 검색 알고리즘을 구현하려고합니다. 재귀를 사용하고 있으며 여기까지 코드 구현에서 지금까지 도달 한 내용이 있습니다. 이는 검색 기능이다 int ternarySearch(int arr[], int size, int left, int right, int num) { if (left

2열

1답변

업데이트 루프

내가 삽입하려고하는 for 루프의 OpenMP를 사용하려고위한 OpenMP의 내부 해시 맵/해시 맵 (std::unordered_map) 해시 맵을 업데이트하고 키는 실제로 클래스의 구성원 그래서 나는 그들의 주소를 나타내는 포인터를 할당했다. 키는 또한 전역 함수에 의해 반환 된 해시 값이다. 다음은이 작업을 수행하는 가장 쉬운 방법 인 것처럼 보이지만

0열

1답변

속도 향상 .push_back을 사용한 루프

OpenMP 또는 CUDA를 사용하여이 루프의 속도를 높일 수 있는지 궁금합니다. 현재는 일련의 처리와 잘 실행하지만 난 "내 코딩 최적화하기 위해 노력하고있어 : 없음 효과 다음 내가 해봤 처리를 parallelise하기위한 노력의 일환으로 for (int curCol = 0; curCol < numRows; ++curCol){ //Long Loop

-1열

1답변

Python에서 OpenMP로 C 함수를 호출하면 끝에 세그먼트 오류가 발생합니다.

OpenMP (ctypes-wrapper를 사용하여 Python에서 C 함수로의 변수가 전달됨)를 사용하여 병렬화 된 C 함수를 호출하는 Python 스크립트를 작성했습니다. C 함수는 원하는 출력을 올바르게 생성합니다. 하지만 파이썬 코드의 끝 부분에서 세분화 오류가 발생합니다. OpenMP가 비활성화되었을 때 seg-fault가 발생하지 않기 때문에 O

3열

1답변

OpenMP 4.5에 대한 GCC 구성 방법 Nvidia PTX GPGPU로

gcc 7.1이 출시되면 이제 openmp 4.5 용 gcc를 구성하여 Nvidia PTX GPGPU로 오프로드 할 수 있습니다. 릴리스 노트에서 말하는 내용입니다 (대략). 내 질문에,이 구성을 활성화하기 위해 특별한 플래그가 있습니까? openmp 4.5를 컴파일하여 nvidia 장치를 타겟팅 할 수 있습니까?

0열

1답변

Openmp는 순서대로 출력 된 for 루프를 중첩했습니다.

현재 내부 루프에 결과를 저장해야하는 조건이있는 경우 루프 집합을 병렬화하는 빠르고 안정적인 방법을 찾으려고합니다. 코드는 3D 그리드에서 엄청난 양의 점들을 통과해야합니다. 이 볼륨 내의 일부 지점에 대해 다른 조건 (각도 확인)을 확인해야하며이 조건이 충족되면 밀도를 계산해야합니다. 가장 빠른 방법 지금까지 최대 규모의 루프뿐만 아니라뿐만 아니라 CPU