openmp

    5

    2답변

    Mac OS X Sierra를 사용하고 있는데 clang (LLVM 버전 8.1.0 (clang-802.0.38))이 OpenMP를 지원하지 않음을 발견했습니다. clang -fopenmp program_name.c를 실행, 나는 다음과 같은 오류 있어요 : clang: error: unsupported option '-fopenmp' 을 그 연타가 -fo

    0

    1답변

    OpenMP 코드의 메모리 사용을 어떻게 측정합니까? 나는 메모리 사용량이 스레드 수와 함께 줄어들 것이라고 믿는다. 저는 Linux와 Intel Fortran 컴파일러를 사용하고 있습니다.

    1

    1답변

    저는 8 코어 + HT (16 스레드)의 i7-5960X CPU가있는 스탠드를 가지고 있습니다. 그리고 여기 OpenMP와 OpenMPI를 모두 사용하려고하는 프로그램이 있습니다. 다음과 같이 호출 : # mpirun -np <NN1> -x OMP_NUM_THREADS=<NN2> <my_prog> 여기서 NN1과 NN2는 다양합니다. 1 그래서 #1,

    -1

    1답변

    멀티 스레딩에 openmp를 사용하려고합니다. 다음과 같이 보는 그 코드를 이렇게 아주 쉽게 #pragma omp parallel for collapse(2) for (int n = 0; n < 1000; ++n) for (int m = 0; m < 20; ++n) 방법은 다음과 같은 구조를 가지고 코드에 대한 : int test, z; f

    1

    1답변

    OpenMP 라이브러리에서 병렬 pragma omp를 사용하여 삼항 검색 알고리즘을 구현하려고합니다. 재귀를 사용하고 있으며 여기까지 코드 구현에서 지금까지 도달 한 내용이 있습니다. 이는 검색 기능이다 int ternarySearch(int arr[], int size, int left, int right, int num) { if (left

    2

    1답변

    내가 삽입하려고하는 for 루프의 OpenMP를 사용하려고위한 OpenMP의 내부 해시 맵/해시 맵 (std::unordered_map) 해시 맵을 업데이트하고 키는 실제로 클래스의 구성원 그래서 나는 그들의 주소를 나타내는 포인터를 할당했다. 키는 또한 전역 함수에 의해 반환 된 해시 값이다. 다음은이 작업을 수행하는 가장 쉬운 방법 인 것처럼 보이지만

    0

    1답변

    OpenMP 또는 CUDA를 사용하여이 루프의 속도를 높일 수 있는지 궁금합니다. 현재는 일련의 처리와 잘 실행하지만 난 "내 코딩 최적화하기 위해 노력하고있어 : 없음 효과 다음 내가 해봤 처리를 parallelise하기위한 노력의 일환으로 for (int curCol = 0; curCol < numRows; ++curCol){ //Long Loop

    -1

    1답변

    OpenMP (ctypes-wrapper를 사용하여 Python에서 C 함수로의 변수가 전달됨)를 사용하여 병렬화 된 C 함수를 호출하는 Python 스크립트를 작성했습니다. C 함수는 원하는 출력을 올바르게 생성합니다. 하지만 파이썬 코드의 끝 부분에서 세분화 오류가 발생합니다. OpenMP가 비활성화되었을 때 seg-fault가 발생하지 않기 때문에 O

    3

    1답변

    gcc 7.1이 출시되면 이제 openmp 4.5 용 gcc를 구성하여 Nvidia PTX GPGPU로 오프로드 할 수 있습니다. 릴리스 노트에서 말하는 내용입니다 (대략). 내 질문에,이 구성을 활성화하기 위해 특별한 플래그가 있습니까? openmp 4.5를 컴파일하여 nvidia 장치를 타겟팅 할 수 있습니까?

    0

    1답변

    현재 내부 루프에 결과를 저장해야하는 조건이있는 경우 루프 집합을 병렬화하는 빠르고 안정적인 방법을 찾으려고합니다. 코드는 3D 그리드에서 엄청난 양의 점들을 통과해야합니다. 이 볼륨 내의 일부 지점에 대해 다른 조건 (각도 확인)을 확인해야하며이 조건이 충족되면 밀도를 계산해야합니다. 가장 빠른 방법 지금까지 최대 규모의 루프뿐만 아니라뿐만 아니라 CPU