openmp

    0

    1답변

    : 이미 병렬화 된 루프 내에서 작업을 병렬화 할 [배경의 OpenMP V4의 + 인텔의 ICC 컴파일러에]. 나는이 일에 가까운 과목, 예컨대 : Parallel sections in OpenMP using a loop Doing a section with one thread and a for-loop with multiple threads 보다 더 농축

    0

    2답변

    OpenMP API가 코어에 스레드를 할당하는 기초에 대해 공부하고 싶었습니다. 그렇게하는 동안 고려해야 할 요인은 무엇입니까? 이 할당을 프로그래머의 필요에 따라 수정할 수 있습니까?

    0

    1답변

    제목에 모두 나와 있습니다. 배열 x를 병렬 영역 밖에서 선언하고 스레드에 전용 변수로 전달하면 segfault가 생깁니다. 변수를 병렬 영역 내에 선언하면 모든 것이 잘 동작합니다. 변수를 선언하는 대신 개인 변수로 전달하는 데 관심이 있습니다. 따라서이 문제를 디버그하는 데 도움이 필요합니다. 내가 72 개 스레드를 사용하고 //Case1 - doesn

    2

    1답변

    GCC 6.2.0 및 C++ 1z에서 OpenMP를 사용합니다. 나는 필요할 때 스레드 안에 생성 된 thread_local 개체를 사용하려고했습니다. thread_local 객체는 거의 잘 작동하지만 소멸자는 단 하나의 스레드에서만 호출됩니다. 다음 코드로 문제를 시뮬레이트 할 수 있습니다. 코드가 허용되지 않는 기능을 사용하고 있습니까? 아니면 GCC

    1

    1답변

    스레드 수 (OMP_NUM_THREADS)와 해당 바인딩 (OMP_PLACES, OMP_PROC_BIND)을 변경하여 Python에서 OpenMP 프로그램을 호출하고 싶습니다. 내가 python program.py를 실행하면, 내가 할 g++ -c -fPIC -fopenmp f.cpp -o f.o g++ -shared -fopenmp -Wl,soname,

    1

    2답변

    강렬한 계산을 위해 OpenMP 스레드를 사용할 계획입니다. 그러나 첫 번째 시험에서 기대했던 성능을 얻을 수 없었습니다. 나는 그것에 몇 가지 문제가 있다고 생각했지만 아직 확신하지는 못했다. 일반적으로 성능 병목 현상은 fork 및 join 모델에서 발생한다고 생각합니다. 어떤면에서 나를 도울 수 있습니까? 첫째, 소비자 스레드에서 실행되는 경로 사이클

    0

    1답변

    리더기 작성자의 문제를 모방하기 위해 스레드를 생성하지 않는 프로그램을 작성 중이다. 일부 스레드에는 판독기 태스크가 할당되고 일부는 작성자 스레드로 할당된다. 플래그 배열은 다음과 같이 유지된다. 각 루프 반복에 대해 서로 다른 작성자 스레드가 할당되도록합니다. RW는 읽기 및 쓰기 작업을 위해 작성한 클래스입니다. 프로그램은 루프의 첫 번째 반복이 끝날

    0

    1답변

    내가 OpenMP의 새로운 해요 및 에 시간을 소비하지 않고 병렬에 대한 내부 수행하는 방법이 같은 상황에 직면하고 있습니다 : 나는 내부 루프 평행을 만들고 싶어 int someArray[ARRAY_SIZE]; //outer loop for(int i = 0; i < 100; ++i) { //inner loop for(int j

    0

    1답변

    요즘 OpenMP를 배우고 있습니다. 인터넷에서 많은 블로그를 읽었으며 "루프 병렬화의 스레드 수"에 대해 매우 자주 의심하고 있습니다. 아래 예제를 사용하십시오 int x,y; #pragma omp parallel for private(y) for(x=0; x < width; x++) { for(y=0; y < height; y++)

    2

    1답변

    각 스레드가 코드 덩어리를 보내는 데 걸리는 시간을 측정하고 싶습니다. 로드 밸런싱 전략이 직원들간에 균등하게 나누어 지는지 확인하고 싶습니다. 당신은 단지 당 스레드 시간이 방법을 (심지어 컴파일되지, 테스트하지) 인쇄 할 수 있습니다