openmp

0열

1답변

: 이미 병렬화 된 루프 내에서 작업을 병렬화 할 [배경의 OpenMP V4의 + 인텔의 ICC 컴파일러에]. 나는이 일에 가까운 과목, 예컨대 : Parallel sections in OpenMP using a loop Doing a section with one thread and a for-loop with multiple threads 보다 더 농축

0열

2답변

OpenMP는 스레드 할당을 어떻게합니까?

OpenMP API가 코어에 스레드를 할당하는 기초에 대해 공부하고 싶었습니다. 그렇게하는 동안 고려해야 할 요인은 무엇입니까? 이 할당을 프로그래머의 필요에 따라 수정할 수 있습니까?

0열

1답변

변수가 병렬 변수 내에서 선언 될 때 개인 변수를 전달할 때 OpenMP segfault

제목에 모두 나와 있습니다. 배열 x를 병렬 영역 밖에서 선언하고 스레드에 전용 변수로 전달하면 segfault가 생깁니다. 변수를 병렬 영역 내에 선언하면 모든 것이 잘 동작합니다. 변수를 선언하는 대신 개인 변수로 전달하는 데 관심이 있습니다. 따라서이 문제를 디버그하는 데 도움이 필요합니다. 내가 72 개 스레드를 사용하고 //Case1 - doesn

2열

1답변

모든 thread_local 객체에 대해 소멸자가 호출되지 않았습니다.

GCC 6.2.0 및 C++ 1z에서 OpenMP를 사용합니다. 나는 필요할 때 스레드 안에 생성 된 thread_local 개체를 사용하려고했습니다. thread_local 객체는 거의 잘 작동하지만 소멸자는 단 하나의 스레드에서만 호출됩니다. 다음 코드로 문제를 시뮬레이트 할 수 있습니다. 코드가 허용되지 않는 기능을 사용하고 있습니까? 아니면 GCC

1열

1답변

파이썬 및 환경 변수에서 OpenMP C 라이브러리 호출

스레드 수 (OMP_NUM_THREADS)와 해당 바인딩 (OMP_PLACES, OMP_PROC_BIND)을 변경하여 Python에서 OpenMP 프로그램을 호출하고 싶습니다. 내가 python program.py를 실행하면, 내가 할 g++ -c -fPIC -fopenmp f.cpp -o f.o g++ -shared -fopenmp -Wl,soname,

1열

2답변

openMp를 사용한 여러 독립 for 루프의 성능 문제

강렬한 계산을 위해 OpenMP 스레드를 사용할 계획입니다. 그러나 첫 번째 시험에서 기대했던 성능을 얻을 수 없었습니다. 나는 그것에 몇 가지 문제가 있다고 생각했지만 아직 확신하지는 못했다. 일반적으로 성능 병목 현상은 fork 및 join 모델에서 발생한다고 생각합니다. 어떤면에서 나를 도울 수 있습니까? 첫째, 소비자 스레드에서 실행되는 경로 사이클

0열

1답변

블록의 끝에 openmp 프로그램이 걸려있다.

리더기 작성자의 문제를 모방하기 위해 스레드를 생성하지 않는 프로그램을 작성 중이다. 일부 스레드에는 판독기 태스크가 할당되고 일부는 작성자 스레드로 할당된다. 플래그 배열은 다음과 같이 유지된다. 각 루프 반복에 대해 서로 다른 작성자 스레드가 할당되도록합니다. RW는 읽기 및 쓰기 작업을 위해 작성한 클래스입니다. 프로그램은 루프의 첫 번째 반복이 끝날

0열

1답변

에 대한 내부 용 - 생성 스레드

내가 OpenMP의 새로운 해요 및 에 시간을 소비하지 않고 병렬에 대한 내부 수행하는 방법이 같은 상황에 직면하고 있습니다 : 나는 내부 루프 평행을 만들고 싶어 int someArray[ARRAY_SIZE]; //outer loop for(int i = 0; i < 100; ++i) { //inner loop for(int j

0열

1답변

C에서 OpenMP를 사용하는 루프 병렬화의 스레드 수

요즘 OpenMP를 배우고 있습니다. 인터넷에서 많은 블로그를 읽었으며 "루프 병렬화의 스레드 수"에 대해 매우 자주 의심하고 있습니다. 아래 예제를 사용하십시오 int x,y; #pragma omp parallel for private(y) for(x=0; x < width; x++) { for(y=0; y < height; y++)

2열

1답변

openmp에서 각 스레드의 실행 시간을 측정하는 방법은 무엇입니까?

각 스레드가 코드 덩어리를 보내는 데 걸리는 시간을 측정하고 싶습니다. 로드 밸런싱 전략이 직원들간에 균등하게 나누어 지는지 확인하고 싶습니다. 당신은 단지 당 스레드 시간이 방법을 (심지어 컴파일되지, 테스트하지) 인쇄 할 수 있습니다