저는 CAPS OpenACC 컴파일러를 사용하고 있습니다. OpenACC pragma 줄에서 구조체 데이터 형식 안에 동적 배열을 사용하려고했습니다. 내 코드는 다음과 같습니다. 성공적으로 컴파일되었습니다. 내가 실행하려고 할 때, 나는 이러한 오류 terminate called after throwing an instance of 'hmpperr::Dev
FORTRAN으로 작성된 오래된 코드가 있는데 OpenACC를 사용하여 가속화해야하지만 지시문을 사용하려고하면 un, vn, pn이 병렬 처리를 방해하는 것으로 나타납니다. 이 루프를 병렬 처리 할 수 있습니까? 나는 간단한 예는 가우스 자이 델과 코비 반복의 차이 것 , OpenACC 새로운 오전하지만, OpenMP를 !$acc parallel loo
나는 CAPS OpenACC을 에 사용하고 있습니다. CUDA. 나는 디버그를 시도하고있다 cuda-gdb. 그리고 나는 보통 C/C++ 코드 cuda-gdb으로 디버깅 할 수 있습니다. 즉, 코드 레 코드를 디버그 할 수 없습니다. CUDA에 openACC을 디버깅 사람이 있습니까? 또는 코드 렛에 중단 점을 넣을 수 없습니다. 디버깅하려면 어떻게해야합니
중첩 된 데이터 환경에서이 두 절의 작동에 대해이 질문에 대해 명확하게 대답해야합니다. #pragma acc create(a[0:20])
{
#pragma acc pcopyin(a[0:20])
{
...
}
}
첫 번째 절은 가속에 필요한 메모리를 할당 한 다음 pcopyin 절은에서 데이터를 복사 : 내가 처음
다음 코드를 사용하면 정확합니까? 필자는 2GB Geforce 750M을 사용하고 PGI Fortran 컴파일러를 사용합니다. 이 프로그램은 4000x4000 배열에 대해 잘 작동하지만, 더 높게 불평하지 않아도됩니다. 9000x9000 배열을 할당했지만 n 값이 4000 이상인 경우 런타임 오류가 발생합니다. 로버트 Crovella 내 생각에 progra
오늘은 회사에 의해 나에게 주어진 예제 파일에 매개 변수 비슷한 예, 솔직히 나는 누군가가 동적 배열을 취하여 함수 매개 변수 자체를 사용하여 그 자체를 형상화 한 것을 보지 못했습니다. 법적 신고입니까? 은 무엇 내 마음을 놀라게하는 것은 mySgemm 기능 그들이 a이 두 번 배열로 b, c, 그래서 배열이 근본적으로 재편되고있는 접근이다!?
나는 cuda fortran을 사용하여 코드 조각을 가속화하려고합니다. 이 코드는 cuda가있는 장치 코드에서 유효하지 않은 변수 정의에 공통 명령문을 사용합니다. 내가 한 것은 일반적인 명령문을 사용하는 대신 모듈에서 변수를 정의하는 것이지만 이것은 잘못된 답변입니다. 일반적인 문장 대신에 모든 것을 정상적인 코드에서 처리하고 있습니다. Code(with
안녕하세요 저는 CAPS OpenACC 컴파일러를 사용하고 있었지만 일부 예비 프로필 결과를 얻으려고 할 때 뭔가가 발생합니다. 처음에는 HMPPRT_LOG_LEVEL = "info"를 선언하여 코드를 실행했습니다.이 정보는 타임 스탬프가 포함 된 일부 프로필 결과를 생성합니다. [ 2.612337] (0) INFO : Upload edgelengths[