thrust

2열

1답변

thrust :: device_vector 값 thrust :: device_vector 키; 초기화 후 키에는 -1과 같은 일부 요소가 포함됩니다. 키의 요소와 값의 동일한 위치에서 요소를 삭제하려고했습니다. 하지만 어떻게 처리해야할지 모르겠습니까?

1열

1답변

cuda의 변수 정의에 관하여

파일에서 데이터를로드해야합니다. 각 샘플은 20 차원입니다. 그래서 나는이 좀 도와이 데이터 구조를 사용 : class DataType { vector<float> d; } 을하지만이 변수 정의를 사용하는 동안, 그것은 작동하지 않을 수 있습니다. thrust::host_vector<DataType> host_input; // after

0열

1답변

CUDA-gdb를 충돌 (CUDA 5.5을 출시)

나는 다음과 같은 사소한 추력 :: 프로그램 수집이 (추력에서 직접 촬영을 :: 문서를 수집) #include <thrust/gather.h> #include <thrust/device_vector.h> int main(void) { // mark even indices with a 1; odd indices with a 0 int

2열

1답변

MISD 유형 작업에 대한 CUDA 스레드 분기 방지

큰 코드의 일부로 많은 수의 ODE (1000 개 이상일 수 있음)를 병렬로 통합하는 CUDA RK4 솔버가 있습니다. 이 작업의 한 단계는 각 방정식 (또는 데이터 요소)마다 다른 'xdot'을 계산하는 것입니다. 현재, 커널의 각 데이터 요소에 대한 값을 계산하기위한 스위치 케이스 분기 설정이 있습니다. 모든 다른 스레드는 같은 3-6 데이터 요소를 사

0열

1답변

추력 for_each 예제가 실행되지 않음

http://docs.thrust.googlecode.com/hg/group__modifying.html에 설명 된 추력 for_each 예제를 실행하려고하지만 컴파일하고 실행할 때 오류가 발생합니다. fe.cu : 나는 다음과 같은 파일 사용 #include <thrust/for_each.h> #include <thrust/device_vector.h>

1열

1답변

cuda 커널에서 추력 함수를 호출하는 방법

이 코드를 실행할 때 컴파일러에서 장치의 호스트 함수를 호출한다고 말합니다. 나는 어떻게하는지 잘 모른다. __global__ void kernel(thrust::device_vector<float*> d_V) { float *var = d_V[0]; } int main() { thrust::host_vector

0열

2답변

CUDA 추력 메모리 할당 문제

큰 데이터 배열 (2.4G)을 메모리에로드하고 결과를 호스트 (~ 1.5G)에 저장 한 다음 수행 데이터를 해제하고 결과를로드하는 추력 코드가 있습니다. 디바이스에 다른 계산을 수행하고 마지막으로 초기 데이터를 다시로드합니다. 추력 코드는 다음과 같습니다 : 무료 내 정의 된 기능으로 thrust::host_device<float> hostData; //

1열

1답변

CUDA : GPU로 데이터를 업로드 할 때 왜 추력이 느려지 죠?

저는 GPU 세계를 처음 접했고 CUDA를 설치하여 일부 프로그램을 작성했습니다. 나는 추력 라이브러리를 가지고 놀았지만 GPU로 데이터를 업로드 할 때 속도가 느리다는 것을 알았습니다. 나쁘지 않은 데스크탑에서 호스트 - 디바이스 부분의 약 35MB/s. 어떻게 된거야? 환경 : 비주얼 스튜디오 2012, CUDA 5.0, GTX760, 인텔 I7, 윈도

4열

1답변

CUDA double2 배열을 이용한 추력 감소

float2 배열의 감소를 수행하기 위해 CUDA 추력을 사용하는 다음과 같은 (컴파일 및 실행 가능한) 코드가 있습니다. 내가 즉, main 프로그램에서 double2에 void main(int argc, char** argv) { int N = 20; // --- Host double2* ha; ha = (double2*)

1열

1답변

추력 포함 스캔은 디버그 빌드에서 완료되었지만 릴리스 빌드에서는 실패 함

나는 장치 벡터에서 간단한 thrust :: inclusive scan 호출을 사용하고 있습니다. 디버그 빌드에서이 오류없이 실행됩니다. 그러나 릴리스 빌드를 사용하여 실행하면 오류가 발생합니다. 또한 이것은 thrust :: device <> 벡터에만 영향을 미치는 것으로 보입니까? 내가 디버그를 수행하는 일식 nsight을 이용하고 있고 릴리스 빌드 지