gpu

    0

    1답변

    가우스 제거를 위해 CUDA에서 단일 스레드 프로그램을 성공적으로 구현했으며 병렬 처리를 달성하고자합니다. 지금까지 병렬 코드를 보이는 같은 : __global__ void ParallelGaussian(double* A) { int index = threadIdx.x; int stride = blockDim.x; if (in

    0

    1답변

    cuSOLVER 설명서에서 일괄 처리 기능을 찾습니다. http://docs.nvidia.com/cuda/cusolver/index.html#cuds-lt-t-gt-potrfBatched 그러나이 함수는 "cusolverDn.h"에서 찾을 수 없습니다. 나는 이것이 오류일지도 모른다라고 생각한다.

    0

    1답변

    현재 PyCUDA를 사용하여 고정 메모리가있는 내적 제품을 작업하고 있습니다. 그리고 큰 배열에 문제가 있습니다. 내가 함께 일하고 있어요 : NVIDIA의 GTX는 1060 CUDA 9.1 PyCUDA 2017년 1월 1일 코드는 다음과 같습니다 #!/usr/bin/env python import numpy as np import argparse

    -1

    1답변

    AES-NI는 대량의 데이터를 암호화/해독하는 데 최적화 된 것으로 보입니다. 그러나 암호를 해독하려는 중이 야 노력하는 많은 작은 비트 (iv + 첫 번째 cbc 블록, 총 32 바이트). 나는 각 사이클마다 EVP_DecryptInit_ex, EVP_DecryptUpdate (그리고 스레드 당 한 번 EVP_CIPHER_CTX_init)을 호출하여 현재

    0

    1답변

    나는 추력 펑터 내에서 장치 기능을 호출하고 싶지만 시작할 방법조차 모릅니다. 이것은 펑터 크기가 크기 때문에 함수로 나눌 필요가 있기 때문에 분명히 필요합니다. 최소한의 예는 인정됩니다. 는

    0

    1답변

    각 스레드가 omp_get_thread_num()을 통해 액세스 할 수있는 스레드의 ID 번호로 주소 지정된 메모리를 관리하도록함으로써 CPU에서 작동하는 OpenMP 코드가 있습니다. 이것은 CPU에서 잘 작동하지만 GPU에서 작동 할 수 있습니까? MWE은 다음과 같습니다 #include <iostream> #include <omp.h> int m

    1

    2답변

    난 그냥이 작업을 수행합니다 : t = Variable(torch.randn(5)) t =t.cuda() print(t) 를하지만 매번, 5 ~ 10 minitues 걸립니다. 대역폭을 테스트하기 위해 cuda 샘플을 사용했지만 괜찮습니다. 그런 다음 pdb를 사용하여 가장 많은 시간이 걸리는 것을 찾습니다. 나는 /anaconda3/lib/pyth

    0

    1답변

    OpenCL을 사용하여 현재 GPU 메모리 사용을 확인할 수있는 확실한 방법을 찾고 있습니다. NVidia API : cudaMemGetInfo(size_t* free, size_t* total)을 (를) 사용하여 현재 장치의 사용 가능한 메모리와 전체 메모리를 확보했습니다. 하지만 AMD와 OpenCL에 대한 해결책을 찾고 있습니다. OpenCL에 비슷한

    0

    1답변

    저는 iOS 11, XCode 9 및 Metal 2로 작업하고 있습니다. MTLTexture의 픽셀 형식은 bgra8Unorm입니다. I 인해 pixelFormat documentation에 따라, 픽셀 포맷을 변경할 수 금속층에 대한 픽셀 형식 bgra8Unorm, bgra8Unorm_srgb, rgba16Float, BGRA10_XR 또는 bgra10_

    0

    1답변

    저는 Apple의 Metal 2 프레임 워크를 사용하고 있습니다. 공식 Metal Shading Language Documentation, 섹션 2.3. 금속 시스템 수학 라이브러리에 의해 구현되는 행렬 데이터 타입의 서브 세트를 지원한다고행렬 데이터 유형. 지원되는 매트릭스 유형 이름은 halfnxm 및 floatnxm입니다. 여기서 n과 m은 열과 행의