nvprof

    0

    1답변

    CUDA 코드가있는 파이썬 스크립트를 실행하기 위해 GPU가 2 개인 원격 기계를 사용하고 있습니다. 코드의 성능을 향상시킬 수있는 곳을 찾으려면 nvprof을 사용하려고합니다. nvprof --profile-child-processes ./myscript.py을 호출 할 때 각 GPU에서 동일한 ID를 가진 프로세스가 시작되지만 원격 시스템에서 2 GPU

    1

    1답변

    nvprof으로 프로필을 작성하려는 작은 CUDA 프로그램이 있습니다. 문제는 내가 내가 nvprof my_prog을 실행 , 그것은 cudaProfilerStart 및 cudaProfilerStop를 호출하는 방식으로 프로그램을 작성 할 것입니다. my_prog을 실행할 때 위의 API를 호출하지 않으므로 프로파일 링 오버 헤드가 제거 될 수 있습니다.

    0

    1답변

    프로필을 작성하고 싶은 CUDA 응용 프로그램을 만들고 있습니다. 지금까지 내가 사용한 모든 것은 커맨드 라인 프로파일 러 인 nvprof으로 요약 된 통계 만 표시합니다. GUI 프로파일 러 인 NVVP를 사용하려고 생각했습니다. 문제는 응용 프로그램을 실행중인 원격 Linux 노드에 GUI (심지어 X.org)가 없다는 것입니다. 게다가, 원격 노드에서

    7

    1답변

    NVIDIA TITAN X 및 CUDA 8.0이 설치된 시스템에서 OpenCL 응용 프로그램 a.out의 프로파일을 작성하려고합니다. CUDA 응용 프로그램 인 경우 nvprof ./a.out이면 충분합니다. 하지만 OpenCL 응용 프로그램에서 "커널이 프로파일되지 않았습니다."라는 메시지와 함께 작동하지 않습니다. CUDA 7.5까지는 을 this 다음

    0

    1답변

    nvprof을 사용하여 CUDA 커널 실행 횟수를 계산할 수 있습니까? ==537== Profiling application: python tf.py ==537== Profiling result: Time(%) Time Calls Avg Min Max Name 51.73% 91.294us 20 4.5640us 4.1280us 6.1760us

    0

    1답변

    간단한 실험을하고 있습니다. 누구나 callback_metric CUPTI의 샘플 코드 (CUPTI 폴더에 있음 : /usr/local/cuda/extras/CUPTI/sample/callback_metric)에 대해 알고있을 수 있습니다. 벡터 커널을 실행할 때 통계를 읽는 간단한 코드 만 포함합니다. 코드를 컴파일하고 실행할 때 모든 것이 작동합니다.

    1

    1답변

    NVIDIA 비주얼 프로파일 러의 타임 라인에서 내 코드의 핵심 부분을 분리하는 데 문제가 있습니다. 일부 거대한 바, 이미지의 하나. 나는이 기능을 최적화하는 데 관심이 없으며 타임 라인에 그 존재가 프로그램의 여러 통계 측정을 방해합니다. 따라서 프로파일 러에게이를 무시하라고 말하고 싶습니다. 가능한가?

    0

    1답변

    일부 CUDA 커널을 실행하기 위해 JCuda를 사용하는 Java 코드를 작성했습니다. 스트림이 겹쳐지고 겹쳐져있는 것을 이해하기 위해 어플리케이션을 프로파일 링하고 싶습니다. 커널의 실행 시간을 얻기 위해 cudaEventElpasedTime과 같은 cuda 이벤트 호출을 사용할 수 있지만 같은 커널에 대해 시작 및 종료 타임 스탬프를 얻는 방법을 모르겠

    0

    2답변

    OpenCL 세계에는 지연 대기, 제출, 시작 및 종료 시간 (나노초 단위)과 같은 모든 프로파일 정보를 반환하는 함수 clGetEventProfilingInfo이 있습니다. 내가 원할 때마다 나는 그 정보를 printf에게 줄 수 있기 때문에 매우 편리하다. 은 PyOpenCL와 예를 들어 내 작업에 아주 유익이 profile = event.profile

    1

    2답변

    nvprof을 사용하여 TensorFlow 기반 코드를 프로파일하려고합니다. 이 다음 명령을 사용 중입니다. nvprof python ass2.py 프로그램이 성공적으로 실행되었지만 끝에 다음 오류가 표시됩니다. ==49791== Profiling application: python ass2.py ======== Error: Unable to impo