0
GPU 노드에서 클라우드 인스턴스를 실행 중입니다. 나는 CUDA를 설치했고 nvidia-smi는 드라이버 세부 사항, 메모리 사용을 보여 주었다. 며칠 후이 오류가 발생합니다 "NVIDIA 드라이버와 통신 할 수 없어 NVIDIA-SMI가 실패했습니다. 최신 NVIDIA 드라이버가 설치되어 실행되고 있는지 확인하십시오".NVIDIA-SMI가 실패했습니다. Nvidia 드라이버와 통신 할 수 없습니다.
최신 드라이버 (Tesla M40 Gpus 용 Nvidia-375.39)를 설치했습니다. 나는 여전히 같은 문제에 직면 해있다. 어떤 방법이 있습니까 i) nvidia-smi가 드라이버와 통신 할 수없는 이유를 디버깅 하시겠습니까? ii) 드라이버가 올바르게 실행되고 있는지 확인하십시오.
미리 감사드립니다.