object_detection/train.py
스크립트를 사용하여 자체 탐지기를 조정하는 Tensorflow Object Detection API를 실행 중이며 here이 발견되었습니다. 문제는 내가 계속 CUDA_ERROR_OUT_OF_MEMORY
을 얻고 있다는 것입니다.Tensorflow #에 대한 CUDA_ERROR_OUT_OF_MEMORY # object_detection/train.py
트레이너의 메모리 사용량을 줄이기 위해 배치 크기를 줄이는 방법을 찾았지만 16에서 4로 줄였습니다. 여전히 같은 오류가 발생합니다. 차이점은 batch_size = 16을 사용할 때 ~ 18 단계에서 오류가 발생했으며 이제 ~ 70 단계에서 오류가 발생했습니다. 편집 :batch_size = 1로 설정하면 2700 단계에서 오류가 발생하므로 문제가 해결되지 않았습니다.
교육 과정을 중단 할 때까지 원활하게 실행하려면 어떻게해야합니까? 나는 정말로 빠른 훈련을받을 필요가 없다.
편집 : 현재이 용도로 GTX 750 Ti 2GB를 사용하고 있습니다. GPU는 교육 및 모니터 이미지 제공 이외의 용도로 사용되지 않습니다. 현재 나는 훈련을 위해 80 개의 이미지만을 사용하고 평가를 위해 20 개의 이미지만을 사용하고 있습니다.
GPU 크기, 교육 데이터 크기에 대한 정보를 추가하고 다른 곳에서 GPU를 동시에 사용하고 있습니까? –
@SmitShilu 요청한 정보를 추가했습니다. 도와 줘서 고마워! – Minoru
죄송합니다. 광산에서 재현 할 수 없지만 각 이미지가 고해상도이거나이 링크를 참조하면 이미지 크기 문제 일 수 있습니다. https://github.com/tensorflow/models/issues/1854 –