나는 다음 tutorial을 따라 객체 감지 TensorFlow 1.3 모델을 훈련시킵니다. Google 클라우드에서 내 작은 데이터 세트 (1 클래스, ~ 100 개의 예)로 faster_rcnn_resnet101_coco 또는 faster_rcnn_inception_resnet_v2_atrous_coco 모델을 재교육하고 싶습니다. 상대방 자습서에서 제안 된대로 많은 클래스와 PATH_TO_BE_CONFIGURED를 변경했습니다. config files.Google 클라우드 ml의 교육 모델 중에 메모리 예외가 발생하는 이유는 무엇입니까?
데이터 집합 : 이미지 당 12 개의 이미지, 4032 × 3024, 10-20 개의 레이블이있는 경계 상자.
왜 메모리 예외가 발생합니까?
마스터 0 내가 다른 구성 시도 있습니다 메모리 부족 실행 및 247
의 비 - 제로 상태로 종료 복제본 :
- 규모 계층을 BASIC_GPU
- default config yaml
사용자 정의 YAML은 더 많은 메모리와 인스턴스를 사용하는
trainingInput: runtimeVersion: "1.0" scaleTier: CUSTOM masterType: complex_model_l workerCount: 7 workerType: complex_model_s parameterServerCount: 3 parameterServerType: standard
아마도 클래스 수가 너무 많거나 너무 큰 이미지를 먹고 있습니다. – fabrizioM
클래스가 하나뿐입니다. 어쩌면 이미지가 너무 커요? (4032 × 3024) –