2017-03-21 4 views
0

Google 클라우드에서 대규모 신경망 모델 (tensorflow)을 교육하고 평가합니다. 나는 그것이 용기 메모리 제한과 관련이있다 생각큰 텐서, 도커 제한을 처리하는 Google 클라우드 메모리가 부족합니까?

W Resource exhausted: OOM when allocating tensor with shape[38633472,17] 
W Ran out of memory trying to allocate 2.45GiB. See logs for memory state. 
    undefined 

: 내 모델을 평가할 때

다음과 같은 오류가 발생했습니다.

어떤 도움이 필요합니까?

+0

더 자세한 정보를 제공 할 수 있습니까? 사용중인 컨테이너, 실행하려는 모델 등 – Priyatham

+0

구글 클라우드가 어떤 컨테이너를 사용하고 있는지 잘 모르겠습니다. 간단히 'ml-engine jobs submit training'명령을 실행합니다. 꽤 큰 물류 모델을 사용합니다. – guyov

답변

1

어느 기계 유형을 사용하고 있습니까? scale tier? OOM의 경우 CUSTOM 계층에서보다 큰 시스템을 사용할 수 있습니다.

문제가 계속되면 프로젝트 번호와 직업 ID를 [email protected]으로 보내 주시면 자세히 살펴볼 수 있습니다.

+0

BASIC_GPU 및 CUSTOM 계층을 모두 시도했습니다. 인스턴스의 abolute 메모리는 지정하지 않습니다. 어떤 이유로 저는 most_complex_model 인스턴스를 사용할 수 없었습니다. 가장 큰 메모리를 가진 것처럼 보입니다 ... – guyov