이미지 분류를 위해 Deep Learning Caffe 프레임 워크를 사용하고 있습니다. 얼굴이있는 동전이 있습니다. 그들 중 일부는 옳다는 지시를 받았다. 그들을 분류하려면 이미 이미지 패턴을 많이 캡처 한 사전 훈련 된 ImageNet 네트워크에서 가중치 및 구조를 취하고 대부분 내 교육 세트에 맞는 마지막 레이어를 교육하십시오. 그러나이 세트에서는 n
본인의 연구를 위해 가정에서 추출한 ZFNet (prototxt)을 구현했습니다. 정의를 20k 반복 한 후에 테스트 정확도는 ~ 0.001 (즉, 1/1000), 테스트 손실은 ~ 6.9, 트레이닝 손실은 ~ 6.9로 1k 클래스에서 추측 게임을 계속하는 것 같습니다. 나는 철저히 전체 정의를 확인하고 새로운 훈련을 시작하기 위해 일부 하이퍼 파라미터를
Imagenet 분산 TF 트레인 예제를 자세히 살펴 보았습니다. 이 예가 2 명의 다른 직원에게 실행될 때 데이터 배포가 어떻게 이루어지는 지 이해할 수 없습니까? 이론적으로 다른 근로자는 데이터의 다른 부분을보아야합니다. 또한 코드의 어떤 부분이 매개 변수 서버에 전달할 매개 변수를 지시합니까? multi-gpu 예제에서와 같이 'cpu : 0'에 대한