dlib는 학습 오브젝트 검출기를위한 대규모 데이터 세트를 사용할 수 있습니다. 나는 얼굴 검출기를 훈련시키기 위해 450,000 개 이상의 얼굴 이미지를 가지고있다. Dlib을 사용할 수 있습니까? 아니면 다른 대안으로 안내해야합니까?> 450K 인스턴스보다 큰 Dlib 오브젝트 검출기
3
A
답변
4
사용할 수있는 데이터의 양은 컴퓨터의 RAM 용량에 따라 달라집니다. 그래서 각 이미지의 크기와 RAM 용량에 따라 많은 것을 배울 수 있습니다.
더 중요한 것은 dlib의 HOG + SVM 감지기에 대해 묻는 것입니다. 또한 얼굴 탐지기를 교육하기 위해 450,000 개의 얼굴이 HOG + SVM의 수익 감소 효과를 훨씬 뛰어 넘습니다. 예를 들어, 매우 정확한 dlib와 함께 제공되는 정면 감지기는 작은 62MB 데이터 세트 (이 하나는 http://dlib.net/files/data/dlib_face_detector_training_data.tar.gz)에서만 학습됩니다. 이러한 종류의 탐지기를 수천 개 이상의 이미지로 교육하면 어떤 추가 정확도를 얻을 수 없습니다.
이제 데이터에 포즈 변동성이 많으면 HOG + SVM이이를 포착 할 수 없습니다. 이 경우 가장 좋은 방법은 각 포즈마다 하나씩 여러 개의 탐지기를 훈련시키는 것입니다. dlib의 imglab 도구의 --cluster 옵션을 사용하여 데이터 세트를 다른 포즈로 자동 클러스터링 할 수 있습니다.
너무 정확하지 않다고 생각합니다. 예를 들어 http://ia.media-imdb.com/images/M/[email protected]_V1_SY1000_CR006651000_AL_.jpg – erogol
이 예제 프로그램 (http://dlib.net/face_detection_ex.cpp)을 실행했습니다. .html) 이미지를 보았고 카메라를보고있는 모든 얼굴을 감지했습니다. –
이상한. 수정 해줘서 고맙다. – erogol