6

- CNN (콘벌 루션 신경망) 객체 검출이 욜로/DenseBox의 접근법에 근거한다 : https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/DetectNet이 불변 (invariant)으로 회전함에 따라 최신 CNN (길쌈 신경망)이 있습니까? 공지 엔비디아 DetectNet로서

DetectNet가 인기 GoogLeNet 네트워크의 확장이다. 확장은 Yolo 및 DenseBox 논문에서 취한 접근법과 유사합니다. 여기에 표시된

과 같은 , DetectNet는 회전과 물체 (자동차)을 감지 할 수 있습니다

enter image description here

https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/는 DetectNet로 CNN (길쌈 신경망) 불변 회전 현대 있습니까?

임의의 회전 각도에서 오브젝트를 감지하기 위해 동일한 회전 각도로 수천 개의 다른 이미지에서 DetectNet을 학습 할 수 있습니까?

enter image description here

그리고 무엇 회전의 불변에 대한 : DetectNet 욜로, 욜로 v2를, DenseBox있는 기반?

답변

3

아니오

CNN은 불변으로 회전하지 않습니다. 가능한 모든 순환 게재로 이미지를 설정해야합니다.

CNN을 훈련시켜 이미지를 미리 정의 된 범주로 분류 할 수 있습니다 (예제에서와 같이 이미지의 여러 객체를 감지하려면 분류 자로 이미지의 모든 부분을 스캔해야 함).

CNN은 교육 데이터에서 작은 수평 또는 수직 움직임에 대해 변하지 않습니다.

+0

슬라이딩 윈도우 방식에 대해 이야기하고 있습니까? – mrgloom

+0

@mrgloom. 슬라이딩 윈도우와는 아무 관련이 없습니다. – Kershaw

+0

@Kershaw는 분류 자로 이미지의 모든 부분을 스캔합니다 .'? – mrgloom

1

Rob의 답변에 추가하면 일반적으로 CNN 자체가 번역 불변이지만 회전 및 크기 조정은되지 않습니다. 그러나 가능한 모든 회전을 교육 데이터에 포함시키는 것은 의무 사항이 아닙니다. 최대 풀링 레이어는 회전 불변성을 도입합니다.

This image 게시자 : Franck Dernoncourt here 당신이 찾고있는 것일 수도 있습니다. 주로하기 때문에 최대 풀링의 훈련 데이터에있는 CNN은 작은 수평 또는 수직의 움직임에 불변

를 말합니다 : 롭의 대답에 커쇼의 댓글과 관련하여 두 번째로

.

CNN이 변환 불변 인 주된 이유는 컨볼 루션 (convolution)입니다. 필터는 전체 이미지를 가로 질러 움직이기 때문에 필터는 이미지의 위치에 관계없이 피쳐를 추출합니다. 피처의 픽셀 표현이 다르기 때문에 이미지가 회전되거나 크기가 조정되어 필터가 실패하는 경우입니다.

출처 : Aditya Kumar Praharaj의 대답은 this link입니다.