객체 인식을 위해 신경망을 사용하는 장난감 프로젝트에 대해 생각하고 있습니다. 하나의 특정 각도에서 보았을 때 내 대상의 일부는 상당히 유사하지만 다른 각도에서 볼 때 쉽게 구별 할 수 있습니다. 따라서 내 질문 :객체 감지를 위해 신경망에 같은 객체의 여러 이미지를 제공하는 방법
같은 개체의 여러 이미지를 네트워크에 공급하는 방법은 무엇입니까? 또는 다른 각도로 찍은 여러 이미지를 이용할 수있는 네트워크 아키텍처가 있습니까?
저는 기계 학습 기술에 대해 잘 알고 있지만 신경 네트워크에 대한 기본 지식 만 가지고 있습니다. 그래서 내가 여기서 찾고있는 것은 방법, 기술 및 기타 전문 용어뿐만 아니라 Google 검색과 관련이있을뿐만 아니라 관심있는 특정 논문이나 기사에 대한 링크입니다.
다른 각도로 무엇을 의미합니까? 그것은 이미지를 90도 회전시키는 것과 같습니다, 180도는 다른 물체를 보여 줍니까? –
@Pramod : 아니요 두 개의 다른 물체가 주어진 각도에서 볼 때 똑같아 보입니다. 주어진 축에서 양쪽 모두 90deg만큼 회전 시키면 구별 할 수 있습니다. 따라서 적절하게 분류 할 수 있도록 다른 각도의 이미지가 필요합니다. – Toby
그래서 데이터 확대에 대해 이야기하고 있습니다. 데이터 증가는 데이터 크기를 증가시키고 CNN은 실제로 다른 각도에서 이미지를 공급함으로써 강건 해집니다. 이렇게하면 모든 네트워크가 향상됩니다. 이 질문을 참조하십시오 https://datascience.stackexchange.com/questions/5224/how-to-prepare-augment-images-for-neural-network –