2

실내 영역을 분할하고 대상을 찾고 싶습니다. 그런 다음, 스테레오 비전을 사용하여 객체의 데카르트 위치를 찾고 싶습니다. 최종 목표는 로봇에 의해 테이블에서 대상을 선택하는 것 (그리고 궤도를 제어하는 ​​것)입니다. 개체의이미지 분할 및 객체 감지 (실내 환경)에 가장 적합한 실시간 알고리즘은 무엇입니까?

예 : 의자, 테이블, 펜, 주사기, 스테이플러, 컵, 나사, 장난감 인형, 눈금자, 작은 상자, 우유, 과일, ...

내 첫 번째 우선 순위가되고있는 실시간 (10 Hz).

저는 인텔 코어 i7-3820 (3.6 GHz)에서 Windows 10 64 비트, MATLAB 2016b 64 비트의 이미지를 캡처하기 위해 ZED 스테레오 카메라를 사용합니다.

카메라 출력은 720x1280의 두 색 (오른쪽 및 왼쪽 이미지)의 조합 인 720x2560 픽셀입니다.

테이블에서 알 수없는 개체의 위치를 ​​찾기 위해 감독되지 않은 알고리즘을 사용하는 것을 선호합니다. 그러나 실시간으로 종료되어야합니다. 실시간으로 불가능하다면 기대치를 낮추고 감독 알고리즘을 사용하여 미리 정의 된 개체를 찾습니다.

답변

2

내가 말한 문제 (분할 및 탐지)는 여전히 열린 문제로 여겨지므로 최종 해결책은 없다고 생각합니다. 그러나, 지난 수년 동안, 뛰어난 성능과 속도로 디인 플러 닝 (deeplearning)을 사용하여 객체 감지 및 의미 론적 세분화를 해결하기위한 많은 작업이 수행되었습니다.

실시간으로 물체를 탐지하기 위해 나는 YOLOSSD의 결과를 확인하고 Faster R-CNN도보고 싶습니다. 왜냐하면 10Hz의 요구 사항이 아카이브 될 수 있기 때문입니다.

개체 분할의 경우 835fps를 요구하는 DCNN으로 시도 할 수 있습니다. DeepLab 또는 FCN과 같은 다른 것들이 있지만 그러한 시스템/아키텍처의 속도가 무엇인지 명확하지 않습니다.