나는 이미지 처리에 대한 기본적인 이해를 가지고 있으며, 이제 Gonzales의 "Digital Image Processing"에 대한 심층적 인 연구를하고있다.기하학적 형태를 기반으로 이미지상의 객체 감지하기
주어진 이미지와 관심있는 객체가 근사 된 형태 (예 : 원, 삼각형) 인 경우 이미지에서이 객체를 찾는 가장 좋은 알고리즘/방법은 무엇입니까?
개체가 약간 변형 될 수 있으므로 무차별 접근 방식이 도움이되지 않습니다.
나는 이미지 처리에 대한 기본적인 이해를 가지고 있으며, 이제 Gonzales의 "Digital Image Processing"에 대한 심층적 인 연구를하고있다.기하학적 형태를 기반으로 이미지상의 객체 감지하기
주어진 이미지와 관심있는 객체가 근사 된 형태 (예 : 원, 삼각형) 인 경우 이미지에서이 객체를 찾는 가장 좋은 알고리즘/방법은 무엇입니까?
개체가 약간 변형 될 수 있으므로 무차별 접근 방식이 도움이되지 않습니다.
방정식으로 설명 된 패턴을 찾을 수있는 허프 (Hough) 변환을 사용하는 것이 좋습니다. Hough 변형은 변형 된 객체에도 효과적입니다.
알고리즘 및 구현 자체는 매우 간단합니다. 자세한 내용은 여기 http://en.wikipedia.org/wiki/Hough_transform에서 찾을 수 있습니다.이 알고리즘의 소스 코드도 참조 페이지 (http://www.rob.cs.tu-bs.de/content/04-teaching/06-interactive/HNF.html)에 포함되어 있습니다.
여러분을 돕기를 바랍니다.
나는 두 단계로 문제에 보일 것이다
첫번째 를 개체의 외부 경계 발견 : 나는 당신이 충분한 이미지를 대조 한 랬있어 을 쉽게 임계 값을 바이너리를 얻을 수 개체의 이미지. 객체 경계 체인 코드를 추출해야합니다. 형태 (원, 다각형, ...) 추론 경계의 모양를 분석 한 후
: 당신은 경계 체인의 각 점에서 곡률을 계산하고, 따라서 얼마나 많은 날카로운 각도를 결정할 수있다 (즉 높은 곡률 가치)가 있습니다. 여러 개의 날카로운 각은 다각형이 있음을 의미하며 아무 것도 원형을 가짐을 의미하지 않습니다 (일정한 곡률).
당신은 바이너리 이미지에서 객체의 경계를 얻을 Gonzalez's Digital Image Processing, chapter 11에서 분석하는 방법하는 방법에 대한 설명을 찾을 수 있습니다.
또한 Gonzalez가 DIP에서 설명한 몇 가지 기술을 구현하는 insightful presentation on binary image analyis (PPT)과 matlab script을 발견했습니다.
깨달음 나는 묻는 것과는 다른 질문에 답하고있었습니다. 그러나 당신은 여전히 이런 식으로 객체를 찾은 다음 찾고있는 양식 만 유지할 수 있습니다. – Ivan
오리엔트 그라디언트의 히스토그램 (가장자리 방향 히스토그램이라고도 함)을 사용해보십시오. 우리는 도로 표지판을 탐지하는 데 사용했습니다. http://en.wikipedia.org/wiki/Histogram_of_oriented_gradients과 Bill Triggs의 논문이 여러분을 시작하게합니다.
OpenCV을 사용 하시길 강력히 권장합니다. 컴퓨터 시각 자료와 관련하여 큰 도움이되는 훌륭한 컴퓨터 비전 라이브러리입니다. 그들의 웹 사이트는 실제로 매력적이거나 도움이되지 않지만 API는 실제로 강력합니다.
웹상에 많은 문서가 없기 때문에 많은 도움이되는 책은 Learning OpenCV입니다. API와 함께 제공되는 설명서는 훌륭하지만 사용법을 배우기에는 좋지 않습니다.
문제와 관련하여 Canny Edge detector를 사용하여 항목의 경계를 찾은 다음 분석하거나 Hough transform을 수행하여 선 및 또는 원을 검색 할 수 있습니다.
특별히 '얼굴 인식'을 시도 할 수 있습니다.왜냐하면, 그것이 특정 주제라는 것을 알기 때문입니다. 반면에 '얼굴 탐지'등 EmguCV 당신을 위해 유용 할 수 있습니다 .. 인텔 OpenCV 이미지 처리 라이브러리에. NET 래퍼입니다.
Sherbooke 대학의 교수 Jean Rouat처럼 중립 스파이크 신경 네트워크를 처리하여 이미지의 대상을 찾는 방법을 찾았습니다. 그의 기술 이름 RN-SPIKES은 라이센스가있는 것으로 보입니다.
당신이 알아 차릴대로, 호프 변형은 다소 짐승입니다. 그것은 라인, 어쩌면 서클을 위해 작동합니다. 그러나 Hough 공간은 더 많은 매개 변수가있는 모양으로 폭발합니다. – Ivan