TV 영상의 자막에 대해 OCR을 적용하고 있습니다. (나는 Tesseact 3.x w/C++을 사용하고 있습니다.) 텍스트와 배경 부분을 OCR의 전처리로 분리하려합니다.OCR 전처리를 위해 이미지에서 노이즈와 텍스트를 분리하는 방법
여기서 원 화상이다 :
그리고, 전처리 된 이미지 :
문자 인식 결과이다 Sicemn 클론
상기 전처리 된 이미지가 도시 된 바와 같이, OCR 모듈이 j를 수행하지 못하도록 문자 주위에 남아있는 "안개"가 있습니다. ob 제대로.
"안개"를 프로그램 적으로 제거하거나 사전 처리 된 이미지에서 이미지를 제거/축소 할 수있는 이미지 처리를 인식하는 방법이 있습니까?
전처리 로직이 많이 다른 이미지를 처리하도록 최적화되어 있기 때문에, 차라리에 "깨끗한"전처리 된 이미지 사전 처리 로직을 수정하는 것보다 (이 사진에 최적화 이후 다른 사진에 영향을 미치는 수있는) 방법
를 찾으려면 어떤 제안이라도 대환영입니다.
업데이트 분명히, sixela의 대답은 중대하다, 케이스의 대부분 작동합니다. 결과
예 : 겉으로
, 가우스가 작동하지 않습니다 이 사건은 배경도 작동하지 않는 경우의
예 텍스트와 유사한 색상을 포함입니다 필터가 이러한 유형의 푸티 지에서 문제를 일으키는 것으로 보입니다. 다른 푸티지를 사용하려면 다른 접근 방식이 필요합니다.
캡션 것 같은 여러 연속 프레임 동안 백그라운드 변경 남아있다. n 프레임 동안 변경되는 픽셀과 거의 동일한 픽셀을 분할 할 수 있습니다. 그것은 완벽하지는 않지만 많은 경우에 도움이 될 수 있습니다. –
안녕하세요 애드리안, 귀하의 조언을 주셔서 감사합니다. 예, 저는 이미 OpenCV에서 absdiff와 MOG 필터를 사용하여 그 방법을 시도했습니다. 일반적인 장면에서 프레임의 오브젝트가 너무 빨리 움직이지 않기 때문에 잘 작동하지 않습니다. 자막이 사람 위에 겹쳐있는 경우 너무 빨리 움직이지 않지만 자막은 1-2 초 동안 만 나타납니다. 차 체이스 장면이라면, 그것은 효과가있을 것입니다 .. – Aki24x