0

나는 잠시 동안 주변을 둘러 보았지만 내가 달성하고자하는 것을 정확히 설명하는 사람을 찾을 수 없었다.자동으로 방향을 변경하고 비슷한 이미지 자르기

현재 데이터베이스를 만들려는 기존 타자기 문서의 약 25,000 개 이미지가 있습니다. 처음에는 OCR 소프트웨어를 통해 이러한 이미지를 한 번에 실행하고 거기에서 나온 데이터로 작업 할 수있을 것이라고 생각했습니다. 그러나 이미지의 형식에 따라 OCR 소프트웨어를 사용하여 문서의 데이터를 많이 잃지 않고 일괄 변환 할 수 없습니다. 각 사진에 관련 정보의 방향과 배치가 다르므로 하나의 템플릿을 사용하여 OCR 소프트웨어에 어떤 정보를 읽어야하는지 알 수 없습니다. 각 사진은 종이 한 장으로 구성되어 있습니다. 그것에 대한 정보를 얻을 수 있으며, 용지 가장자리 주변의 배경을 볼 수 있습니다.

내가하고 싶은 것은 각 이미지의 테이블이 동일한 위치와 방향을 갖도록 각 이미지를 자동으로 방향을 바꾸고 자르는 방법을 찾는 것입니다. 이렇게하면 OCR 소프트웨어를 사용하여 모든 이미지를 실제 데이터로 일괄 변환 할 수 있습니다. 이 작업을 자동으로 수행 할 방법이 없으면 수동으로 각 문서를 변환하는 데 많은 시간이 걸립니다.

컴퓨터 비전 기술을 사용하여이 작업을 수행 할 수있는 방법이있을 수 있다고 생각하지만이 방법이 실제로 가능한지 실제로 알지 못합니다. These slides은 내가하고 싶은 것과 비슷한 것을 설명하지만 정확하게는 아닙니다. 이 일을 성취하는 방법에 대한 조언을 주시면 감사하겠습니다.

답변

1

자동 소프트웨어를 작성하는 것이 길인지, 나를 믿을 지, 실제로 코드를 작성하는 것보다 수동으로 모든 문서를 정렬하는 데 훨씬 적은 시간이 걸릴 것입니다. 필자가 볼 수있는 한, 일종의 자동 복싱 기술이 PCA 또는 유사한 선을 사용하여 사용될 수 있습니다. 그러나 컴퓨터 비전 학생이나 장래의 학습자가 아닌 경우 수동 방법을 적극 권장합니다.

실망스러운 답변을 드려 죄송합니다.하지만 때때로 약을 복용해야합니다. :-(