계약 작업을 위해, 나는 독일 연방 의회 (Federal Parliament of Germany)에서 많은 오래된 스캔 된 그래픽 전용 총회 토론 프로토콜 PDF를 디지털화해야합니다. 문제는 이러한 파일의 대부분은 2 열 형식을 가지고있다 : Sample Protocol http://sert.homedns.org/img/btp12001.png 내 다음 질문
Wikipedia에 따르면 "인쇄 된 문서를 스캔하는 것과 같이 명확한 이미징을 사용할 수있는 응용 프로그램에서는 라틴 스크립트, 타이프 텍스트의 정확한 인식이 현재 크게 문제로 간주됩니다." 그러나, 그것은 인용문을 제공하지 않습니다. 내 질문은 : 사실입니까? 현재의 최첨단 기술은 영어 텍스트를 잘 스캔 할 수 있도록 아주 훌륭하게 만들어 졌는가? 또는