2017-04-12 7 views
0

Tesseract wiki에서 교육에 사용되는 레이블이 지정된 tif/box 파일 파일 이름의 형식은 [lang].[fontname].exp[num]입니다. fontname은 실제로 교육에 영향을 주나 그냥 부기를 위해서입니까?Tesseract 상자/tif 파일 이름의 글꼴 이름이 중요합니까?

필자의 경우 글꼴이 다른 많은 수의 문서 이미지가 있는데 어떤 글꼴이 들어 있는지 알지 못합니다. 수동으로 레이블을 붙인 각 문서에 대해 eng.idontknow.exp[num]을 사용할 수 있습니까? 아니면 어떤 이유로이 교육을 엉망으로 만들 수 있습니까? 미리 감사드립니다!

답변

0

실제 글꼴을 일치시키는 것이 가장 좋습니다 (가능한 OCR 후 분석을 돕기 위해).하지만 임의의 글꼴 이름이 될 수 있습니다.