OCR을 수행하기 위해 NN의 사용법을 이해하기 위해 노력하고 있습니다. 목표는 일반적인 OCR 알고리즘과 조금 다릅니다.신경망을 사용하는 OCR
내 목표는 특정 입력이 특정 문자인지 확인하는 것입니다. 예를 들어 사용자로부터 문자 'A'를 받기를 기대하고 있으며, 내가 입력하지 않았는지 확인해야합니다. 다른 모양.
주어진 입력이 적절한 모양인지 아닌지를 결정할 수 있어야합니다.
내가 읽은 것부터, MLP, SOM 네트워크, 다시 전파 네트워크의 몇 가지 옵션이 있습니다.
SOM 네트워크를 정의해야하는 네트워크를 교육하기 위해 각 모양 (문자)에 대한 샘플을 만들 계획이므로이 내용이 정확합니까?
내가 올바른 방향으로 나를 가리킬 수 있다면 그것은 어떤 방향이 좋을지 잘 모르겠다.
Encog 프레임 워크를 사용할 계획입니다. 중요한지 확실하지 않습니다.
시도해주세요. https://github.com/BVLC/caffe/tree/master/examples/mnist –