2014-10-08 1 views
2

OCR을 수행하기 위해 NN의 사용법을 이해하기 위해 노력하고 있습니다. 목표는 일반적인 OCR 알고리즘과 조금 다릅니다.신경망을 사용하는 OCR

내 목표는 특정 입력이 특정 문자인지 확인하는 것입니다. 예를 들어 사용자로부터 문자 'A'를 받기를 기대하고 있으며, 내가 입력하지 않았는지 확인해야합니다. 다른 모양.

주어진 입력이 적절한 모양인지 아닌지를 결정할 수 있어야합니다.

내가 읽은 것부터, MLP, SOM 네트워크, 다시 전파 네트워크의 몇 가지 옵션이 있습니다.

SOM 네트워크를 정의해야하는 네트워크를 교육하기 위해 각 모양 (문자)에 대한 샘플을 만들 계획이므로이 내용이 정확합니까?

내가 올바른 방향으로 나를 가리킬 수 있다면 그것은 어떤 방향이 좋을지 잘 모르겠다.

Encog 프레임 워크를 사용할 계획입니다. 중요한지 확실하지 않습니다.

+1

시도해주세요. https://github.com/BVLC/caffe/tree/master/examples/mnist –

답변

2

당신이 묘사 한 바에 따르면, SOM은 감독되지 않은 분류 자이기 때문에 SOM이 최선의 선택이 아닙니다. 각 학습 예제에 대해 클래스 (문자)를 지정하고 있습니다. 그러므로 MLP (multi-layer perceptron)와 같은 감독 된 분류기가 더 적절합니다.

MLP 대 백 전파 네트워크와 관련해서는 다소 잘못된 구분입니다. MLP는 인공 신경망 (ANN)의 일종 인 반면, 역 전파는 학습 방법입니다. MLP는 역 전파 (back-propagation) 또는 다른 방법 (예를 들어, 유전자 알고리즘)을 사용하여 훈련 될 수있다.

+0

정확하게 이해한다면 주어진 입력을 테스트하여 특정 문자와 일치하는지 확인해야합니다. 해당 특정 문자에 대해 숙련 된 MLP를 만들고 입력이 올바른지 결정할 수 있습니까? – aviran

+0

매우 간단하지 않고 솔루션을 설정할 수있는 여러 가지 방법이 있습니다. 하나는 문자를 가지고있는만큼의 출력으로 MLP를 만드는 것입니다. 그런 다음 입력을 가장 높은 출력 값을 갖는 문자로 분류합니다. 또는 각 편지에 대해 한 대 대 나머지 MLP를 교육하고 해당 테스트에 대해 적절한 MLP를 사용할 수 있습니다. 또 다른 요소는 훈련 된 편지가 아닌 입력을 허용할지 여부입니다. 허용되는 경우 귀하의 질문에서 명확하지 않습니다. – bogatron

+0

당신이 언급 한 방법 중 하나가 다른 것보다 정확합니까? 나는 훈련 된 편지 중 하나가 아닌 입력을 허용하지 않을 것입니다. – aviran