2011-01-05 2 views
1

안녕하세요 저는 기계 학습을 실증하고 있습니다. 저는 python과 opencv로 간단한 필기 인식 소프트웨어를 작성하고 싶습니다.필기 인식에 관한 몇 가지 질문이 있습니다.

이제 간단하게 동일한 크기의 대문자 만 인식 할 것입니다. 글자를 인식하는 좋은 방법은 가우스 혼합 모델의 매개 변수를 학습하기위한 기대 최대화 알고리즘을 사용하고, 훈련 세트를 사용하고, 새 글자 가우스 혼합을 훈련 된 것과 비교하는 것입니다. 하지만 얼마나 많은 가우스 혼합을 선택하는 방법을 이해하지 않습니다.

두 번째 문제는 페이지에 얼마나 많은 단어가 있고 얼마나 많은 문자가 있는지 이해하는 것입니다. 나는 em 알고리즘 또는 유사 (예를 들어 k- 수단)가 해결책이 될 수 있다고 생각하지 않지만 확실하게 몇 가지 세분화 문제가 있다고 생각하지 않습니다.

몇 가지 조언이 있습니까?

답변

1

먼저 문자를 정렬해야합니다. 당신이 정직하다고 생각한다면 괜찮아. 그 후에는 2 클러스터로 된 kmeans 세분화를 사용하여 백그라운드에서 글을 클러스터링 할 수 있습니다 (배경은 평이하다고 가정). 일단 당신이 그것을 끝내면, 기본적으로 1의 이진 이미지를 포어 그라운드로, 0을 다시 그라운드로 가져옵니다. 그런 다음 연결된 구성 요소 분석을 수행하여 각 문자를 구분할 수 있습니다.

GMM 대신 신경망을 사용하여 문자를 분류 할 수 있다고 생각합니다. 마찬가지로 당신은 문자 이미지를 정규화하고 26 개의 알파벳에 대해 26 개의 출력으로 픽셀을 신경망에 보낼 수 있습니다.

이것은 문제를 해결하는 한 가지 방법입니다. 당신이 더 많은 정보 나 자료를 구현하거나 참조하기를 원한다면 그것을 요청할 수 있습니다.

덕분에, 크리슈나

+0

당신에게 좋은 답변 대단히 감사합니다. 그래, 나에게 구현 자료를 줄 수있어? – nkint