2017-02-15 12 views
0

Devnagaric NLP를 처음 사용하는 경우 Devnagaric 언어로 NLP를 시작하는 데 도움이되는 그룹 또는 리소스가 있습니다 (주로 네팔어 또는 힌디어와 유사). Devanagaric 용 글꼴을 개발하고 글꼴 처리 응용 프로그램을 만들 수 있기를 원합니다. 누구든지 (이 분야에서 일하고 있다면) 나에게 조언을 해줄 수 있다면 그것은 매우 주목할 만하다. 사전에 감사Devanagaric text processing (NLP) 시작 위치

답변

0

날 Devnagaric 언어로 NLP을 시작하는 데 도움이하는 어떤 그룹이나 자원이 있습니까?

Madan Puraskar Pustakalaya가 속한 Bhasa Sanchar project은 네팔어 코퍼스를 개발했습니다. 위의 링크에 제공된 연락처를 통해 비상업적 목적으로 네팔어 자료를 요청할 수 있습니다.

파이썬의 NLTK에는 힌디어 언어가 있습니다. 당신은 기반 NLP를 데브 나가 리어 통찰력을 얻기 위해

from nltk.corpus import indian 

사용하여 가져올 수 있습니다, 당신이 연구 papers.Nepali는 아래-자원이 언어 인 통과 제안, 아직 많은 작업이 수행되어야하고, 그것을 얻을 어려울 수 있습니다 같은 내용.

기초를 파악하기 위해 언어 감지, 텍스트 분류, 정서 분석 (특히 코퍼스의 POS 태깅 라이브러리를 기반으로 함)을 조사해야합니다. 질문

의 두 번째 부분에 대한

나는 확신 글꼴 개발은 자연 언어 처리의 도메인 아래에 오지 않는입니다. 다른 의미가 있니?

0

내가 Devnagaric NLP에 새로운 오전, 내가 Devnagaric 언어로 NLP (대부분 네팔어 언어 나 힌디어 등 유사)

주어진 묻어을 사용할 수 있습니다 시작하는 데 도움이하는 어떤 그룹이나 자원이 있습니까 빠른 텍스트 [https://fasttext.cc/docs/en/pretrained-vectors.html#content] 및 텍스트 분류, 정서 분석 LSTM과 같은 일부 깊은 학습 RNN 모델을 사용하십시오.

당신은 [https://github.com/anoopkunchukuttan/indic_nlp_library]

NLTK는 POS 태그와 당신이 할 수있는 자연 언어 처리 관련 작업에 대한 인도 lanugages을 지원 당신이 여기에서 참조 할 수 있습니다, 인도의 언어를 처리하기 위해 여기에 개체 명 recoginition [http://ltrc.iiit.ac.in/ner-ssea-08/index.cgi?topic=5]

에 대한 몇 가지 데이터 세트를 찾을 수 있습니다 여기를 참조하십시오 [http://www.nltk.org/_modules/nltk/corpus/reader/indian.html]