2017-11-02 8 views
1

터키어로 CoreNLP의 NN 기반 종속성 파서를 교육하려고합니다. 나는 파서의 문서에서 아래 명령을 발견했다 :스탠포드 CoreNLP 종속성 구문 분석기 지원되지 않는 언어로

Train a parser with CoNLL treebank data: java edu.stanford.nlp.parser.nndep.DependencyParser -trainFile trainPath 
-devFile devPath -embedFile wordEmbeddingFile -embeddingSize wordEmbeddingDimensionality -model modelOutputFile.txt.gz 

modelOutputFile이 무엇인지 정확히 알 수 없었다. 이 파일은 교육 단계에서 작성되었다는 문서에 명시되어 있습니다. modelOutputFile은 내가 생성해야하는 사전 생성 된 파일입니까, 아니면 교육 단계에서 자동으로 작성되는 빈 파일입니까?

도움을 주시면 감사하겠습니다.

답변

1

교육 과정이 완료되면 숙련 된 모델을 modelOutputFile.txt.gz으로 작성해야합니다. 그런 다음 훈련 된 파일을 사용하여 새 텍스트를 구문 분석 할 수 있습니다. 전체 문서는 여기에 있습니다 : https://nlp.stanford.edu/software/nndep.shtml