2010-04-07 6 views
2

스탠포드 POS 태거를 처음 사용합니다.스탠포드 POS 태그 지정기 자바 프로그램의 maxentTagger

자바 프로그램에서 Tagger를 호출하고 출력을 텍스트 파일로 전달해야합니다. Stanford-postagger에서 소스 파일을 추출하고 maxentTagger를 호출 해 보았습니다. 그러나 모두 오류 및 경고입니다.

내 프로그램에서 maxentTagger를 호출하는 방법에 대해 누군가가 처음부터 알 수 있고, 필요한 경우 classpath를 설정하고 다른 단계를 수행 할 수 있습니까? 제발 도와주세요.

+0

당신은 그냥 자신의 자바 코드에서 스탠포드 POS 술래에 문제가 만드는 전화가 있습니까 , 또는 명령 줄에서 패키지를 실행하는 데 문제가 있습니다. 후자라면, 함께 배포되는 README에서 Quick Start 섹션을 보셨습니까? – dmcer

답변

3

글쎄, 당신은 컴파일 또는 예를 들어, 클래스 패스에 스탠포드의 JAR 파일을 추가 할 필요가 프로그램을 호출 할 때 :

java -classpath stanford-postagger.jar [MyProgram] 

그런 다음 코드에서 당신은, 관련 패키지를 가져해야합니다 대부분의 일을 필요가 edu.stanford.nlp.tagger.maxent에있는 것 같습니다.

인스턴스화 MaxentTaggerwell described in the JavaDoc입니다,하지만 난 여기의 일부를 반복 할 수 있습니다 새로운 :

MaxentTagger tagger = new MaxentTagger("models/left3words-wsj-0-18.tagger"); 

taggerString에 태그 :

String taggedString = tagger.tagString("Here's a tagged string.") 

새로운 술래를 만들려면

또한 Stanford의 NLP 도구를 사용하여 문장을 만들고 태그 할 수 있습니다. BufferedReader 사용하여 파일을 읽고 문장을 작성

Sentence sentence = Sentence.readOneSentence(in); // in is a BufferedReader 

는 다음과 같은 문장을 태그를 당신의 tagger :

Sentence taggedSentence = tagger.tagSentence(sentence);