2017-03-15 16 views
1

처음에는 영어로 유감스럽게 생각합니다.Treetag 패키지 koRpus R

R에 koRpus 패키지의 treetag 기능에 대한 질문이 있습니다. Tylagger로 텍스트를 lemmatized하고 싶습니다. 는 내가 treetag 기능 사용 : 나는 토큰, 태그를 얻을

treetag(file, treetagger = "manual", lang = "fr", 
     TT.options = list(path, preset="fr")) 

...

을하지만이 원형 화 한 후, 나는 태그 텍스트를 획득 할 내가이 작업을 수행하는 솔루션을하지 않았습니다. 나는 내 텍스트에서 각 토큰을 그의 보조 정리로 대체하고 싶다.

그래서 나에게 해결책이 있습니까?

대단히 감사합니다!

답변

1
Proof next steps: 

txt1 <- treetag(c(“played”, “saw”), 
treetagger=”manual”, lang=”en”, 
encoding = “UTF-8″, 
TT.options=list(path=”C:/TreeTagger”, preset=”en”), 
format = “obj”) 

text2 <- slot(txt1 , "TT.res") 

text3<- ifelse(text2$lemma == "<unknown>", text2 $token, 
          text2$lemma)