2017-10-26 9 views
0

전처리 된 자료 모음에서 하나를 만들려고 할 때 다음 오류가 발생하는 R의 tm 패키지를 사용하여 용어 문서 행렬을 만들 수 없습니다.R에서 tm 패키지를 사용하여 TermDocumentMatrix를 만드는 중 오류가 발생했습니다

Error in UseMethod("TermDocumentMatrix", x) : 
    no applicable method for 'TermDocumentMatrix' applied to an object of class 
"character" 

아래는 제가 사용하고있는 스크립트입니다. 나는 tm 패키지 v0.7-1과 함께 R v3.4.1을 사용하고 있습니다. 내가 TermDocumentMatrix 믿을

data <- readLines("Data/en_US/en_US_sample.txt", n = 100) 
data <- Corpus(VectorSource(data)) 
data <- tm_map(data, removePunctuation) 
data <- tm_map(data, removeNumbers) 
data <- tm_map(data, content_transformer(tolower)) 
data <- tm_map(data, removeWords, stopwords("en")) 
data <- tm_map(data, stripWhitespace) 
words <- TermDocumentMatrix("data") 

그래서 나는 tm_map 사용 PlainTextDocument 내 신체를 강요 시도 일부 지정된 텍스트 문서 형식으로 코퍼스를 필요로하지만 문제가 해결되지 않습니다. VectorSource에서 Corpus를 사용하여 텍스트 데이터를로드 할 때 생성 된 객체는 클래스를 SimpleCorpus으로 표시하지만 완전히 확실하지는 않습니다.

도움을 주시면 감사하겠습니다. 감사!

답변

0

당신은 실수로 마지막 줄에서 문자 "data" (인용 부호 참고)을 data 대신에 TermDocumentMatrix() 함수로 우연히 전달했습니다.