전처리 된 자료 모음에서 하나를 만들려고 할 때 다음 오류가 발생하는 R의 tm 패키지를 사용하여 용어 문서 행렬을 만들 수 없습니다.R에서 tm 패키지를 사용하여 TermDocumentMatrix를 만드는 중 오류가 발생했습니다
Error in UseMethod("TermDocumentMatrix", x) :
no applicable method for 'TermDocumentMatrix' applied to an object of class
"character"
아래는 제가 사용하고있는 스크립트입니다. 나는 tm 패키지 v0.7-1과 함께 R v3.4.1을 사용하고 있습니다. 내가 TermDocumentMatrix 믿을
data <- readLines("Data/en_US/en_US_sample.txt", n = 100)
data <- Corpus(VectorSource(data))
data <- tm_map(data, removePunctuation)
data <- tm_map(data, removeNumbers)
data <- tm_map(data, content_transformer(tolower))
data <- tm_map(data, removeWords, stopwords("en"))
data <- tm_map(data, stripWhitespace)
words <- TermDocumentMatrix("data")
그래서 나는 tm_map 사용 PlainTextDocument 내 신체를 강요 시도 일부 지정된 텍스트 문서 형식으로 코퍼스를 필요로하지만 문제가 해결되지 않습니다. VectorSource에서 Corpus를 사용하여 텍스트 데이터를로드 할 때 생성 된 객체는 클래스를 SimpleCorpus으로 표시하지만 완전히 확실하지는 않습니다.
도움을 주시면 감사하겠습니다. 감사!