tm

    0

    1답변

    r 패키지 tm에 VCorpus() 함수를 사용하고 있습니다. num Author1 Author2 1 1 Text mining is a great time. R is a great language 2 2 Text analysis provides insights R has many uses 3 3 qdap and tm are us

    0

    2답변

    수집 한 많은 짹짹의 쌍 주파수를 계산하고 싶습니다. 그래서 Gephi (네트워크 그래프)에서 시각화에 사용할 수 있습니다. 현재 데이터는 다음과 같습니다 (문자 임). 이 샘플 데이터 세트 str(Tweet_text) chr [1:8661] "habits that separates successful persons from mediocre persons

    0

    1답변

    새로운 질문은 유감이지만 텍스트 마이닝에서는 초보자이고 profy의 조언이 필요합니다. 지금, content_transformer 긴 고통 후에 나는 깨끗한 영장이 다음 질문 예를 들어 1. How select from `dtm` the words with small frequencies , so that the amount of frequencies wa

    0

    1답변

    에 "슬램"패키지를 설치할 수 없습니다 : install.packages("tm", dependencies = TRUE) 다음과 같은 출력 실패 : During startup - Warning messages: 1: Setting LC_TIME failed, using "C" 2: Setting LC_MESSAGES failed, using "C"

    0

    1답변

    tm 객체에서 koRpus 객체로 이동하는 데 문제가 있습니다. tm 도구로 코퍼스를 정규화하고 결과를 koRpus로 lemmatize 한 다음 tm으로 돌아가서 결과를 분류해야합니다. 이렇게하려면 tm 개체를 R 데이터 프레임으로 변환 한 다음 Excel 파일로 변환 한 다음 txt 파일로 변환하고 마지막으로 koRpus 개체로 변환해야합니다. 이 코드입

    -1

    1답변

    topicmodel 코드를 실행할 때 매우 이상한 오류가 발생했습니다. 기본적으로 사용자 주석이있는 .csv 파일이 있습니다. 나는 각각의 주석이 하나의 문서 인 dtm을 만들고 싶다. 나는 8k 개의 주석 샘플을 가져 와서 다음 코드를 사용했다. > #LOAD LIBRARYS > > library(tm) > library(SnowballC) > l

    0

    1답변

    저는 R에서 tm 패키지를 처음 사용합니다. tm_map 함수를 사용하여 문서 - 용어 행렬을 만들려고 시도했지만, 분명히 tm_map(Corpus, function, lazy=TRUE)에 전달 된 함수가 신체. 구체적으로, 문서는 소문자로 변환되지 않습니다. R Studio는 오류나 경고를 표시하지 않습니다. 여기에 무슨 일이 있었나요? 이것이 몇 가지

    1

    1답변

    removeCommonTerms 기능은 removeCommonTerms <- function (x, pct) { stopifnot(inherits(x, c("DocumentTermMatrix", "TermDocumentMatrix")), is.numeric(pct), pct > 0, pct < 1) m <- if (inheri

    0

    1답변

    텍스트 분석을 수행하는 간단한 코드가 있습니다. DTM을 만들기 전에 stemCompletion을 적용합니다. 그러나이 결과물은 내가 잘못하고 있든, 아니면 그것이 행동하는 유일한 길인지를 이해하지 못하는 것입니다. text-mining-with-the-tm-package-word-stemming 여기를 참조 따른 후, 내 DTm을 수축 모든 (반환 '내용

    0

    1답변

    5k, 50k, 7.5k, 75k, 10K, 100K와 같은 단어가있는 자료가 있습니다. 그래서 tm 패키지를 사용하여 TDM을 만들 때 10k와 100k와 같은 용어가 별도로 추출됩니다. 그러나 5k와 7.5k는 별도의 용어로 추출되지 않습니다. 이제 구두점 수정 후 "7.5k"가 "75k"용어 아래에 떨어질 수 있지만 "5k"는 어떻게되는지 이해합니다.