tm

    0

    1답변

    제가 코퍼스에있는 400 개 이상의 문서의 전체 또는 일부 텍스트 콘텐츠를 표시하려고합니다. 대신이 반환, 내가 기능 writeLines을 사용한 적이 있지만,이 문서에 포함 된 실제 텍스트를 반환하지 않습니다 이렇게하려면 : ("", "") 목록 (리스트 (콘텐츠 = C를 meta = list (작성자 = 문자 (0), atetimestamp = 목록 (

    0

    2답변

    이 상당히 특정 질문입니다, 그러나 희망은 다른 너무 사람이 관련이 문서의 수를 찾을 수있는 간단한 방법이 있다면 사람이 알고 있나요 {tm} 패키지가있는 코퍼스에 용어가 나타납니다. 기본적으로 필자가 작성한 용어 - 문서 행렬이있는 경우 특정 용어에 해당 행이 얼마나 희박한 지, 즉 해당 행에 대해 0이 아닌 값을 가진 행이 몇 개 있는지 확인하고자합니다

    1

    1답변

    Rtm 패키지를 사용하여 텍스트에서 식별 한 패턴을 사용하여 txt (또는 HTML) 문서에서 날짜를 추출하고 싶습니다. 내 PC의 신문 기사는 data_X_txt 및 data_X 폴더 (HTML)에 있습니다. 각 폴더에는 하나의 txt 또는 html 문서에 모든 신문 기사가 들어있는 회사의 이름을 딴 문서가 들어 있습니다. 나는 Lexis Nexis에서

    1

    1답변

    이 문제점을 해결하기 위해 마음 먹었습니다. 그래서처럼 tm::dtm에서 가장 자주 단어를 추출하고 있습니다 : 290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391 916 875 860 851 844 823 822 766 759 743 701 700 686 673 6

    0

    1답변

    "COLORED PENCIL STAEDTLER NORIS CLUB ASSORTED COLORS PKT12"라는 문자열이 있다고 가정 해 봅니다. 내 코드는 다음과 같습니다 > a1 <- VCorpus(VectorSource("COLORED PENCIL STAEDTLER NORIS CLUB ASSORTED COLORS PKT12")) > a3 <- Term

    -4

    1답변

    데이터 프레임의 영숫자 벡터에서 문자를 제거하는 코드를 찾고 있습니다. 다음이 내 데이터 열 : F9667968CU 67968PX11 3666SP 6SPF10 2323DL1 23DVL10 2016PP07 그리고 이것이 내가 사용한 코드 : 아래 for(i in 1: length(rownames(testsample))) { tests

    2

    2답변

    내 컴퓨터에서 DocumentTermMatrix를 사용할 때 단어를 소문자로 바꿉니다. 나는 낙타 사건을 보전하고 싶습니다. 어떻게해야합니까? as.matrix(DocumentTermMatrix(Corpus(VectorSource(c("Hello", "World"))))) 저는 열 이름이 hello와 world 대신 hello와 world가되도록하고 싶

    0

    1답변

    TF-IDF 가중치가있는 일부 문서의 bag-of-word 표현에 document-term-matrix가 있다고 가정합니다. 예 : library(tm) x <- c("a cat sat on a mat", "cat and dog are friends", "friends are sitting on a mat") corpus <- Corpus(VectorS

    2

    1답변

    온라인 과정 프로젝트 작업의 일환으로 R을 사용하여 기본 단어 예측 제품을 만들었습니다. 나는 Tamil 단계에서 다음 단어를 예측하기 위해 그것을 확장하고 싶었다. HC Corpora 웹 사이트에서 타밀어 언어 샘플을 사용했습니다. 나는 그것을 R로 읽고 tm() 자료를 만들었다. testData <- "திருவண்ணாமலை, கொல்லிமலை, சது

    0

    2답변

    시작 TM를 사용하여 R의 요소 - 현명한,이 문서 말뭉치 : library(tm) c1 <- Corpus(VectorSource(c("document 1 corpus 1 text", "document 2 corpus 1 text"))) c2 <- Corpus(VectorSource(c("document 1 corpus 2 text", "document