topicmodels

0열

1답변

"euroscepticism"또는 "eurosceptic"이라는 용어를 사용하는 기준에 따라 수집 된 뉴스 기사의 데이터 세트가 있습니다. 이 기사의 주 주제를 확인하기 위해 lda 패키지 (dfm 행렬을 사용하여 quanteda 내장)를 사용하여 주제 모델을 실행했습니다. 그러나 내가 관심있는 단어는 어떤 주제에도 나타나지 않습니다. 따라서이 단어들을 모

0열

1답변

인접 주제 그래프

주제 이상의 단어 배포판 네트워크 (주제 관련)를 플로팅하려고합니다. 이 코드 [source]를 사용하여 : post <- topicmodels::posterior(ldaOut) cor_mat <- cor(t(post[["terms"]])) cor_mat[ cor_mat < .05 ] <- 0 diag(cor_mat) <- 0 graph <- g

2열

1답변

R LDA 주제 모델 델타

에 대한 후방을 얻기 위해 어떻게는 R 패키지 topicmodels를 사용하여 LDA를 실행하고 나는 나의 이해에서, 델타 값을 얻기 위해 노력 해왔다 주제를 통해 단어에 대한 디리클레의 매개 변수입니다. 그러나 나는 그 값에 접근 할 수 없었다. 난 단지 [email protected]@delta 또는 slot([email protected],"del

0열

1답변

주어진 문서에서 LDAvis가 발생하여 생성 된 주제의 사후 확률을 찾을 수 있습니까? 어떻게 그렇습니까?

질문에서 알 수 있듯이, 나는 R에 익숙하지 않고 이것에 대한 약간의 도움을 줄 수 있습니다. 주제 모델을 만들 때 아래의 (A) 및 (B)의 LDA 및 LDAvis 코드를 실험했습니다. (A)의 LDA를 사용하면 다른 자료 세트의 변수를 사용하여 회귀 분석을 수행하는 데 사용한 자료의 각 문서에서 발생하는 사후 확률을 찾을 수 있습니다. (B), LDAv

-1열

1답변

R : topicmodels, 2 개의 유사한 문서, 코드가 하나와 작동, 다른 코드와 일치하지 않음

topicmodel 코드를 실행할 때 매우 이상한 오류가 발생했습니다. 기본적으로 사용자 주석이있는 .csv 파일이 있습니다. 나는 각각의 주석이 하나의 문서 인 dtm을 만들고 싶다. 나는 8k 개의 주석 샘플을 가져 와서 다음 코드를 사용했다. > #LOAD LIBRARYS > > library(tm) > library(SnowballC) > l

1열

2답변

말렛 구성 파일의 널 소스

교육 주제에 말렛을 사용하고 싶습니다. 내 데이터가 하나의 파일에 있으므로,이 단일 파일을 구성하는 방법에 대한 망치 문서를 연구합니다. 라인 섹션 당 하나의 파일, 하나 개의 인스턴스에서 Mallet website에서 은, 그것은 말했다 : [URL] [언어] [페이지의 텍스트 ...] 에서 이 경우 각 줄의 첫 번째 토큰 (쉼표로 구분 된 공백으로 구분