topic-modeling

1열

1답변

'씨앗'은 LDA 주제 빈도 (R)를 결정하기 위해 'ldatuning'에서 무엇을합니까?

저는 LDA (주제어)에서 주제 빈도를 결정하는 여러 가지 방법을 시도해 왔으며 매우 유용한 모양의 패키지 ldatuning을 우연히 발견했지만 제어 매개 변수와 특히 시드의 예제 값을 파악할 수 없습니다. library("topicmodels") data("AssociatedPress", package="topicmodels") dtm <- Assoc

0열

1답변

명령 줄에서 Java 클래스로 훈련 된 주제 모델을 읽는 방법은 무엇입니까?

그래서 저는 명령 행에서 MALLET으로 작성된 숙련 된 모델을 가지고 있습니다. 어떻게 든이 훈련 된 모델을 Java 클래스로 가져오고 싶습니다. 나는 MALLET의 API 문서를 살펴본 후 ParallelTopicModel 클래스를 보았지만 내가하고자하는 ParallelTopicModel으로 모델을 가져 오는 적절한 방법을 찾지 못했습니다. Java 클

2열

1답변

R LDA 주제 모델 델타

에 대한 후방을 얻기 위해 어떻게는 R 패키지 topicmodels를 사용하여 LDA를 실행하고 나는 나의 이해에서, 델타 값을 얻기 위해 노력 해왔다 주제를 통해 단어에 대한 디리클레의 매개 변수입니다. 그러나 나는 그 값에 접근 할 수 없었다. 난 단지 [email protected]@delta 또는 slot([email protected],"del

0열

1답변

MALLET에서 주제 배포 파일의 열 순서 변경

MALLET은 주제 모델을 학습하는 동안 --output-doc-topics 매개 변수를 사용하여 각 문서의 주제 분포가있는 탭으로 구분 된 파일을 생성합니다. 이 모양은 다음과 같습니다. doc# filename topic# weight 0 file:/.../document_01.txt 3 0.2110215053763441 14 0.1330645161

0열

1답변

R의 잠재 Diriclichit 할당

텍스트 파일에서 주제 분석을 수행하는 방법? 나는이 코드를 넣었지만 마지막 줄을 실행할 때 아래에 오류가 발생한다. 왜이 오류가 발생합니까? !의 all.equal에서 library(tm) treex <- treex <- readLines(file.choose()) CorpusObj<- VectorSource(treex) breeze <- LDA(Co

1열

2답변

잠복 Dirichlet 할당 구현을 디버그

나는 내 자신을 구현했습니다 Python LDA; 매우 교훈적인 구현. 내 코드를 디버깅하는 방법을 궁금합니다. LDA의 통계적 특성으로 인해 모든 실행이 다른 결과를 반환하고 같은 이유로이 결과를 다른 라이브러리와 직접 비교할 수 없습니다. 그럼 어떻게 구현을 디버깅 할 수 있습니까? 일부 대상 항목을 추출하는 데 사용할 수있는 [corpus, docum

2열

1답변

pyLDAvis 그래프를 독립형 웹 페이지로 내보내기

주제 모델링으로 텍스트를 분석하고이를 Gensim 및 pyLDAvis를 사용하여 분석합니다. Python과 모든 필수 라이브러리를 설치할 필요없이 멀리 떨어진 동료와 결과를 공유하고 싶습니다. 대화 형 그래프를 HTML/JS 파일로 내보내 웹 서버에 업로드 할 수 있습니까? 나는 그것을 구현하는 방법을 문서에 언급 된 뭔가를 찾았지만 아무 생각했습니다 ht

0열

1답변

항목 표시

Gensim는 문서/쿼리 문자열 주어, 다른 문서가 내림차순으로, 그것은 가장 유사한 무슨 말을하는 방법을 말하는 튜토리얼이 있습니다 http://radimrehurek.com/gensim/tut3.html 을 또한 모든에서 전체 모델 과 관련된 어떤 주제를 표시 할 수 있습니다 How to print the LDA topics models from gen

0열

2답변

관련 위키피디아 기사의 공통 주제를 찾아보십시오.

수천 개의 위키피디아 자료로 구성된 레이블이없는 데이터 세트가 있습니다. 이 기사는 내용면에서 밀접한 관련이있는 기사 모음으로 그룹화됩니다. 이 세트 중 하나가 주어지면 모든 기사가 속한 공통 주제를 결정하고 싶습니다. 예 : {미적분, 행렬, 정수론} 내가 공통 주제 수학 것을 확인할 수 있습니다 자신의 제목으로 관련 기사의 다음과 같은 설정을 감안할 때

1열

2답변

Mallet에서 토픽 단어의 확률을 얻는 방법

나는 내 데이터를 탐색하기 위해 망치로 LDA를 사용하고 있습니다. 내가 쿼리 어떻게 될지 모르는 bin\mallet train-topics --input tutorial.mallet --num-topics 40 --optimize-interval 20 --output-state topic-state_doc_40t.gz --output-topic-keys