topic-modeling

    1

    1답변

    저는 LDA (주제어)에서 주제 빈도를 결정하는 여러 가지 방법을 시도해 왔으며 매우 유용한 모양의 패키지 ldatuning을 우연히 발견했지만 제어 매개 변수와 특히 시드의 예제 값을 파악할 수 없습니다. library("topicmodels") data("AssociatedPress", package="topicmodels") dtm <- Assoc

    0

    1답변

    그래서 저는 명령 행에서 MALLET으로 작성된 숙련 된 모델을 가지고 있습니다. 어떻게 든이 훈련 된 모델을 Java 클래스로 가져오고 싶습니다. 나는 MALLET의 API 문서를 살펴본 후 ParallelTopicModel 클래스를 보았지만 내가하고자하는 ParallelTopicModel으로 모델을 가져 오는 적절한 방법을 찾지 못했습니다. Java 클

    2

    1답변

    에 대한 후방을 얻기 위해 어떻게는 R 패키지 topicmodels를 사용하여 LDA를 실행하고 나는 나의 이해에서, 델타 값을 얻기 위해 노력 해왔다 주제를 통해 단어에 대한 디리클레의 매개 변수입니다. 그러나 나는 그 값에 접근 할 수 없었다. 난 단지 [email protected]@delta 또는 slot([email protected],"del

    0

    1답변

    MALLET은 주제 모델을 학습하는 동안 --output-doc-topics 매개 변수를 사용하여 각 문서의 주제 분포가있는 탭으로 구분 된 파일을 생성합니다. 이 모양은 다음과 같습니다. doc# filename topic# weight 0 file:/.../document_01.txt 3 0.2110215053763441 14 0.1330645161

    0

    1답변

    텍스트 파일에서 주제 분석을 수행하는 방법? 나는이 코드를 넣었지만 마지막 줄을 실행할 때 아래에 오류가 발생한다. 왜이 오류가 발생합니까? !의 all.equal에서 library(tm) treex <- treex <- readLines(file.choose()) CorpusObj<- VectorSource(treex) breeze <- LDA(Co

    1

    2답변

    나는 내 자신을 구현했습니다 Python LDA; 매우 교훈적인 구현. 내 코드를 디버깅하는 방법을 궁금합니다. LDA의 통계적 특성으로 인해 모든 실행이 다른 결과를 반환하고 같은 이유로이 결과를 다른 라이브러리와 직접 비교할 수 없습니다. 그럼 어떻게 구현을 디버깅 할 수 있습니까? 일부 대상 항목을 추출하는 데 사용할 수있는 [corpus, docum

    2

    1답변

    주제 모델링으로 텍스트를 분석하고이를 Gensim 및 pyLDAvis를 사용하여 분석합니다. Python과 모든 필수 라이브러리를 설치할 필요없이 멀리 떨어진 동료와 결과를 공유하고 싶습니다. 대화 형 그래프를 HTML/JS 파일로 내보내 웹 서버에 업로드 할 수 있습니까? 나는 그것을 구현하는 방법을 문서에 언급 된 뭔가를 찾았지만 아무 생각했습니다 ht

    0

    1답변

    Gensim는 문서/쿼리 문자열 주어, 다른 문서가 내림차순으로, 그것은 가장 유사한 무슨 말을하는 방법을 말하는 튜토리얼이 있습니다 http://radimrehurek.com/gensim/tut3.html 을 또한 모든에서 전체 모델 과 관련된 어떤 주제를 표시 할 수 있습니다 How to print the LDA topics models from gen

    0

    2답변

    수천 개의 위키피디아 자료로 구성된 레이블이없는 데이터 세트가 있습니다. 이 기사는 내용면에서 밀접한 관련이있는 기사 모음으로 그룹화됩니다. 이 세트 중 하나가 주어지면 모든 기사가 속한 공통 주제를 결정하고 싶습니다. 예 : {미적분, 행렬, 정수론} 내가 공통 주제 수학 것을 확인할 수 있습니다 자신의 제목으로 관련 기사의 다음과 같은 설정을 감안할 때

    1

    2답변

    나는 내 데이터를 탐색하기 위해 망치로 LDA를 사용하고 있습니다. 내가 쿼리 어떻게 될지 모르는 bin\mallet train-topics --input tutorial.mallet --num-topics 40 --optimize-interval 20 --output-state topic-state_doc_40t.gz --output-topic-keys