문서와 관련된 숨겨진 주제가있을 수 있습니다. 각 문서는 하나 이상의 주제와 관련이있을 수 있습니다. 이 주제에 대한 가능한 모든 "주제"/ 범주 및 설명에 대한 마스터 파일이 있습니다. 각 문서의 주제를 예측하는 모델을 만들려고합니다.sLDA 연속 R 대신에 범주 형 응답을 예측합니다.
RTextTools를 사용하여 감독 텍스트 분류를 잠재적으로 사용할 수는 있지만 이는 한 범주 또는 다른 범주에 속하는 문서를 분류하는 데 도움이됩니다. 나는 문서의 주제 비율을 결정하는 데 도움이 될뿐만 아니라 용어 - 주제/카테고리 분포를 제공하는 해결책을 찾고자합니다. 012LM은 sLDA가 적합하다고 생각하지만, 범주 형이 아닌 지속적인 변수 결과 만 예측할 수 있습니다.
더 많은 방법론 대 프로그래밍 질문의 크로스 Validated에 이것을 게시하는 것이 좋습니다. – jruf003