Thomas Hoffman (1999)에 의해 제안 된 pLSA 알고리즘을 구현하려고합니다. 그러나, 내가 발견 한 모든 구현은 입력 용어 - 문서 행렬을 희소 대신에 완전하다고 간주합니다. 필자의 입력 행렬은 매우 크고 희소하기 때문에 희소성을 지원하는 알고리즘을 찾고 싶습니다. 내가 찾도록 도와 줄 수 있니? Matlab 또는 Java가 선호됩니다. 나는 사실에서 PennAspect http://www.cis.upenn.edu/~ungar/Datamining/software_dist/PennAspect/index.html 가 희소 행렬 입력과 필리핀 선박 회사 연합 (PLSA)를 구현하는 것이스파 스 매트릭스에 대한 pLSA 구현
UPDATE 발견했다.
해결책은 간단합니다. 2 차원 배열 (각 행에 대해 동일한 길이를 갖지 않는 배열)을 사용하여 스파 스 매트릭스를 나타낼 수 있습니다.