2012-02-02 9 views
0

자바에서 콜트를했습니다. 둘 다 행 수가 coloumns 수보다 많도록 배열을 사용할 것을 기대합니다.자바에서 svd에 문제가 있습니다

하지만 LSA (Latent semantic analysis)의 경우 5 권의 책이 있으며 총 1000 개의 홀수 단어가 있습니다. 용어 문서 행렬을 사용할 때 5 * 1000 행렬을 얻습니다.

이것은 작동하지 않으므로 매트릭스를 조 변경해야합니다. 전치 할 때 나는 1000 * 5를 사용한다. 내가 5 * 5 S 매트릭스를 얻을 svd 수행 할 때 1000 * 5. 차원 감소를 수행하기 위해 5 * 5 행렬이 작아 보입니다.

수행 할 수있는 작업은 무엇입니까?

답변

0

사용중인 텍스트 세그먼트 크기가 너무 큽니다. 문서 (란)는 한 페이지 또는 몇 페이지의 텍스트를 나타냅니다. 아마도 가장 큰 장이 될 것입니다. 단락 크기도 사용되는 것을 보았습니다.