2
30.000 텍스트의 데이터 세트에서 KernelPCA를 실행하려고하면 메모리 오류가 발생합니다. RandomizedPCA 괜찮아. 나는 RandomizedPCA가 희소 배열로 작동하고 KernelPCA가 작동하지 않는다고 생각합니다.python, scikits-learn : 어떤 학습 방법이 스파 스 특징 벡터를 지원합니까?
현재 scikits-learn에서 희소 배열 지원으로 구현 된 학습 방법 목록을 가진 사람이 있습니까?
측면 설명 : 이차 커널은 일부 NLP 작업에 대해 선형 것보다 잘 작동하는 것으로 알려져 있습니다 (bigram이 바람직한 문서 수준 작업은 아닐지라도). –
humm! 잘 알고 있습니다. RandomizedPCA가 축을 따라 집중된 점으로 내 데이터 세트에 매우 얽힌 시각화를주기 때문에 커널 PCA에 대해 생각하고있었습니다. 나는 2 차원 줄거리에서 다른 방법으로 얻은 클러스터를 시각적으로 시각화 할 수 있기를 원했습니다. : ( –
사실, Larsmans 다항식은 선형 모델을 사용하여보다 효율적으로 시뮬레이션 할 수 있고 비 지역 공존 특성을 해싱 할 수 있습니다. – ogrisel