sklearn (Python)에 다른 확률 모델 (latent Dirichlet Allocation, Non-negative Matrix Factorization 등)을 맞추는 최선의 방법을 찾으려고합니다.scikit-learn - TF 또는 TF-IDF 모델에 맞춰야합니까?
sklearn 문서의 예제를 보면, LDF 모델이 TF 어레이에 적합한 이유는 무엇인지, NMF 모델은 TF-IDF 어레이에 맞는지 궁금합니다. 이 선택에 대한 정확한 이유가 있습니까? http://scikit-learn.org/stable/auto_examples/applications/topics_extraction_with_nmf_lda.html#sphx-glr-auto-examples-applications-topics-extraction-with-nmf-lda-py
이 또한 내 모델을 피팅에 가장 적합한 매개 변수를 찾는 방법에 대한 어떤 조언 (반복 수, 주제의 수 ...)가 잘 받아 들여 : 여기
은 예입니다.미리 감사드립니다.
매개 변수 최적화에 대한 설명. 메타 최적화 기술 (예 : 알고리즘에 PSA - Particle Swarm Optimization 적용)이 특정 설정에 대해 최적의 매개 변수 값을 보장하는지 확인해야합니다. 메타 최적화는 가능한 각 매개 변수 조합의 검색 공간을 빠르고 효율적으로 탐색하는 방법입니다. – rpd
@rpd 감사합니다! –