저는 예측 모델을 Python으로 제작하고 있으며 scikits learn의 SVM 구현을 사용하고 있습니다. 사용하기 쉽고 비교적 빠르고 사용하기 쉽습니다.Python에서 가장 빠른 SVM 구현
불행히도 저는 런타임에 제약을 받기 시작했습니다. 650 개의 기능을 갖춘 전체 데이터 세트에서 rbf SVM을 실행합니다. 각 실행에는 약 1 분이 소요됩니다. 그러나 5 배 교차 유효성 검사 + 그리드 검색 (정밀한 검색에 대해 거친 검색 사용)을 사용하면 손에 닿기 어려운 상황이됩니다. 따라서 일반적으로 사람들은 Python에서 사용할 수있는 가장 빠른 SVM 구현 측면에서 어떤 권고 사항을 가지고 있습니까? 저, 또는 내 모델링 속도를 높이는 어떤 방법?
LIBSVM의 GPU 구현에 대해 들었습니다. 작동하는 것처럼 보입니다. 파이썬에서 사용할 수있는 다른 GPU SVM 구현에 대해서는 알지 못하지만 다른 사람들에게 공개 될 것입니다. 또한 GPU를 사용하면 런타임이 크게 증가합니까?
또한 선형 SVM + 기능 맵을 scikits로 사용하여 rbf SVM을 근사화하는 방법이 있다고 들었습니다. 이 접근법에 대해 사람들이 어떻게 생각하는지 확신하지 못합니다. 다시 말하지만,이 접근법을 사용하는 사람은 런타임에서 중요한 증가입니까?
프로그램의 속도를 높이기위한 모든 아이디어를 환영합니다.
감사합니다. 이것 좀 봐. 분명히 흥미로워 보인다. Sklearn은 svm light 형식으로 내보낼 수 있습니까? 그것은 확실히 유용 할 것입니다. 이전 답변에 대한 답변으로 불행히도 저는 timeseries를 다루므로 무작위 샘플링 + 열차/테스트로의 침입은 좀 더 복잡해집니다. 내 모델을 훈련시키기위한 서브 샘플링이 그다지 간단하지는 않을지 모르겠습니다. 감사! – tomas
죄송합니다 빠른 부록 ogrisel, sklearn의 유틸리티 기능이 SVM 라이트 형식으로 내보낼 수 있는지 알고 있습니까? – tomas
실제로 문서에서 누락되었지만 그곳에 있습니다. https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py#L142 – ogrisel