2017-05-01 10 views
0

내 프로젝트에서 GridSearchCVsklearn에 사용하여 모델에 대해 지정된 매개 변수 값을 철저하게 검색하여 가능한 최상의 매개 변수 값을 찾습니다. 난 그냥 RandomForestClassifier에서 테스트하고 max_depthn_estimators을 찾는 데 도움이되었습니다.sklearn의 최대 우도 추정

  1. GridSearchCV는 최대 가능성 추정 (MLE)의 개념을 사용합니까 후드 : 그 바탕으로, 나는이 개 질문이?
  2. 모든 모델에 GridSearchCV을 사용하는 대신 내 데이터 세트에 가장 적합한 모델을 선택하는 데 사용할 수있는 기술이 있습니까? 나는이 모델 선택의 개념하에 생각하지만 sklearn 통해 그것을 사용하는 방법을 모르겠다.

은 후드 아래에 당신에게

답변

2

합니까 GridSearchCV 최우 추정 (MLE)의 개념을 사용하여 감사?

MLE 따라서 단지 확률 모델에 적용 할 수 확률 추론이다. GridSearchCV는 MLE 기반이 아니며, 테스트 오류의 직접적인 평가를 기반으로 모델을 선택하는 간단한 트릭입니다. 특정 모델이 주어진다면, 얼마나 좋은가를 나타내는 숫자를 할당 할 수 있습니다 - 많은 모델이 주어지면 간단히 선택할 수 있습니다 가장 큰 숫자 (추정 된 일반화 강도).

모든 모델에 GridSearchCV를 사용하는 대신 내 데이터 세트에 가장 적합한 모델을 선택하는 데 사용할 수있는 기술이 있습니까? 이 모델 선택의 개념에 있다고 생각하지만 sklearn을 통해 그것을 사용하는 방법을 모르겠습니다.

그러나 sklearn은 꽤 다양한 기차 테스트 스플리터 (CV, 랜덤 등) 만 구현합니다. 좋은 hyperparamters을 찾고 (보다는 이미 확인하는 기존의 고급 방법은

  • 베이지안 최적화
  • 트리 파젠의 추정량 기술

: 대신 당신이 지원하는 다른 라이브러리를 고려하는 것이 좋습니다 1).