2017-12-09 23 views
1

대용량 데이터 세트 (~ 1M 행, 500 열)에서 catboost를 실행하면 교육이 중단되었습니다 (반복 0의 솔루션을 퇴화 시키거나, 너무 작은 L2 정규화로 인해 증가 시키십시오).Catboost : l2_leaf_reg에 대한 합리적인 값은 무엇입니까?

12 정규화 값을 어떻게 알 수 있습니까? 그것은 y의 평균값, 변수의 수, 트리 깊이와 관련이 있습니까?

감사합니다.

+1

[CrossValidated] (https://stats.stackexchange.com/)에서 더 많은 답변을 얻을 수 있습니다. – desertnaut

답변

0

각 데이터 세트가 서로 다르므로 질문에 대한 정확한 답변을 찾지 못할 것으로 생각됩니다.

그러나 경험 값의 범위에 따라 2와 30 사이의 값을 입력하는 것이 좋은 출발점입니다.