2016-12-27 4 views
3

다양한 기사를 읽었으며 그 중 대부분이 특정 기능이 아닌 특정 행에 가중치를 도입하는 방법을 설명했습니다. R의 GBM에서 우리는 하나의 특정 기능을 다른 기능보다 명확하게 배울 수있는 모델을 할당 할 수 있습니다. 우리는 파이썬의 XGBoost와 비슷한 것을 할 수 있을까요? XGBoost를 조정하여 특정 예측 자 열에 더 많은 가중치를 부여하는 방법

나는 다음을 통해 갔다 : here 1 here 2 here 3 모든 어떻게 든 우리가 행하기 위해 체중을 줄 수있는 언급.

저는 XGBoost를 처음 접했고 변수에 가중치를 할당 할 수 있는지 여부를 확인하기 위해 두 번째 확인을 원합니다.

필자는 일정 열과 목표를 실제 값으로 설정했습니다. My Scheduled가 5-10k 미만으로 우울해질 때마다 제 모델은 엄청난 마진으로 예측할 수 없습니다. 평균 70 % (Mean Absolute Error)는 Offed이지만, Scheduled> 10k 인 경우, 나의 오류 측정 기준은 20-30 %입니다. XGBoost가 예약 된 상태로 강요 할 수 있습니까?

플래그 변수 인 버킷 변수를 도입하려고 시도했지만 가장 중요한 기능으로 밝혀지지 않았기 때문에 도움이되지 않았습니다.

또는 다른 제안을하면이 시나리오를 수행하는 것이 정말 도움이 될 것입니다.

XGBoost에서 가중치 (sample_weight)를 할당하는 방법이있는 경우 매개 변수 (weight_data)가 어떻게 표시되어야합니까? 그 모양과 모든 것,

고마워

답변

1

나는 또한 비슷한 문제에 대한 해결책을 찾고있다. 불행하게도, 나무는 소수 수준 (2 진수, 범주 형 등)을 가진 것과 비교할 때 수치 변수쪽으로 편향되어있다. 이유는 개별 나무를 배우는 데있어서 탐욕입니다. 더 높은 분산을 가진 피처를 사용하여 더 나은 스플릿을 찾을 수있는 더 많은 기회가 있습니다. 이것은 또한 문헌에서 논의된다.