파이썬에서 xgboost를 사용하여 회귀 문제를 해결하려고합니다. 하지만 문제가 발생했습니다. 나는 그것을 여러 곳에서 찾았지만 구체적인 결과를 얻을 수 없었다.python xgboost에서 많은 수의 다른 값을 갖는 숫자 형 변수를 처리하는 방법은 무엇입니까?
저는 음식 수집가 비즈니스 모델을 가지고 있습니다. 내 플랫폼의 사용자는 여러 레스토랑에서 주문할 수 있습니다.
회귀 모델을 사용하여 사용자가 배치 한 주문 (앱에 표시)을 예상하도록 ETA를 예측하고 싶습니다. 내 training model의 기능으로 "restaurant_id"를 사용하려고합니다. 하지만 이제 문제는 내 플랫폼에 100 개가 넘는 레스토랑이 있습니다. 그리고 나는 그것을 숫자 기능으로 사용할 수 없다. 나는 그것을 범주 적 특징으로 사용해야한다. 이 사건을 어떻게 처리할까요? 즉 다양한 가치가있는 범주 형 기능을 처리하는 방법은 무엇입니까?
저는 파이썬에서 Xgboost를 사용하고 있습니다. 나는 판다의 get_dummies 함수를 사용했다. 나는 이런 식으로할지 아니면 다른 접근법을 따르 느냐에 대해서는 확신 할 수 없다. 어떤 제안이 도움이 될 것입니다.
미리 감사드립니다.
XGBoost를 사용하여 ETA를 예측 하시겠습니까? –
@ AmeyYadav 나는 어떤 algo도 사용할 수 있지만 xgboost만이 아닙니다. 그러나 아이디어는 문제를 해결하는 방법입니다. – user3457384