몇 가지 기능이있는 데이터에서 회귀 목적을위한 임의의 포레스트 및 그라데이션 증가 회귀 트리를 학습합니다. 두 가지 모두 기능의 중요성을 계산하기 때문에 비슷한 점수를 얻지 만 이러한 점은 다소 다릅니다. 임의 숲 회귀를 들어 그라디언트 증가 회귀 트리 대 임의 포리스트에 대한 기능 중요도 계산
:MAE: 58.70
RMSE: 90.59
Feature 1: 65.18
Feature 2: 5.67
Feature 3: 13.61
Feature 4: 4.26
Feature 5: 11.27
왜 이것이다 : 그라디언트를 들어
MAE: 59.11
RMSE: 89.11
Importance:
Feature 1: 64.87
Feature 2: 0.10
Feature 3: 29.03
Feature 4: 0.09
Feature 5: 5.89
회귀 나무를 밀어? 그라디언트를 높이면 회귀 나무를 늘리므로 나무가 무작위적인 숲보다 얕다고 생각했습니다. 그러나 나는 확실하지 않다.
각 알고리즘이 서로 다르게 계산해야하는 이유는 같습니다. 기능의 중요성은 잘 정의 된 속성이 아니라 예측 정확도를 말합니다. – elyase
@elyase 특징의 중요도를 계산하는 방법은 앙상블 기반 트리 알고리즘의 유형과는 무관하다고 생각합니다. 아마도 여기에 설명 된대로 : http://stackoverflow.com/questions/15810339/how-are-feature-importances-in-randomforestclassifier-determined – Ojtwist
관련 코드를 게시했습니다. – elyase