2014-12-12 4 views
0

임의의 포리스트로 작업하고 있는데 기능 선택이 어떻게 작동하는지 알고 싶습니다. 423 개의 기능 세트가 있으며 log2 (F) + 1을 사용하여 임의로 선택된다는 것을 알고 있습니다. 따라서이 방법으로 12/13 기능 세트를 얻을 수 있습니다. 그러나 내가 이해할 수없는 것은 선택이 얼마나 무작위인지, 그리고 그 부분 집합이 각 나무마다 다른 것인지 아니면 부분 집합이 모든 나무에 대해 동일한 것인지를 결정할 수 있지만 여러 조합이 다른 것입니다. 10 개의 트리가있는 모델을 사용하는 경우 기능 선택이 트리마다 다릅니다. 당신의 도움을 주셔서 감사합니다.RandomForest 알고리즘은 몇 개의 기능을 선택합니까?

+0

아마도이 논문을 확인해야 할 것입니다 : http://www.montefiore.ulg.ac.be/~glouppe/pdf/phd-thesis.pdf – tumbleweed

답변

0

포리스트의 각 트리는 서로 다른 무작위 샘플을 가져옵니다. 의사 결정 트리 학습은 일반적으로 결정적입니다. 따라서 각 트리가 동일한 기능 세트를 갖고 있다면, 이들은 모두 동일한 의사 결정 트리를 학습하게되며 목적을 저지합니다. 당신은 그들 모두가 하위 집합에 대한 훈련을 받기를 원합니다.

알고리즘이 원래 423 기능 집합에서 12 특징의 하위 집합을 선택하면 각 트리는 전체 집합에서 12 특징 중 자체 샘플을 (교체없이) 가져옵니다.