하나의 문제 선택한 데이터 세트로 예측하려고했을 때 한 가지 문제는 테스트 데이터 세트에서 예측할 경우 특정 기능을 선택한 후에 테스트 데이터 세트 기능이 정렬되지 않는다는 것입니다 왜냐하면 교육 데이터 세트는 기능 선택으로 인해 기능이 적기 때문입니다. 테스트 데이터 세트가 교육 데이터 세트와 동일한 기능을 갖도록 피쳐 선택을 어떻게 적절하게 구현합니까?구현 기능 선택
예 : 나는 당신이 SelectKBest
먼저 다음 transform
테스트 데이터와 피팅에 의해 feature_selector 객체를 생성 할 생각
from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
iris = load_iris()
X, y = iris.data, iris.target
X.shape
(150, 4)
X_new = SelectKBest(chi2, k=2).fit_transform(X, y)
X_new.shape
(150, 2)
... 그리고 * fit_transform''사용 * 해달라고하지만, 단지'transform'. –
@ juanpa.arrivillaga 유일한 문제는 테스트 데이터 세트에서 기능 선택을 구현할 때 교육 데이터 세트와 다른 기능 세트를 얻을 가능성이 있습니까? – user
바로 그 이유 때문에 테스트 데이터에서 선택을하지 않습니다. –