-2

sklearn의 범주 형 변수에 onehotencoding을 사용하는 동안 의사 결정 트리에 맞게 다른 숫자 변수와 함께 생성하는 희소 행렬을 사용하는 방법은 무엇입니까? OneHotEncoding을 사용하여 범주 형 변수를 희소 행렬로 변환하는 경우이 희소 행렬을 원래 데이터 집합의 숫자 변수와 어떻게 조합합니까?sklearn을 사용하여 의사 결정 트리에 맞는 숫자 및 범주 형 변수 사용

답변

0

사용 다음 중 하나를 인수 categorical_features

  • OneHotEncoder이 기능을 인덱싱하는 것은 (모든 기능의 자동 조합) 인코딩
    • 결과는 변경하지 않은 경우 (transform를 사용) 기본적으로 스파 스 sparse=True
  • 또는 OneHotE 단지 변수의 부분 집합에 ncoder :
    • onehot 모양 (n_samples, ?이 될 것 scipy.sparse.hstack((onehot, original))
    • (당신의 특징 목록에 따라 다름) 및 original 모양 (n_samples, ?
이 될 것입니다