0

저는 현재 타이타닉 데이터 세트에서 작업하고 있습니다. 4-5 개의 숫자가 아닌 열로 구성됩니다. sklearn.LabelEncoder 클래스를 적용하여 이러한 숫자가 아닌 열에 대해 인코딩 된 값을 가져 오려고합니다. 의심의 여지없이이 방법을 각 열에 하나씩 적용 할 수 있습니다. 그러나 20-30 개가 넘는 기둥이있을 때 일은 더욱 지루해질 것입니다. 비 숫자 형 컬럼의 이름을 알고 있기 때문에, 쉬운 방식으로 그렇게하는 정교한 방법이 있습니까?팬더의 여러 열로 라벨 인코딩

+0

당신이 원하는나요 개체 유형을 선택한 후 루프를 실행'fillna' https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.fillna.html –

+0

아니!!! 나는 그 자체로 sklearn.LabelEncoder라는 용어를 언급했다. 왜 – HrishikeshKulkarni

+0

이라는 이름을 가진 for 루프와 labelencoder를 사용하지 않는가? –

답변

-1

그냥

obj_cols = df.select_dtypes(include=[object]) 

for i in obj_cols: 
    df[i+'label'] = le.fit_transform(df[i]) 
+0

단일 labelencoder 객체 사용'le'은 열차 및 테스트 데이터. –

+0

레이블 인코딩을 수행하기 전에 열차와 테스트 데이터를 결합하는 것이 좋습니다. 라벨 인코더를 별도로 실행하면 항상 테스트 데이터에 새로운 카테고리가 생길 위험이 있습니다. –

+0

"테스트"의 요점은 새로운 것을 시뮬레이트하기 때문에 "Train and Test Data before ..."라고 말하지 않습니다. 프로덕션 환경에서 가져온 데이터가 무엇인지 미리 알지 못합니다. –