팬더 factorize
함수는 계열의 각 고유 값을 순차 0 기반 인덱스에 할당하고 각 계열 항목이 속하는 인덱스를 계산합니다.팬다의 다중 열 팩터 화
내가 여러 열을 pandas.factorize
에 해당하는 작업을 수행하고 싶습니다 : 나는 데이터 프레임의 여러 열에서 값의 각각의 고유 한 튜플을 결정하고자한다
import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]
가에 순차적 인덱스를 할당 각각을 계산하고 데이터 프레임의 각 행이 속하는 색인을 계산합니다.
Factorize
은 단일 열에서만 작동합니다. 팬더에 멀티 컬럼 동등한 기능이 있습니까?
예상되는 출력은 무엇입니까? – waitingkuo
코멘트의 목록 - 각각의 고유 한 (x, y) 값에 대한 순차적 인 인덱스 – ChrisB