이 질문이 전에 제기되었는지 확실하지 않습니다. 팬더 dataframe에서 난 Z는 B 및 2.5 2 B 및 C에 대해 0에서 간 (제 1 표의) 위의 예에서 A B C
1 z 2 2.5
2 y 1 1
3 z 2 0.8
얻을하고자 A B C
1 z 0 0
2 z 1 1
3 z 2 2
4 y 0 0
5 y 1 1
6 z 2 2.5
7
Var1 Var2 Var3 Var4
101 XXX yyyy 12/10/2014
101 XYZ YTRT 13/10/2014
102 TTY UUUU 9/9/2014
102 YTY IUYY 10/10/2014
출력 데이터 세트는 예상 입력 데이터 세트를 사용하여 주요 변수에 기초하여 하나의 행에 복수의 열 변환 : 예상 데이터 집합 팬
다음과 같이 거대한 쉼표로 구분 된 datetime 인 unique_id 데이터 집합이 있습니다. datetime, unique_id
2016-09-01 19:50:01, bca8ca1c91d283212faaade44c6185956265cc09
2016-09-01 19:50:02, ddd20611d47597435412739db48b0cb04599e340
그룹 멤버가있는 그룹을 그룹화 된 데이터 프레임 중에서 선택할 수있는 방법이 있습니까? 같은 뭔가 : 나는 워드 프로세서 또는 SO에서 해결 방법을 찾을 수없는 grouped = df.groupby(['a', 'b'])
dupes = [g[['a', 'b', 'c', 'd']] for _, g in grouped if len(g) > 1]
.
그래서 내가 수정하려는 일부 잘못된 정보가 포함 된 dataframe 있습니다 import pandas as pd
tuples_index = [(1,1990), (2,1999), (2,2002), (3,1992), (3,1994), (3,1996)]
index = pd.MultiIndex.from_tuples(tuples_index, names=['id