2016-06-22 3 views
0

그룹 멤버가있는 그룹을 그룹화 된 데이터 프레임 중에서 선택할 수있는 방법이 있습니까? 같은x 개 이상의 멤버를 가진 그룹을 선택하십시오.

뭔가 : 나는 워드 프로세서 또는 SO에서 해결 방법을 찾을 수없는

grouped = df.groupby(['a', 'b']) 
dupes = [g[['a', 'b', 'c', 'd']] for _, g in grouped if len(g) > 1] 

.

답변

1

사용 filter :

grouped.filter(lambda x: len(x) > 1) 

예 :

In [64]: 
df = pd.DataFrame({'a':[0,0,1,2],'b':np.arange(4)}) 
df 

Out[64]: 
    a b 
0 0 0 
1 0 1 
2 1 2 
3 2 3 

In [65]: 
df.groupby('a').filter(lambda x: len(x)>1) 

Out[65]: 
    a b 
0 0 0 
1 0 1 
+0

오, 간단한, 나는 시도되었지만에 반복 할 때이 산출된다 나의 람다 함수는 GROUP_NAME 및 그룹을 복용 것을 그룹화 된 df. 감사 –