pandas-groupby

0열

1답변

이 질문이 전에 제기되었는지 확실하지 않습니다. 팬더 dataframe에서 난 Z는 B 및 2.5 2 B 및 C에 대해 0에서 간 (제 1 표의) 위의 예에서 A B C 1 z 2 2.5 2 y 1 1 3 z 2 0.8 얻을하고자 A B C 1 z 0 0 2 z 1 1 3 z 2 2 4 y 0 0 5 y 1 1 6 z 2 2.5 7

0열

1답변

팬더

Var1 Var2 Var3 Var4 101 XXX yyyy 12/10/2014 101 XYZ YTRT 13/10/2014 102 TTY UUUU 9/9/2014 102 YTY IUYY 10/10/2014 출력 데이터 세트는 예상 입력 데이터 세트를 사용하여 주요 변수에 기초하여 하나의 행에 복수의 열 변환 : 예상 데이터 집합 팬

1열

1답변

그룹에서 원래 DataFrame을 어떻게 변경합니까?

의 내가 다음 DataFrame이 있다고 가정하자 import pandas as pd df = pd.DataFrame({'label': ['a', 'a', 'b', 'b', 'a', 'b', 'c', 'c', 'a', 'a'], 'numbers': [1, 1, 1, 1, 1, 2, 2, 2, 2, 2], 'arbitrar

2열

1답변

팬더 - groupby의 빈도로 값을 얻으십시오

팬더에서 (가능한) groupby를 도와 주실 수 있습니까? easy_donor v_fam count 0 donor_1_NS IGHV1 5202376 1 donor_1_NS IGHV2 1955547 2 donor_1_NS IGHV3 70426272 3 donor_1_NS IGHV4 452367 4 donor_1_NS IGHV5 4842145 5

1열

2답변

Python Pandas 데이터 샘플링/집계

다음과 같이 거대한 쉼표로 구분 된 datetime 인 unique_id 데이터 집합이 있습니다. datetime, unique_id 2016-09-01 19:50:01, bca8ca1c91d283212faaade44c6185956265cc09 2016-09-01 19:50:02, ddd20611d47597435412739db48b0cb04599e340

4열

2답변

그룹 대규모 데이터 세트에 대한 작업 By

메모리에 너무 큰 데이터 세트에 대해 파이썬에서 그룹 바이 작업을 수행하는 간단한 방법이나 모듈이 있습니까? 나는 보통 팬더를 사용 하겠지만 큰 데이터 세트의 경우에는 고장이 난다.

0열

1답변

x 개 이상의 멤버를 가진 그룹을 선택하십시오.

그룹 멤버가있는 그룹을 그룹화 된 데이터 프레임 중에서 선택할 수있는 방법이 있습니까? 같은 뭔가 : 나는 워드 프로세서 또는 SO에서 해결 방법을 찾을 수없는 grouped = df.groupby(['a', 'b']) dupes = [g[['a', 'b', 'c', 'd']] for _, g in grouped if len(g) > 1] .

1열

1답변

팬더 그룹웨어 TimeGrouper

에 따라 this 질문. data['maSlow_std'] = pd.rolling_mean(data['Last'], window=60) + 2* pd.rolling_std(data['Last'], 20, min_periods=20)

3열

1답변

팬더로 연령 분포를 플로팅하는 방법

나는 2 개의 칼럼 (나이와 성별)을 가진 데이터 프레임을 가지고있다. sex,age 1,30 2,29 1,34 1,27 2,28 2,28 1,40 1,30 1,27 2,31 1,37 1,31 2,28 2,30 2,27 2,27 2,29 2,32 1,28 1,27 1,28 1,28 1,29 1,33 1,32 1

5열

1답변

파이썬 팬더 GROUPBY 지수를 바탕으로

그래서 내가 수정하려는 일부 잘못된 정보가 포함 된 dataframe 있습니다 import pandas as pd tuples_index = [(1,1990), (2,1999), (2,2002), (3,1992), (3,1994), (3,1996)] index = pd.MultiIndex.from_tuples(tuples_index, names=['id