pandas-groupby

    1

    1답변

    사용자가 로그인 및 로그 아웃 할 때의 로그가 있습니다. 특정 사용자가 특정 15 분 동안 온라인 상태인지 보여주는 로그를 작성하려고합니다. 팬던 스는 다른 datetime 인덱싱 옵션 (date_range, period_range)을 가지고 있지만, pd.date_range(start, stop, freq)과 같은 것을 사용하고 있지만 어디에서해야할지 모

    0

    2답변

    현재 CSV 데이터를 집계하기 위해 팬더에서 groupby 함수를 사용하려고합니다. 이 나는 ​​CSV 현재 가지고있는 데이터의 작은 샘플입니다 :은 현재 로선 Company,School,Number,Type Adtelem Global Education Inc.,Carrington,3,For-Profit Adtelem Global Education In

    1

    1답변

    국가, 지역 및 소득이있는 데이터 프레임 소득 데이터가 있습니다. 평균, 최소, 최대 및 개수를 반환하는 집계를 사용하려고합니다. 소득이 100보다 큰 raw_data = {'Country': ['A', 'B', 'C', 'D', 'E'], 'Region': ['X', 'X', 'X', 'Y', 'Y'], 'Income': [100

    2

    1답변

    전원 시스템의 시계열 데이터를 분석 중이며 특정 임계 값을 초과하는 인접한 데이터 요소를 찾으려고합니다. 저는 현재 수식을 행별로 수동으로 행을 사용하고 있지만이 방법은 파이썬 판다 그룹웨어 기능에서 수행 할 수 있음을 깨달은보다 효율적인 방법을 찾고 있습니다. 그러나 읽은 예제에서 groupby 함수는 동일한 레이블을 가진 경우에만 행을 그룹화합니다. 내

    1

    1답변

    나는 다음과 같은 구조의 dataframe 있습니다 mydf가 :이에서 수행 할 일이 있습니다 Entry Address ShortOrdDesc 0 988 Fake Address 1 SC_M_W_3_1 1 989 Fake Address 2 SC_M_W_3_3 2 992 Fake Address 3 nan_2 3 992 SC_M_G_1_

    -1

    1답변

    그룹화하는 동안 집계 단계에서 하나의 특정 열에 하나의 사용자 지정 람다 함수가 적용되는 this post을 참조하고 있습니다. In [67]: f = {'A':['sum','mean'], 'B':['prod'], 'D': lambda g: df.ix[g.index].E.sum()} In [69]: df.groupby('GRP').agg(f) Out[

    2

    1답변

    나는 |Col1|Col2|Count|Day | |----|----|-----|-----| | A | C | 1 | Mon | | A | C | 3 | Tue | | A | C | 5 | Wed | | A | D | 7 | Mon | | B | C | 2 | Mon | | B | D | 4 | Tue | 내가 처음 두 열로 그룹에 원하는 형식

    3

    1답변

    두 가지 범주 형 변수 사이의 빈도에 대한 평균 및 중간 값을 구해야합니다. 예 : 레이블 문자 번호 Foo | A | 1 푸 (Foo) | B | 2 Foo | C | 4 막대 | A | 2 막대 | G | 3 막대 | N | 1 막대 | P | 2 Cee | B | 1 Cee | B | 2 Cee | C | 4 Cee | D | 5 예를 들어 라벨 당

    0

    1답변

    내 csv 파일에 도시 별 기상 정보가 있습니다. 한 행에는 시간이 갈수록 많은 열 (1200 개 이상)이 있습니다. 예를 들면 다음과 같습니다. id city_name dt_0 temp_0 hum_0 dt_1 temp_1 hum_1 dt_2 temp_2 hum_2 1 Boston 2017110306 23.5 54.0 2017110310 21.4

    0

    1답변

    는 어떻게 내가 ddof=1를 사용하려면 루프 operation = ['mean','std'] for i in range(0,len(operation)): df2 = df.groupby(level='Index').agg(operation[i]).dropna(how='all') .... 에 대해 다음하지만 특히 NumPy와 operat