pandas-groupby

    1

    1답변

    저는 고전적인 xarray 데이터 세트를 가지고 있습니다. 이들은 월별 데이터 (월간 데이터 38 년)입니다. 매월 별개의 값을 계산하는 데 관심이 있습니다. 내가 사용하는 각 달의 평균하려는 경우 <xarray.Dataset> Dimensions: (lat: 26, lon: 71, time: 456) Coordinates: * lat (

    -1

    1답변

    groupby 및 sum으로 만든 요약 데이터를 기반으로 시간 경과에 따라 누적 영역 플롯을 만들려고합니다. groupby 및 sum 부분은 원하는 데이터를 올바르게 그룹화하고 합계하지만 결과 형식은 음모면에서 의미가 없습니다. 여기에서 어디로 는 잘 모르겠어요 : import pandas as pd import numpy as np im

    0

    1답변

    내가하려는 것은 열 A의 여러 팀을 그룹화하고 각 값이 표시되는 시간의 총 수를 구하는 것입니다. 예를 들어, Team1이 4 번 나타납니다. 그런 다음 Count 값 (Team1과 4)을 B 열에 표시된 Yes 값의 수만큼 나누고 백분율을 구합니다. Current A B C Team1 Yes 4 Team2 Yes 1 Team1

    0

    1답변

    다음 데이터 프레임에서 카운트를 생성하는 파이썬 스크립트를 작성하려고합니다. Excel에서 countifs를 사용했지만 'Sample'및 'Region'에서 중복 된 항목으로 인해 countifs 사용시 문제가 발생합니다. 예 입력 DF는 : Sample Chr Start End Region Size Strand Chr2 Start2 End2 Coverag

    0

    2답변

    datetimeindex가있는 데이터 프레임이 있습니다. >>> df.head() Out[6]: 1 2004-01-02 09:00:00+11:00 0.7519 2004-01-02 10:00:00+11:00 0.7520 2004-01-02 12:00:00+11:00 0.7515 2004-01-02 13:00:00+11:00 0.

    0

    1답변

    큰 데이터 세트의 각 위치 (ID)에서 측정 데이터 (var1, var2, Timestamp)를 플롯하는 것이 목적입니다. 내 데이터 : 같이 ID var1 var2 TimeStamp AA 2 5 8/8/2010 0:00 AA 2.5 5 1/1/2010 0:00 B7 1.1 7 1/9/2010 0:00 B7 2 6 1/8/2010 0:00

    2

    2답변

    시간 및 플래그와 같은 두 가지 조건에 따라 하위 event_ids를 만들려고하는 데이터 프레임이 있습니다. 이 플래그는 people> = 600 일 때 새로운 하위 그룹을 만듭니다. 데이터는 다음과 같이 보입니다 : | event_id | timestamp | people | | abc | 12:00 | 1 | | abc | 12

    0

    1답변

    이것은 this 질문의 확장입니다. 나는 이제 합계와 표준 편차 대신 모든 설명 통계를 사용하려고 노력 중이다. 나는 this 질문에서이 답변에서이 코드를 시도 : df = grouped.describe().reset_index().pivot(index=index_columns, values=’price’, columns=’level_1’) 나는이 오류

    0

    1답변

    파이썬에서 다른 키 (사전에 응답 키가 있음)가 포함 된 사전 목록을 가지고 있으며이를 팬더 데이터 프레임 모든 키 - 값은 으로 행으로 표시됩니다. 응답 키 값을 Column으로 반복합니다. 예, 다음 목록 [를 들어 { '응답'1, '직장 생활'5 '생명 가족': 2, '가족의 균형': 10}, { '응답' : 2, '격려 관리': 11, '경영 경력'

    1

    1답변

    나는이처럼 보이는 dataframe가 있다고 가정하자 GROUPBY 단어의 평균 수를 계산 : df = pd.DataFrame({'id': [1,1,1,1,2,2,2,3,4,4,4,4,4], 'feedback': ['one word', np.nan, np.nan, 'test', 'second', np.nan, 'test