5
나는 데이터 집합 일부 다음과 같습니다 누락 된 데이터 것 같습니다팬더 : null 값을 groupby의 평균으로 채우는 방법은 무엇입니까?
내가 모델의 데이터를 사용하여 널 (null)에 입력해야id category value
1 A NaN
2 B NaN
3 A 10.5
4 C NaN
5 A 2.0
6 B 1.0
. 범주가 처음 발생할 때마다 NULL입니다. 두 번째 값이있는 A
및 B
같은 범주의 경우 null을 해당 범주의 평균으로 바꿉니다. 그리고 한 번만 나타나는 범주 C
의 경우 나머지 데이터의 평균을 채우기 만하면됩니다.
모든 행의 평균을 얻으려면 C
과 같은 경우이 작업을 간단하게 수행 할 수 있습니다. 그러나 A와 B에 대한 범주 별 평균을 수행하고 null을 대체하려고 노력하고 있습니다.
df['value'] = df['value'].fillna(df['value'].mean())
나는
mean
이
id category value
1 A 6.25
2 B 1.0
3 A 10.5
4 C 4.15
5 A 2.0
6 B 1.0
을! 이것이 내가 필요한 것입니다. 감사 ! – sfactor
나는 네 일을 좋아, 이거 멋지다. – Axis