내 상황 : 각 행에 대해 다음을 계산해야하므로 판다 데이터 프레임이 있습니다.NA 및 카운트 값을 제거하는 방법 벡터화 된 방식으로 numpy로 NxK 배열
1) 위젯 제 valute na
제외 (df.apply(lambda x: x.dropna().iloc[0])
)
2) 마지막 valute na
제외 (df.apply(lambda x: x.dropna().iloc[-1])
)
3) 비 na
카운트 값 (df.apply(lambda x: len(x.dropna())
)
샘플 케이스 얻기 예상 출력 :
x = np.array([[1,2,np.nan], [4,5,6], [np.nan, 8,9]])
1) [1, 4, 8]
2) [2, 6, 9]
3) [2, 3, 2]
그리고 최적화 된 상태로 유지해야합니다. 그래서 나는 numpy
으로 방향을 바꾸어 첫 번째 단계로 NxK
배열에 y = x[~numpy.isnan(x)]
을 적용 할 방법을 찾았습니다. 그 후, 나는 1 여기 (Vectorized way of accessing row specific elements in a numpy array)을 참조)과 2 무슨 사용한다)하지만 난 여전히
사례를 삽화를 작성 하시겠습니까? – Divakar
테스트 케이스를 추가했습니다. – Asher11
수집 한 샘플을 볼 때 열 대신 행으로 편집되었습니다. 필요한 경우 언제든지 편집/롤백 할 수 있습니다. – Divakar