2017-10-19 5 views
0

지도자를, 사용하는 동안 효율적으로 진행 결과를 저장하는 방법은 다음과 같이 dataframe '안양'에서 데이터를 처리하는 기능 Process_Data()를 사용하는 것을 시도하고있다df.apply()

:

def Process_Data(row): 
    ... 
    return(row)  

    def main(): 
    ...  
    df= df.apply(Process_Data, axis=1) 

데이터 프레임 'df'의 각 행을 처리하는 동안 일부 중간 결과를 파일에 저장하고 싶습니다. 무엇이 가장 좋은 방법입니까? 고마워.

답변

0

당신은 사용할 수 있습니다

for i,row in df.iterrows(): 
    Process_Row(row) 

또는

for row in df.itertuples(): 
    Process_Row(row) 

는 iterrows는 itertuple는 튜플로 행을 반환하는 일련의 개체로 행을 반환합니다.

itertuples이 더 효율적일 수 있지만 조작하려는 개체 유형에 따라 다를 수 있습니다.