2016-10-05 10 views
0

큰 파이썬 파일 (> 500,000 행)이 있고 데이터 프레임 (팬더)의 열에 비어 있지 않은 셀을 읽으 려합니다. 지금, 나는이 일을하고있다 :CSV 파일의 열에있는 비어 있지 않은 셀을 효율적으로 읽는 방법

df = pd.read_csv(filename) 

myiter = []  

    for xiter, x in enumerate(df['Column_name']): 

     if (np.isnan(x) == False): 
      myiter.append(xiter) 

동일한 작업을 수행 할 수있는보다 효율적인 방법이 있나요?

답변

0

dfNaN으로 태그가 지정되어 있습니까? 예 다음

df.dropna() 
+0

을 할 경우

나는 주어진 열 (다른 컬럼도 NaN이있을 수 있으므로) NaN의이없는 경우에도 그것이 모든 행을 삭제 깨달았다. 지정된 열에 NaN이있는 행만 삭제할 수 있습니까? – Piyush

+0

불가능하다면, col 2 값을 유지하고 인덱스를 유지하려면 col 1 값을 어떻게 버리겠습니까? na를 사용하지 않고 컬럼에서 df를 만들고 싶다면'newdf = df [ 'Column_name']. dropna()' –

+0

weird ... 당신이 시도한 것을 보여주세요. – MMF