2017-12-28 31 views
-1

누락 된 데이터를 나타내는 CSV로 만든 데이터 프레임이 있습니까? 상징. 얼마나 많은 행이 있는지 확인하고 싶습니다. 발생 횟수와 함께 발생합니다. 지금까지 내가 이걸 만들었지 만 모든 행의 수를 보여줄뿐 아니라 그 수를 보여 줬어? 발생합니다.데이터 프레임에 물음표 기호가 포함 된 행의 수

print(sum([True for idx,row in df.iterrows() if 
any(row.str.contains('[?]'))])) 

답변

0

당신은 모든 열을 문자열 가정, + str.containsapply를 사용할 수 있습니다. 당신은 단지 문자열 열을 선택해야하는 경우

c = np.sum(df.apply(lambda x: x.str.contains('\?')).values) 

, select_dtypes 사용 - 사용하여 수 그들의 ?을 포함하는 행의을 찾기 위해, 또는

i = df.select_dtypes(exclude=['number']).apply(lambda x: x.str.contains('\?')) 
c = np.sum(i.values) 

c = df.apply(lambda x: x.str.contains('\?')).any(axis=1).sum() 

데모 -

df.apply(lambda x: x.str.contains('\?')).any(1).sum() 
4 
+0

df A B 0 aaa ?xyz 1 bbb que!? 2 ? ddd 3 foo? fff 
하지만이 모든 물음표 수없는 물음표 행의 수를 표시합니다. 두 개의 물음표가있는 행이있을 경우 2를 더합니다. 1 – kurbielp

+0

@ kurbielp 문제를 설명했습니다. 수정 된 문제는'df.apply (lambda x : x.str.contains ('\?')). any (1) .sum()'을 사용하십시오. –