2017-03-29 6 views
2

현재 사전에서 팬더 데이터 프레임을 만들었습니다.팬더 데이터 프레임에서 단어 빈도를 계산하는 방법 - Python

 URL   TITLE 
0 /xxxx.xx Hi this is word count 
1 /xxxx.xx Hi this is Stack Overflow 
2 /xxxx.xx Stack Overflow Questions 

내가 단어 "스택 오버플로"가 표시 주파수의 수를 나열이 테이블에 새 열을 추가 할 : Dataframe은 같이 보입니다.

 URL   TITLE       COUNT 
0 /xxxx.xx Hi this is word count    0 
1 /xxxx.xx Hi this is Stack Overflow   1 
2 /xxxx.xx Stack Overflow Questions   1 

count 기능은 사전에 있지만 문자열 작동하지 않습니다 그래서 예를 들면, 그것은 같은 것입니다. 이 작업을 수행하기위한 쉬운 방법이 있습니까?

+0

테이블을 만들기위한 사전과 코드를 표시 할 수 있습니까? –

+1

팬더 데이터 프레임입니까? – Jan

+0

"스택 오버플로"는 단어가 아니며 두 단어입니다. 문자열에 "Overflow Stack"또는 "Notstack Overflow"가 포함되면 어떻게 될까요? –

답변

3

이 실제로 pandas dataframe입니다 가정하면, 당신은 할 수 :

import pandas as pd 

table = { 'URL': ['/xxxx.xx', '/xxxx.xx', '/xxxx.xx'], 
      'TITLE': ['Hi this is word count', 'Hi this is Stack Overflow', 'Stack Overflow Questions']} 

df = pd.DataFrame(table) 
df['COUNT'] = df.TITLE.str.count('Stack Overflow') 
print(df) 

이 수율 :

     TITLE  URL COUNT 
0  Hi this is word count /xxxx.xx  0 
1 Hi this is Stack Overflow /xxxx.xx  1 
2 Stack Overflow Questions /xxxx.xx  1 
+0

이 작품! 감사 – Elizabeth

0

dataframes에 count() 방법은 스택 '과 같은 단일 값을 계산 발생에 좋다 과다".

여러 값의 빈도 분석을 수행하려면 collection.Counter(data) 및 해당 .most_common(k) 메서드를 사용하는 것이 좋습니다.