2017-12-28 47 views
-1

나는 약 190,000 행의 Facebook 데이터의 csv 파일을 가지고 있습니다. 내가 가장 댓글 (comment_message의 #)과 Sentiment > 0 할 수있는 사람을있는 comment_author 발견 할데이터를 csv 파일의 R로 필터링

comment_id, status_id, parent_id, comment_message, comment_author, comment_published, comment_likes, Positive, Negative, Sentiment

: 열 이름은 다음과 같습니다.

아무도 R을 사용하여이 필터를 적용하는 방법을 알고 있습니까?

df %>% group_by(comment_author,sentiment) %>% 
     dplyr::summarize(total_number_comment=sum(comment_message)) %>% 
     as.data.frame() %>% 
     arrange(desc(total_number_comment)) %>% 
     filter(sentiment>0) 

난 당신이 정말 sentiment 변수 (당신은 예를 들어 예제를 제공해야합니다)와 함께 수행 할 작업을 이해하지 못했다 :

+1

안녕하십니까. [최소한의 완전하고 검증 가능한 예제를 만드는 방법] (https://stackoverflow.com/help/mcve)을 읽고 게시물을 업데이트하십시오. –

답변

0

df 만약 당신이 다음과 같이 dplyr 패키지를 사용할 수있는 데이터 프레임 하지만 그룹화 부분이 완료되었습니다

+0

빠른 도움에 감사드립니다. 감정은 -5에서 5까지의 숫자를 나타내며 0은 중립입니다. 예를 들어 -5는 주석이 매우 부정적임을 의미합니다. 제안 된 코드를 사용하려고했지만 항상 다음 오류 메시지가 표시됩니다. df %> % group_by (comment_author, Sentiment) %> % dplyr :: summarize (total_number_comment = sum (comment_message)) %> % : 함수를 찾을 수 없습니다 "%> %" 내가 뭘 잘못했는지 알아? 코드에 뭔가를 추가해야합니까? 미리 감사드립니다 :-) – lzed

+0

@lzed dplyr 라이브러리가 설치되어 있습니까? 코드 라이브러리 ("dplyr") 전에 사용하십시오. –