2014-09-26 10 views
0

일본 문자열 기반 데이터를 플롯하는 방법 :나는이 같은 CSV가 파이썬

Date, i, eat, chicken, you, fish, banana 
2014-9-14, 1, 2, 1, 1, 1, 0 
2014-10-15, 1, 1, 1, 0, 0, 0 
2014-11-13, 0, 1, 0, 1, 0, 1 

가 위/소문자와 I는 형태 학적 분석 일본어 텍스트되기 때문에 형태소 잊어 버려요.

궁극적 인 목표 :

http://imgur.com/uyTRQXR (I 이미지를 게시 할 수있는 충분한 명성을 필요가 없습니다.)

참고 : Y 축 단어 개수이다. 그것은 도트, x, 사각형 및 임의의 도형 일 필요는 없으며, 다른 색상의 도트/x만으로도 좋습니다.

가능한 경우 matplotlib 대신 ggplot을 사용하고 싶습니다.

+0

'2014-09-14'에서 '먹기'를 2의 척도로 결정하는 방법 – Wazzzy

+0

@ Wazzzy '나는 * 닭을 먹고, * 닭을 먹는다'는 문장에 '먹는 것'이 2 개있다. mData에 대한 몇 가지 실수가 지금 바로 잡을 것입니다. 미안합니다. – Sayyora

+0

실수 : 나는 닭고기를 먹고 물고기는 먹는다. – Sayyora

답변

1

아마도 scatter plot의 양식을 찾고있을 것입니다. first example on the ggplot project page에는 구성 방법이 나와 있습니다.

데이터는 이미 플롯에 필요한 형식이어야합니다. 귀하의 경우 단어가 실제로 상관 관계가 없기 때문에 stat_smooth()을 생략해야합니다.