1
의 정규화 일부를 플로팅 라인은 한 달을 나타냅니다.내가 구성 선 그림을 할 수있어 데이터
내 dataframe은 (내가 더 많은 열을 가지고 있지만,이 관련이 없습니다 것)이 형식으로되어 있습니다 :
id_tweet day month hour minute id_user
550654742654103552 01 01 12 08 174744462
550654753106296832 01 01 12 08 15355832
550654818935910400 01 01 12 08 628822209
550654823667089409 01 01 12 08 283218297
550654824308813824 01 01 12 09 58315346
내가 1 월 트윗 몇 퍼센트의 사람들, 또는 7 월 알고 싶어요, 또는 그런 것.
문제는 내 데이터가 매우 편향되어 있고 수집 알고리즘이 변경되어 나머지 1 ~ 4 개월 동안 더 많은 데이터가 있다는 것입니다. 내 데이터 분포는 아래 이미지에 표시됩니다.
짧게 요약하자면, 매 시간마다 트윗 된 모든 트윗을 합산하여 1 월의 트윗 총 수로 나눌 필요가 있습니다. 그것은 그래프의 1 행입니다.
줄 2는 매 시간마다 트윗 된 트윗이며 2 월의 트윗 총 수로 나눕니다.
희망은 분명했고 내가 얻을 수있는 도움을 미리 감사드립니다.
정확히 내가 필요한 것입니다. 고맙습니다. –