2017-12-28 51 views
1

아파치 서버 로그 데이터를 사전 처리하고 있습니다. ID, TIME 및 BYTES라는 3 개의 열이 있습니다. 예 :중복 열을 그룹화하고 팬더를 사용하여 해당 열 값을 합계합니다.

ID 및 NBSP & NBSP TIME & NBSP & NBSP BYTES

1 NBSP & NBSP 13시 & NBSP & NBSP 10

2 NBSP & NBSP 13시 2분 & NBSP & NBSP 30

3 NBSP & NBSP 13시 3분 & NBSP & NBSP 40

4 NBSP & NBSP 13시 2분 & NBSP & NBSP 70

& NBSP & NBSP 50

5 & NBSP NBSP 13시 3분

ID & NBSP & NBSP TIME & NBSP & NBSP BYTES

1이 & nbsp NBSP 13시 & NBSP & NBSP 10

2이 & nbsp NBSP 13시 2분 & NBSP & NBSP 80

:

나는 이런 식으로 뭔가를 달성하고자하는

3이 & nbsp NBSP 13시 3분 & NBSP & NBSP (110)

+0

df.groupby '('TIME 'as_index = 거짓) .agg ({'ID ''분 ','BYTES ''합 '})'것 해야 할 것. – Zero

+0

실제로. @ 제로, 속는 사람을 찾을 수 있습니까? –

+0

시간이 엉망이되었습니다. 이제 시간은 0 시부 터 기괴한 패턴으로 시작됩니다. 제 경우에는 ID가별로 중요하지 않습니다. 그래서, 그것은 단지 시간과 바이트입니다. 나는 출력물을 내가 보여준 것처럼 보이기를 원한다. 왜냐하면 TIME에 대해 그래프를 그리기 때문이다. 출력은 그림과 같이 TIME 순이어야합니다. 당신은 어떤 변화를 제안합니까 @ 제로? – scarecrow

답변

1

의 시도하자

,188,857,904,593,210

출력 :

enter image description here