2017-10-31 14 views
1

나는 여러 해 동안 몇 가지 데이터가 포함 된 csv 파일을 가지고 있습니다. 데이터 제공 업체의 궁극적 인 지혜로 데이터는 실제로 여러 헤더 행 (각 연도에 하나씩)과 함께 구조화됩니다. 파일의 맨 위에 예를를 들어OpenRefine 곱하기 헤더 행

내가 가진 :

그런 다음 보이는 또 다른 헤더 행이되어 2004에 대한 모든 데이터 후
All | 2004 | Team | Player then some other rows 

같은 :

All | 2005 | Team | Player 

거기인가 이걸 정리하려면 OpenRefine의 방법이 필요합니까?

답변

3

본인이 알고 있듯이 이러한 방식으로 데이터가 구성됩니다.

All,2004,Team,Player 

1, data1,team1,Player1 

2, data2,team2,Player2 

3, data3,team3,Player3 

All,2005,Team,Player 

4, data4,team4,Player4 

이것이 맞으면 "해"열을 만든 다음 머리글을 삭제하는 것이 좋습니다. 다음은 정규 표현식 ^\d{4}$을 사용하여 연도를 분리 할 수있는 가능성입니다.

enter image description here

+1

정말 고맙습니다. – SeagullWardy