나는 이렇게되면 목록이 있습니다정리 및 정상화 CSV 쉼표 (플랫 파일)
info1, info2, info3, info4, info5, info6
info1, info2, info3, info6
info1, info4, info6
info1, info2, info4, info5
등등 ... 내가 info4 및 info5 일 것입니다 무슨 작업을 할 필요를 (예 : 물론), 데이터를 정규화해야합니다. 이것을 달성하기 위해 사용할 수있는 방법이 있습니까?
나는 모든 조언을 주시면 감사하겠습니다.
awk -F, '{print $4 FS $5}' inputfile.txt
편집 정규화 된 출력은 샘플 데이터를 기대하고 무엇을 보여 질문 : – shellter
을 사용하고 "info1, info2, etc." 모든 행의 모든 필드에 대해 모든 입력란에 고유 한 입력을 표시하여 원하는 출력을 게시 할 때 어디에서 오는 것인지 알 수 있습니다. –
예상되는 결과가 무엇인지 표시하고 세 가지 값이있는 줄을보고 두 번째 줄이 'info4'인지 확인하고 'info5'부재로 처리 할 방법을 알려줘야합니다. 원본 줄을 식별하기 위해 'info1'또는 다른 것을 보관해야합니까? 이 정보를 추가 할 때까지는이 질문에 답할 수 없습니다. –