테이블의 머리글 행 위에 텍스트 행 (및 빈 행)이있는 Excel 파일이 여러 개 있습니다.Talend 사용 Studio DI를 열어 고유 한 첫 번째 행에서 추출 값을 추출한 후 열을 계속 처리합니다.
파일을 처리하여 그 행에서 텍스트를 추출하고 여러 파일을 추가 할 때 열로 포함시킬 수있는 가장 좋은 방법은 무엇입니까? 각 파일을 두 번 처리하지 않고도 가능합니까?
예
This file was created on machine A on 01/02/2013
Task|Quantity|ErrorRate
0102|4550|6 per minute
0103|4004|5 per minute
그리고 유사한 여러 파일
내가 함께 그것을 할 수있는 방법의 작은, 원유 샘플을 넣어Task|Quantity|ErrorRate|Machine|Date
0102|4550|6 per minute|machine A|01/02/2013
0103|4004|5 per minute|machine A|01/02/2013
0467|1264|2 per minute|machine D|02/02/2013
우아한 해결책은 동일한 파일의 2 개의 입력을 사용하는 것이 내 머리 속에 들어 가지 않는다는 것입니다. 어떤 문제가 있는지 1) 입력 중 하나를 차단하는 파일 잠금 또는 2) 조회시 시간 내에 처리 된 헤더 데이터가없는 tMap (또는 talend가 무의미하게 처리 함) – mobcdi
파일에 쓰지 않는 한 파일 잠금과 관련해서는 괜찮을 거라 믿습니다. 샘플은 제대로 작동했지만 행이 몇 개 밖에 없었으므로 프로덕션 환경에서 사용할 행 수를 기반으로 볼륨 테스트를 해보는 것이 좋습니다. 이 접근 방식의 큰 단점은 동적이 아니라는 것입니다. 매번 고정 된 수의 파일이 제공됩니까? –
또한 컴퓨터 이름 (귀하의 경우)과 날짜와 같은 메타 데이터를 파일 이름에 삽입했습니다. 그렇다면 거기에서 얻을 수 있고 2 입력으로 파일을 읽는 것에 대해 걱정할 필요가 없습니다. –