2013-07-17 2 views
2

나는 Pentaho Data Integration에서 변환을 수행하고 있으며 SFTP 서버 디렉토리에 파일 목록이 있습니다. 이 파일은 FILE_YYYYMMDDHHIISS.txt 형식으로 이름이 지정됩니다 내 디렉토리는 다음과 같습니다Pentaho Data Integration (DI) SFTP 서버의 디렉토리에 마지막 파일 가져 오기

  • mydirectory
    • FILE_20130701090000.txt
    • FILE_20130701170000.txt
    • FILE_20130702090000.txt
    • FILE_20130702170000.txt
    • FILE_20130703090000.txt
    • FILE_20130703170000.txt

내 문제는 내가 생성 날짜의에 따라이 목록의 마지막 파일을받을 필요가있다이다, 내가 펜타 데이터에서이 작업을 수행 할 수 있습니다 ... 어떻게 다른 변환 단계에

그것을 통과 완성?

+0

안녕하세요, StackOverflow에 오신 것을 환영합니다. 귀하의 질문은 SO 형식과 잘 맞지 않기 때문에 가까운 투표를했습니다. 특히, 당신이 시도한 것을 우리에게 보여주지 못했습니다. 무엇을 시도해야할지 모를 경우 SO가 질문 및 응답 형식을 제공하도록 설계된보다 기본적인 도움이 필요할 것입니다. –

+1

나는 주전자 대답에 대한이 폐회 제안에 질려하기 시작했다. 나는 주전자 사용자이고 나는이 대답이 답을 얻는데 완벽하다고 생각한다. 나는 충분히 공정한 문제를 이해한다. – jipipayo

답변

4

사실 파일 이름을 텍스트로 정렬 할 수 있고 정렬 목록의 최대 값이 가장 최근의 파일이되므로 매우 간단합니다.

파일 목록이 짧기 때문에 Memory Group by 단계를 사용할 수 있습니다. 그룹화 단계에서는 집계 할 별도의 열이 필요합니다. 열만있는 경우 전체 집합에서 최대 값을 찾으려면 Add Constants 단계가 포함 된 그룹화 열을 추가하고 모든 행에 정수 1을 추가하여 열을 추가하도록 구성 할 수 있습니다.

Memory Group by을 1의 열을 기준으로 그룹화하고 파일 이름 열을 제목으로 사용하십시오. 그런 다음 최대 그룹화 유형을 선택하기 만하면됩니다. 그룹화 열이있는 단일 행, 제거 된 파일 이름 필드 및 최대 파일 이름을 포함하는 집계 열이 생성됩니다. 그것은 다음과 같이 보일 것입니다 :

enter image description here