자주 다운로드하는 파일의 파일 이름에 날짜가 있습니다.Airflow에서 매개 변수를 사용하는 예는 무엇입니까?
csat_surveys_2017_03_05.csv
03062017_roster.csv
내 코드는이 코드를 개별적으로 처리합니다.
- 파일 이름을 추가 존재한다 예상되는 날짜와 (파일 이름 슬라이스 기준) 처리 된 파일 목록에서 날짜 (일부 날짜가 현재 날짜까지 범위) 내가 처리 할 각 파일에 대해
- 비교 해당 테이블에 추가되지 않은 새 파일 만 처리합니다.
이 논리를 코딩해야 할 필요를 대체하기 위해 기류 일정 날짜를 사용할 수 있습니까? 매일 작업이 실행되도록 예약됩니다. 필자는 예정된 날짜 (아마도 1 일 빼기)를 가져 와서 해당 값을 매개 변수로 사용하여 파일 이름의 일부로 전달합니다 (팬더에서). 그렇다면 템플릿으로 사용할 수있는 명확한 예를 참조 할 수 있습니까?
파일을 놓치거나 며칠 동안 지연되는 경우 더 나은 접근 방법입니다 (필자는 작업이 실패하기를 원하고, 성공할 때까지 계속 노력하고 있거나 고객에게 문제 제기)?