내 Pentaho 단계 중 하나에서 DB 조인을 만들었습니다. 필자는 오라클에서 PostgreSQL으로 환경을 전환하고 있습니다. PostgreSQL에 완전히 익숙하지 않아 버그를 없앨 수 없습니다. 조인은 다음과 같습니다. select t.contract,
t.calender,
t.mspprovider,
t.mspcustomer
ETL 프로세스에 대한 합리적인 테스트를 작성하려고합니다. 참조/테스트 섭취 데이터 세트가 필요하다고 생각합니다. 나는 클라이언트 데이터를 사용하고 싶지 않다. (이것은 다른 대안이다.) 그러면이 테스트 데이터 세트에서 현재 ETL을 실행하여 참조 변환을 얻습니다. 이렇게하면 소스 코드가 변경되면 ETL에서 현재 생성되는 항목에 대한 참조를 테스트하고 회귀
DB2 유틸리티를 사용하여 CSV에서 DB2로 ETL 프로세스를 진행 중입니다. 도전 과제는 가져 오기 명령에서 동적 파일 이름을 db2 변수로 지정하는 것입니다. 여기 connect to database;
CREATE OR REPLACE VARIABLE filenamePath VARCHAR(225);
SET filenamePath= concat(con
SAS에서 LAG 기능을 사용하여 SAS DI로 마이그레이션 할 때 코드 조각을 복제하려고했지만 SAS DI에서 전혀 동일한 기능이없는 것처럼 보입니다. 현재 SAS DI 4.21 사용으로 곧 4.9로 이동할 수 있습니다. 이를 위해 DATA work.dm_chg_bal;
SET tmp_bal_chg;
FORMAT dt2 date9.;
acct_id2
데이터 품질 문제로 인해 실패한 ETL 작업을 실행 중입니다. 내 소스에서 내 날짜 열은 String 형식이며 대상에 저장하는 동안 to_timestamp() 메서드를 사용하여 TIMESTAMP으로 변환 중입니다. 한 날짜 값 (문자열 형식)이 2016-11-10 06:07:48.633 대신 2016-06- 일 때이 작업이 실패합니다. 잘못된 값으로 인해
날짜 범위의 행을 해당 날짜 범위 내의 모든 요일에 대해 여러 행으로 분할해야하는 시나리오가 있습니다. 누구든지 인포매티카 파워 센터에서이 시나리오에서 타겟 (첨부 된대로)을 얻는 방법을 알고 있습니까? SOURCE code start date end date
ADMISSION 01/01/2017 02:05:11 01/01/2017 04:20:53
SSIS 패키지를 사용하여 데이터를 매일 새로 고칩니다. 다음과 같이 패키지 논리는 는 대상 테이블에 대상 테이블에 삽입 완전 새로운 데이터를 모든 행을 삭제합니다. 삽입을 실패 할 경우 삭제를 롤백하는 방법을 찾으려고합니다. 내 패키지는 오랜 시간 동안 갇혀 가고 응답하지 않는, 을하지만 지금, 후 SQL 작업이 실행 삭제 : I는 다음과 SSIS 패키지
스칼라에 데이터 구조를 구현하여 프로그램에서 수행중인 작업을 중복 제거 할 수 있습니다. 이 프로그램은 akka-scala 프레임 워크를 기반으로합니다. 직원에게 메시지를받을 때마다 현재 처리중인 데이터 구조를 확인합니다. 이러한 메시지 유형이 이미 처리중인 경우 해당 데이터 구조에 저장하고 처리 된 결과를 기다립니다. 처리 된 결과가 도착하면이 유형의 저
내 테이블은 15-20 개 이상의 클라이언트에 대한 부서 데이터로 구성되며 내 매핑에서 제대로 작동하는 트랜잭션 컨트롤을 사용하여 부서 유형에 따라 10 개의 다른 파일을 생성합니다. 요구 사항은 모든 클라이언트에 대해 이러한 파일을 생성하여 해당 클라이언트의 개별 폴더에 배치해야합니다. 어떻게 이것을 달성 할 수 있는지에 대한 아이디어? 나는 매핑이 모든
SSIS 패키지 내의 변수에서 행 수 결과를 얻은 다음 간단한 스크립트 작업을 사용하여 값을 인쇄하는 방법에 대한 샘플을 작성하려고합니다. 그래서 처음에는 행 수 결과 집합을 저장하려고하는 Int32 변수를 만든 다음 SSIS 작업 행 개수의 값을 캐치합니다. 그런 다음 내 스크립트 작업에, 나는 읽기 전용으로 변수를 전달합니다. 그리고 마침내, 나는 현재