임팔라 JDBC 드라이버를 사용하여 임팔라에 배치 데이터를 일괄 적으로 삽입하고 있습니다. 현재 배치 크기가 1000이고 배치 쿼리를 실행하기 위해 PreparedStatement에 의해 INSERT INTO VALUES 절을 사용합니다. 임팔라 데몬 3 대와 임팔라 카탈로그 서버, 상태 저장소가 4 대 기계에서 실행됩니다.임팔라에 배치를 너무 오래 걸립니다.
임팔라에 일괄 삽입 쿼리 계획은 다음과 같습니다 : 우리가 볼 수 있듯이
Query Timeline: 35s398ms
- Query submitted: 0.000ns (0.000ns)
- Planning finished: 34s822ms (34s822ms)
- Submit for admission: 34s886ms (63.997ms)
- Completed admission: 34s886ms (0.000ns)
- Ready to start 1 fragment instances: 34s886ms (0.000ns)
- All 1 fragment instances started: 34s958ms (71.997ms)
- DML data written: 35s082ms (123.996ms)
- DML Metastore update finished: 35s286ms (203.993ms)
- Request finished: 35s298ms (11.999ms)
- Unregister query: 35s374ms (75.997ms)
- ComputeScanRangeAssignmentTimer: 0.000ns
이 계획이 모든 시간을 할애한다 마쳤다. 우리는 두 가지 형식, PARQUET 및 일반 형식을 모두 만들려고했습니다. 그러나 계획이 끝날 때마다 파트가 너무 높습니다.
수행해야 할 구성 변경이 있습니까? 아니면 내가 잘못하고있는거야?