2017-10-17 15 views
0

일부 쿼리를 수행하기 위해 클러스터에 presto를 설치했습니다. 16GB의 RAM이있는 4 개의 노드가 있습니다. 나는 presto를 설정하는 단계를 밟았지만 쿼리를 실행했을 때 하이브에 대한 동일한 쿼리보다 훨씬 더 많은 시간이 걸립니다. 그래서 나는 내 구성에 뭔가 잘못 생각합니다.Presto 구성 방법

아마도 node.properties 파일의 값이 인 query.max-memory와 query.max-memory-per-node의 값이 틀린 것 같습니다. 각 노드에 16GB RAM이 있다는 것을 고려하여이 속성에 대한 올바른 값은 무엇입니까?

덕분에

답변

0

당신은 당신이 조정할 필요가 있습니다 정확한 특성을 발견했다. 그러나 "올바른"값은 없습니다 ... 실제로 데이터 + 쿼리에 따라 다릅니다. 실행중인 데이터 집합 및 쿼리 유형에 대한 일반적인 요약을 제공 할 수 있습니까?

+0

에 TPC-DS 벤치마킹을 실행하고 싶습니다. –

+0

어떤 스케일 인자를 사용하고 있습니까? 예상대로 작동하지 않는 몇 가지 예제 쿼리가 있습니까? 아니면 전부입니까? –

+0

메신저 10, 30, 50 및 100GBm을 사용하여 벤치 마크 수행 ... 가장 중요한 경우는 쿼리 95 ... 10GB (https : // github)의 배율 인수로만 실행할 수 있습니다. .com/hortonworks/hive-testbench/blob/hive14/sample-queries-tpcds/query95.sql) 다른 사용자는 쿼리 실행 중 모든 작업자를 죽입니다. –