프로젝트에서 작업 중이고 다음과 같은 경우에 멈추었습니다.Apache Spark를 사용하여 테이블에 다중 삽입
나는 테이블이 있습니다 superMerge (ID, 이름, 급여)
을 나는이 개 다른 테이블이 : 표 1 및 표 2
모든 테이블 (표 1, 표 2 및 superMerge)와 동일한 구조를 가지고 있습니다.
이제는 table1과 table2의 superMerge 테이블을 삽입/업데이트하는 것이 좋습니다. table1은 매 10 분마다 table2가 20 분마다 업데이트되므로 시간 t = 20 분에 동일한 작업 (이 경우 superMerge)을 시도하는 작업이 2 개 있습니다.
이 병렬 삽입/업데이트를 어떻게 수행 할 수 있는지 알고 싶습니다. spark 또는 다른 hadoop 응용 프로그램을 사용하여 superMerge 테이블에 병합하십시오.
테이블에 대해 더 자세히 설명해 주실 수 있습니까? superMerge로 무엇을하려고합니까? 끊임없이 table1과 table2를 같은 위치에 붙인 다음, 필요할 때 그 위치에서 superMerge를 읽는 것이 잘못된 이유는 무엇입니까? – ayplam
superMerge는 일반 테이블 대신 테이블 1과 2의 뷰일 수 있으므로 superMerge를 업데이트 할 필요가 없습니다. –
@ ArthurJulião가보기를 만드는 것은 옵션이며 나는 직접적인 해결책이 없다는 것을 실제로 알게 될 것입니다. 하지만 나는 아마 스파크 또는 피닉스가 제공하는 솔루션을 찾고 있는데, 나는 그것을 모르고있다. – GKV