Hadoop
(reference)에서 지원되는 것처럼 보입니다. 그러나 이것을 사용하는 방법은 알지 못합니다. hadoop : Map Reduce 작업을위한 여러 출력을 지원합니다.
a.) Map - Read a huge XML file and load the relevant data and pass on to reduce
b.) Reduce - write two .sql files for different tables
내가지도를 선택하고 왜 축소/I는 디스크상의 거주 100k(may be many more)
를 통해 XML 파일에 대해이 작업을 수행해야하기 때문이다. 더 좋은 제안을 환영합니다
이 사용 방법을 설명하는 모든 리소스/자습서를 보내 주시면 감사하겠습니다.
나는 Python
사용하고이 사용 streaming
감사합니다 달성하는 방법을 배우고 싶은 것
그럼 ... 궁금한 점은 무엇입니까? 더 자세하게 얘기해 주 시겠어요? –
지도에 다중 출력을 쓰거나 스트리밍 API를 사용하여 작업을 줄일 수 있습니까? – daydreamer