2017-12-06 10 views
0

가 목록에 포인트의 IBM article related to Hadoop 하나에 읽기를 가졌다에 가까운 데이터를하둡 : 데이터에 가까운 처리 로직이 아닌 처리 로직 설명

하둡 분산 파일 시스템은 많은 목표를 가지고 있었다. 데이터에 가까운

처리 로직보다는 그것은 단어의 놀이처럼 나에게 소리 처리 로직

에 가까운 데이터 : 여기서 가장 주목할만한의 일부입니다. 데이터에 가까운 프로세싱 로직과 프로세싱 로직에 가까운 데이터 사이에 차이가 있습니까?

답변

1

상당한 차이가 있습니다.

데이터에 가깝게 처리하는 것은 실제로 데이터가있는 서버에서 비즈니스 논리를 실행하는 것을 의미합니다.

데이터를 처리에 가까이 가져가는 것과 비교하십시오. 데이터베이스를 쿼리하고 다른 시스템과 연결하는 경우가 있습니다. 이 경우 데이터는 네트워크를 통해 전송됩니다.

코드 및 라이브러리 전송은 기가 바이트 및 테라 바이트 상당의 데이터를 가져 오는 것보다 네트워크 전송에서 훨씬 적은 오버 헤드가 발생할 것이라고 주장했습니다.

Hadoop2에서는 mapreduce, Spark 등의 프로세스가 데이터 노드 프로세스와 병렬로 프로세스 컨테이너에서 실행되는 YARN에 의해 ​​처리됩니다.