2012-01-11 1 views
4

나는 시험용 카산드라 + 돼지 클러스터를 설치하려고합니다. 카산드라 위키는 돼지와 통합하기 위해 필요로하는 것처럼 소리가납니다.카산드라와 돼지의 통합 - 선택 사항은 선택 사항입니까?

하지만 cassandra-src/contrib/pig의 readme는 hadoop없이 cassandra에서 돼지를 실행할 수있는 것처럼 들립니다.

hadoop이 선택 사항 인 경우 사용하지 않으면 무엇을 잃게됩니까?

답변

6

Hadoop은 테스트 할 때만 선택 사항입니다. 어떤 규모로든 어떤 일을하기 위해서 당신은 또한 필요합니다.

hadoop없이 실행한다는 것은 돼지를 로컬 모드에서 실행 중임을 의미합니다. 기본적으로 모든 데이터가 실행중인 동일한 돼지 프로세스에 의해 처리된다는 것을 의미합니다. 이는 단일 노드와 예제 데이터에서 잘 작동합니다.

상당한 양의 데이터 또는 여러 컴퓨터에서 실행중인 경우 돼지를 굴림 모드로 실행하고 싶습니다. 귀하의 카산드라 노드에서 hadoop 작업 추적기를 실행하면 돼지가 작업 부하를 분산하고 데이터 지역을 사용하여 네트워크 전송을 줄임으로써지도 축소의 이점을 활용할 수 있습니다.

+0

그것이 내가 알아야 할 필요가있는 것입니다. 고맙습니다. – marathon

-1

선택 사항입니다. 카산드라는 돼지의 LoadFunc와 storeFunc를 독자적으로 구현하여 쿼리와 저장을 허용합니다.

하둡과 카산드라는 여러면에서 다릅니다. 성취하려고하는 것이 정확히 무엇인지 모른 채 잃어버린 것을 말하기는 어렵습니다.

+0

돼지 동행에 Hadoop이 필요합니다. Cassandra 기반 동시 돼지는 없으며 로컬 모드 만 있습니다. – rjurney