나를위한 오픈 소스 시스템을 찾고 있는데, 내 큰 데이터 클러스터은 hadoop, hdfs, hive, spark, oozie, hbase, zookeeper, kylin과 같은 구성 요소를 포함한 50 개 이상의 기계로 구성되어있다. 을 관리한다. 나는은 "관리"의 웹 시스템 국지적 인 의미에서에게이를 관리 원하는 :hadoop/hive/spark /를 포함한 큰 데이터 클러스터를 관리 할 수있는 오픈 소스 소프트웨어는 무엇입니까?
- 내가 할 수 를 다시 시작 과 같은 하나의 클릭으로 구성 요소를 하나씩, 내가 같은 나는 새로운 사육사를 배포 때와 한 번의 클릭으로 구성 요소를 배포 할 수있는 또 다른
- 에 의해 구성 요소 사육사가 다시 시작 합니다 하나의 시스템을 "다시 시작"버튼을 클릭, 나는 컴파일 사육사을 만들 수 있습니다 준비된 한 컴퓨터에서 "배포"를 클릭하면 모든 컴퓨터에 자동으로 배포됩니다 .
- 나는 다음 업데이트 사육사 것, 그때 내가 "업데이트"를 클릭, 기계에 업데이트 된 사육사 를 넣을 수 있습니다, 같은 나는 사육사 클러스터를 업데이트 할 때와 같이, 단 하나의 클릭으로에게 구성 요소를 업그레이드 할 수 있습니다 다른 컴퓨터의 모든 사육사를 무시합니다. 모두 모두
는, 내가 원하는, 로그를 보려면, 업그레이드, 배포 구성을 수정 등등, 또는 적어도 그들 중 일부를 다시 시작처럼 내 빅 데이터 클러스터에 대한 관리 시스템입니다.
가 나는 Ambari고려한 있지만 절대 스크래치에서 내 전체 시스템 를 배포하는 데 사용할 수 있지만, 내 큰 데이터 클러스터는 이미 일년 동안 실행됩니다.
제안 사항?
이 클릭 기능의 목적은 무엇입니까? 클러스터를 수동으로 관리하거나 들어오는 작업 부하를 기반으로 이러한 작업을 자동화 할 계획입니까? 메타 스케줄러는 두 번째 계획에 도움이되지만 필요에 맞게 자신의 원 클릭 기능을 개발해야 할 수도 있습니다. – XYZ123