hadoop 환경에서 adaboost 알고리즘을 구현하는 데 관심이 있습니다. 필자는 네이티브 반복 지원이 부족하여 mapreduce가 느려질 수 있다는 연구를했습니다. 아파치 하마는 흥미로운 대안이지만 아파치 하마의 어떤 기능이 애드 보아를 효율적으로 구현하는 것을 허용하지 않습니까?
저는 현재 Hadoop에서 결정 트리 (PLANET이라고도 함)를 구현하기위한 Google의 프레임 워크를 구현했습니다. 트리가 완전히 빌드 될 때까지 하나의 버텍스부터 시작하여 점점 더 추가하는 맵 축소 작업으로 시작됩니다. 하나의 큰 문제는지도/삭감 작업이 많이 차례로 진행된다는 사실입니다. 따라서 항상 새로운 작업을 시작하는 데 드는 비용은 매우 높습
아파치 하마를 살펴보고 난 후 http://hama.apache.org/hama_on_clouds.html의 지침을 따르고 0.8.2를 다운로드했지만이 버전에서는 폴더 조리법에 hama-ec2.properties가 없습니다. 그러므로 나는 그것을 시도 할 수 없다. 이 릴리스에서이 파일이 삭제 된 이유가 있으며 EC2에서 whir을 통해 hama를 시도하는
https://github.com/awslabs/emr-bootstrap-actions/tree/master/hama 스크립트를 사용하여 Amazon Elastic MapReduce에서 Apache Hama를 실행하려고합니다. 그러나 하나의 마스터 노드와 두 개의 슬레이브 노드로 시도 할 때 BSP 코드의 peer.getNumPeers()은 오직 하나의 피
병렬 분기를 구현하고 BFS를 구현하려고합니다. DryadOpt를 Dryad LinQ 위에 사용하는 것에 관심이 있습니다. 아무도 DryadOpt를 얻었습니까? 나는 우리가 DryadLinQ의 학술적 버전을 얻을 수 있고 그것이 Azure에도 있지만, 내가 DryadOpt를 얻을 수있는 어떤 방법이 있는지 알고있다. 아파치 하마가 병렬 브랜치를 처리하고 바