Scalding을 사용한 일부 계산의 마지막 단계로서 파이프의 여러 열의 평균을 계산하려고합니다. 그러나 다음 코드는 여러 개의 패스를하지 않고 같은 기능 sum, max, average을 계산하기 위해 어떤 방법이 있나요 myPipe.groupAll { _average('col1,'col2, 'col3) }
작동하지 않는 이유는 무엇입니까? 성능에 관
셸에서 Impatient/part1 디렉토리에 cleanJar을 입력했습니다. 출력은 다음과 같습니다. 오류는 "org.apache.hadoop.mapred.JobConf에 대한 클래스 파일이 없습니다."입니다. 왜 컴파일에 실패 했습니까? 자바 6 사용 :clean UP-TO-DATE
:compileJava
Download http://conjars.
나는 Cascading/Scalding에 매우 익숙하고, HBase로부터 뜨거운 데이터를 읽는 것을 알 수 없다. 저는 HBase에 포커 게임의 핸드 히스토리가 저장되어있는 테이블을 가지고 있습니다 (아주 간단한 방식으로 : id -> hand, serialized with ProtoBuf). 작업은 아래의 전체 역사를 통해 이동하고 모든 플레이어의 사전
누구든지 스키마를 생성 할 때 scalding의 연속적인 레코드를 비교하는 방법을 알고 있습니다. 내가 튜토리얼 6보고 및 기록 # 2 데이터 (모든 레코드) 레코드 # 1 예를 들어보다 큰 경우 내가 그 사람의 나이를 인쇄 할 것을 가정하고있다 : R1: John 30
R2: Kim 55
R3: Mark 20
if Rn.age > R(n-1).ag
HBase에 연결해야하는 Scalding 작업을 쓰려고하는데 HBase 탭을 사용하는 데 문제가 있습니다. 다음에 Twitter Maple이 제공하는 탭을 사용해 보았습니다. 그러나 사용하고있는 Hadoop/HBase 버전과 Twitter에서 클라이언트로 사용 된 버전간에 약간의 비 호환성이있는 것으로 보입니다. 내 클러스터에서 HBase 0.92 및 Ha