apache-pig

    3

    1답변

    사용중인 piglatin 스크립트 용 UDF를 만드는 데 문제가 있습니다. [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1121: Python Error. Traceback (most recent call last): File "utils.py", line 3, in <module> im

    1

    1답변

    데이터의 각 행에 대해 1부터 N까지 필드 0으로 곱하고 싶습니다. 데이터에 행 당 수백 개의 필드가있을 수 있습니다 그 문제에 대한 필드의 수), 그래서 각 쌍을 쓰는 것은 실현 가능하지 않습니다. 필드의 범위를 지정하는 방법이 있습니까? 다음과 같은 종류의 (잘못된) 스 니펫? A = LOAD 'foo.csv' USING PigStorage(',');

    2

    4답변

    돼지의 관계에 대한 필터를 수행하려고하는데, 첫 번째 필드 문자열에 세 번째 필드가있는 모든 레코드가 필요합니다. (내 소스 관계가 SRC라고 가정) Filtered= FILTER SRC BY $0 matches 'CONCAT(".*",$2,".")'; DUMP Filtered; 더 구문 오류가 없다하지만 난 필터링에 대한 출력을 받고 있지 않다 :

    2

    1답변

    나는 돼지에 완전히 익숙하지 않고 약간의 문제가 있습니다. 데이터 목록이 있으며 중복을 제거하고 싶습니다. 하지만 동일한 사용자 이름을 사용하고 액세스 시간이 동일한 임계 값 내에 있으면 복제본이 정의된다는 사실을 알게되었습니다. A : 예를 들면 : [USER1 10] B : [USER1 20] C : [USER1 11] D : 사용자 2, 10] 임계

    11

    3답변

    hadoop 명령을 사용하여 mapreduce 작업을 실행할 때 -libjars를 사용하여 캐시 및 클래스 경로에 내 jar를 설정합니다. 돼지에서 이런 식으로하는 법?

    2

    2답변

    I는 다음의 데이터가 설정되어 있다면 : c1 c2 --- --- 1 5 1 5 1 6 2 9 2 9 3 1 3 2 제가 첫번째 열의 각 값의 두 번째 열 (C2)에 가장 많이 발생하는 값을 반환 할를 (c1). 그래서 나는 c1 = 1에 대해 값 "5"가 두 번 발생하고 값 "6"이 한 번만 발생하고 c1 = 2 일 때 "9"값이 두 번

    1

    1답변

    돼지 관계에 시퀀스를 만들고 싶습니다. 나는 데이터의 관계를 예를 들어 말을 : 내가 같은 관계에 카운터를 하나 더 열을 추가하고 각 레코드 읽기 수를 계속 증가하는 즉, 순서를 만들 (John, A-1) (Jack, B-2) (Jim, C-1) . Exepected 출력 결과는 아래와 같습니다 : (200 시작 순서 인 경우.) (John, A-1

    0

    1답변

    이 문제는 카산드라 1.1.2 최신에서 해결 된 것으로 보이지만 난 여전히 1.1.0에 사람들을 위해 여기를 떠나서 찾을 수 없습니다 Cassandra 1.1.0으로 업그레이드하여 소스에서 컴파일했는데 이제 CassandraStorage() 클래스를 찾을 수 없으며 contrib 디렉토리가 사라졌습니다! 내가 어디에서 찾을 수 있는지 알 수 있습니까? 이

    3

    2답변

    돼지 두 개의 가방 라틴어/CONCAT을 결합하는 방법 : 내가 지금 A = {uid, url}; B = {uid, url}; 을 cogroup A : 나는 {group AS uid, DISTINCT A.url+B.url}에 C를 변경하려면 C = COGROUP A BY uid, B BY uid; 와; 제 질문은 어떻게 두 개의 가방 인 A.url과

    1

    2답변

    돼지 쿼리를 프로파일 링하려고하지만 지금까지 아무 것도 유용하지 않습니다. CPU, 디스크 I/O, RAM 사용량을 측정하려고합니다. 누구든지 나를 안내 할 수 있습니까? 상황이 지금까지 불가사리를 시도 - 하둡 작업으로 작동하지만 돼지 로 - 돼지 쿼리를 HPROF를 지원하지 않습니다 - 하둡 작업에하지만 돼지 쿼리와 함께 작동합니다. - 하둡 작업 전용