apache-pig

    6

    2답변

    Apache Pig (Latin) 표현식과 같이 매우 긴 행이 있습니다. 여러 줄로 나누는 방법이 있습니까? 메모리 나 서비스를 제공하는 경우 나는 최대한 빨리 이 제 (불완전) 명령을 실행 Enter 키를 누릅니다으로, 아무 소용이 후행 백 슬래시를 시도했습니다 ...

    0

    1답변

    PHP와 같은 다른 프로그래밍 언어로 돼지 스크립트를 실행할 수 있습니까?

    4

    6답변

    이 질문의 문맥은 필자가 작성한 돼지 스크립트에서 maxmind java api를 사용하려고한다는 것입니다 ... 그러나 그 중 하나에 대해서 알고 있다는 것이 질문에 대답하는 것이 필요하다고 생각하지 않습니다. maxmind API에는 필요한 정보가있는 쉼표로 구분 된 파일 인 GeoIP.dat라는 파일에 대한 경로가 필요한 생성자가 있습니다. API를

    1

    1답변

    이 질문은 자극적 일 수 있으며 실제로 프로그래밍과 관련이 없을 수도 있습니다. 그것은 제 동료와 가진 작은 토론의 분사입니다. HIVE와 PIG는 MapReduce 작업을 작성할 때 MapReduce에서 생각할 필요가 없기 때문에 HIVE와 PIG를 별도의 "프로그래밍 모델"이라고 부를 수 있습니다. 특히 HIVE에서 프로그래밍하는 경우 특히 그렇습니다.

    2

    1답변

    어떻게 Cassandra PIG 스크립트에서 명령 줄 인수로 값을 전달할 수 있습니까? 돼지 스크립트 {아파치 카산드라-0.4.0-SRC 경로} /있는 contrib/돼지/빈/pig_cassandra의 -param 인수 = 값 script.pig 다음을 실행하기위한 구문 라인 아래 아래 오류가 발생했습니다. [main] 정보 org.apache.pig.Ma

    3

    1답변

    안녕하세요 저는 여기에 나온 단계를 따라했습니다 : http://wiki.apache.org/pig/PiggyBank piggybank 항아리를 만드는 데는 다음과 같은 출력이 계속됩니다. 여기 [email protected]:~/piggybank/java$ ./makepiggy.sh Buildfile: /home/cloudera/piggybank/jav

    2

    1답변

    PIG 및 Hadoop을 처음 사용합니다. String에서 작동하고 문자열을 반환하는 PIG UDF를 작성했습니다. 실제로 udf에 비즈니스 로직을 포함하고있는 기존의 jar 클래스를 사용합니다. 클래스 생성자는 2 개의 파일 이름을 입력으로 사용하여 입력 처리에 사용되는 사전을 작성합니다. mapreduce 모드에서 작동시키는 법 돼지 로컬 모드에서 파일

    2

    1답변

    안녕하세요, 저는 유연한 수의 차원을 가진 하프 기반 하이퍼 큐브를 시작하고 있습니다. 누구도이 기존의 접근법을 알고 있습니까? 방금 ​​PigOLAPSketch을 찾았지만 사용할 코드가 없습니다. 또 다른 방법은 hbase를 사용하는 lastfm의 Zohmg이지만 매우 위험한 것으로 보입니다. 나는 돼지 솔루션을 시작할 것이라고 생각하는데, 아마도 조언이

    8

    1답변

    파일에서로드하는 레코드 세트가 있습니다. 가장 먼저해야 할 일은 최대 및 최소 컬럼을 얻는 것입니다. SQL에서이 같은 하위 쿼리 함께 할 것입니다 : select c.state, c.population, (select max(c.population) from state_info c) as max_pop, (select min(c.population)

    1

    2답변

    이 파일에는 Hadoop에있는 데이터 목록이 들어 있습니다. 나는 ID 번호하여 파일을 분석하는 간단한 돼지 스크립트를 구축했습니다, 등등 ...는 내가 찾고 마지막 단계는 이것이다 : 내가 만들 싶습니다 (저장) 각 고유 한 파일 id 번호. 그래서 이것은 그룹 단계에 달려 있습니다 ... 그러나 이것이 가능한지 이해하지 못했습니다 (아마도 맞춤 상점 모