hadoop

    3

    2답변

    나는 HDFS 내에서 특정 레이아웃을 필요로하는 Hadoop 프로그램을 작성했으며 이후에 HDFS에서 파일을 가져와야합니다. 그것은 단일 노드 Hadoop 설정에서 작동하며 Elastic MapReduce 내의 노드 중 10 개에서 작동하도록하고 싶습니다. 내가 해왔 무엇 이 같은 것입니다 : ./elastic-mapreduce --create --aliv

    17

    5답변

    Hadoop 작업을 매일 실행할 때 기존 출력 디렉터리를 덮어 쓰거나 다시 사용하고 싶습니다. 실제로 출력 디렉토리에는 매일 실행 된 작업 결과의 요약 출력이 저장됩니다. 동일한 출력 디렉토리를 지정하면 "output directory already exists"오류가 발생합니다. 이 유효성 검사를 무시하려면 어떻게해야합니까?

    0

    2답변

    다음 출력을 쓰기는 시나리오 나 다른 파일에 데이터를 기록 할 감속기에서 Reducer1 / Mapper - - Reducer2 \ ReducerN 입니다 def reduce(): for line in sys.STDIN: if(line == type1): create_type_1_fil

    2

    1답변

    에서 가족에 의해 값을 취득 행 : 우리가 각 행에 대해 FamilyMap를 얻을 다음 행에 의해 테이블 ​​행을 스캔 할 수있는 자바 HBase와의 API에서 Key, Family:Qualifier, Value Key, Family1:Qualifier, Value Key, Family2:Qualifier, Value Key, FamilyN:Quali

    1

    2답변

    나는 mapreduce 프로그램을 가지고 있으며 map과 reduce 함수의 시그너처는 다음과 같다. outputcollector는 현재의 I/출력 두 배 값을 처리하려면이 옵션을 변경해야 output.collect(newtext, new IntWritable(someintegervalue like 5)); //works ok 입니다. (결과를 얻기 위

    2

    1답변

    Google 애플리케이션 엔진에 csv, txt 또는 xml 파일과 함께 apache mahout 권장 알고리즘을 배포 할 수 있습니까? 정말 가능한 경우 어떻게 배포 할 수 있습니까?

    4

    5답변

    공통 접두사와 접미어가 증가하는 HDFS 파일 목록이 있다고합시다. 예를 들어 part-1.gz, part-2.gz, part-3.gz, ..., part-50.gz 디렉토리에 몇 개의 파일 만 남기고 싶습니다. 3 개의 파일이 필요합니다. 파일은 테스트에 사용되므로 파일 선택은 중요하지 않습니다. 다른 파일 47 개를 삭제하는 가장 빠른 방법 &은 무

    1

    2답변

    하이브를 수정하려고하므로 Eclipse에서 디버깅하려고합니다. 위키의 지침에 따라 Eclipse에서 하이브를 설정했다 (https://cwiki.apache.org/Hive/gettingstarted-eclipsesetup.html). HiveCLI.launch 템플릿을 사용하여 CLI를 시작하려고하면 Hive CLI가 표시되지만 실행 한 쿼리는 "ERRO

    1

    1답변

    돼지 라틴어는 데이터 흐름 언어라는 것을 알고 있습니다. 그런 의미에서 현재는 모든 프레임 워크에서 Pig Latin을 실행하는 것이 이론적으로 가능해야하며 Hadoop 환경에서 실행될 예정입니다. 돼지 라틴어를 다른 프레임 워크로 돌리는 것이 얼마나 힘들겠습니까? 이 경우 확장 점이 있습니까? 아니면 돼지 라틴어가 Hadoop과 밀접하게 결합되어 있습니까

    3

    2답변

    돼지 라틴에서 MAX과 같은 집계 때문에 선택하려는 레코드에서 다른 필드를 가져 오려고합니다. 문제를 설명하는 데 문제가 있으므로 여기에 예제가 나와 있습니다. 이 전 세대에서 가장 오래된 사람의 이름을 잡아하고 싶은 말은하자 A는 네 개의 열입니다 관계, B = GROUP A BY (address, zipcode); # group by the addres