hadoop

    2

    1답변

    카운터 데이터를 프로그래밍 방식으로 사용하고 싶습니다. 이것이 가능합니까? 데이터를 HDFS에 저장할 수 있습니다.

    0

    1답변

    내가 PigLatin에 들어가기 시작 했어 나는 질문이 ... 오른쪽 지금은 단어 계산의 고전적인 예와 함께 일하고 있어요 내가 여러 전자 책을 처리 그리고 나는 단어의 목록과 각 단어가 나타나는 횟수를 얻는다. 그 데이터를 돼지의 입력 데이터로 사용하여 각 단어가 나타나는 횟수로 정렬하고 가장 일반적인 단어 5 개를 구합니다. 지금까지는 그렇게 좋았지 만

    5

    2답변

    Hadoop의지도 축소 프로그램에서 HDFS로 PDF 파일을 구문 분석해야합니다. 그래서 입력을으로 나누어 HDFS에서 PDF 파일을 얻습니다.이 파일은 구문 분석되어 매퍼 클래스로 보내야합니다. 이 InputFormat을 구현하기 위해 나는 link을 통과했다. 이러한 입력 분할은 어떻게 파싱되어 텍스트 형식으로 변환 될 수 있습니까?

    1

    2답변

    map-reduce 작업을 실행하는 데 oozie를 사용하고 있습니다. 나는 날짜에 따라 출력 파일을 만들고 싶다. oozie 특성 파일 여기 /user/skataria/geooutput/$(date +"%m%d%Y%H%M%S") 됩니다 : :하지만 문자열로 날짜를 취하고 대신 값으로 날짜를 복용 인쇄를 끝 nameNode=hdfs://localhost

    2

    2답변

    Jersey 1.12와 Hadoop 1.0.0 JAR 파일 (hadoop-core-1.0.0.jar)을 사용하는 작은 Java 웹 응용 프로그램이 있습니다. 내 보스 5.0 서버에 내 응용 프로그램을 배포 할 때, 로그 파일은 다음과 같은 오류 기록 : SEVERE: Conflicting URI templates. The URI template/for ro

    1

    1답변

    Mahout을 사용하여 kmeans 클러스터링 작업을하고 있습니다. 그러나 Mahout의 kmeans가 CSV 파일을 지원하지 않는 것 같습니다. 그런 다음 특정 시퀀스 파일 생성기를 작성하려고합니다. 이상한 것은 내가 org.apache.mahout.math.VectorWritable 클래스를 사용하는 것을 시도하고 있다는 것입니다,하지만이 클래스가 조련

    0

    2답변

    ElephantBird와 Pig를 사용하여 JSON 파일을 읽을 수 없습니다. 내가 실수를하고있는 곳을 알고 싶다. 데이터 : { "nrcpts": "1", "src": "[email protected]", "sendmailid": "p6D0r0u1006229", "relay": "app03.example.com", "c

    0

    1답변

    저는 centos linux에 (localhost 대신) 일부 IP 주소로 실행되도록 hadoop 단일 인스턴스 클러스터를 구성했습니다. 예제 mapreduce 작업을 올바르게 실행할 수있었습니다. 그건 내가 hadoop 설정 괜찮을 것으로 나타납니다. 나는 또한 "/ 데이터"폴더에서 하둡, 데이타베이스에 데이터 파일의 몇 가지를 CH3OH 내가 PDI/주

    1

    1답변

    Hashop을 사용하여 변환 된 유효한 데이터를 HBase에 출력하고 외부 인덱스를 MySQL에 출력해야하는 Hadoop에서 ETL 작업을 실행하고 있습니다. 필자의 초기 생각은 MultipleOutputFormats를 사용하여 변형 된 데이터를 HFileOutputFormat (키는 텍스트이고 값은 ProtobufWritable 임) 및 TextOutpu

    0

    1답변

    Hadoop에서 데모 애플리케이션을 개발 중이며 입력 내용은 .mrc 이미지 파일입니다. 내가 그들을 hadoop에로드하고 그들을 통해 일부 이미지 처리를하고 싶습니다. 메타 데이터가있는 큰 머리글과 일련의 이미지 데이터가 포함 된 이진 파일입니다. 이미지를 읽는 방법에 대한 정보는 헤더에도 포함됩니다 (예 : number_of_images, number_