2014-12-23 3 views
0

C# 코드를 사용하여 Hadoop 분산 파일 시스템 파일을 시퀀스 파일로 쓰는 옵션이 있습니까? 그렇다면 나에게 링크 또는 다른 세부 사항을 제안 할 수 있습니다hadoop의 시퀀스 파일 포맷

답변

0

저는 하둡 작업에 C#을 사용하지 않았지만 우리는 이것을 할 수 있습니다.

Configuration conf = new Configuration(); 
    Job job = new Job(conf); 
    job.setOutputFormatClass(SequenceFileOutputFormat.class); 

이 JAVA

에서

는 SequenceFile를 작성합니다. 마찬가지로 C#으로 업데이트]이

HadoopJobConfiguration myConfig = new HadoopJobConfiguration(); 

      myConfig.InputPath = "/demo/simple/in"; 

      myConfig.OutputFolder = "/demo/simple/out"; 

처럼이 있어야한다 :

HadoopJobConfiguration myConfig = new HadoopJobConfiguration(); 

       myConfig.InputPath = "/demo/simple/in"; 

       myConfig.OutputFolder = "/demo/simple/out"; 
       myConfig.outputformat = // Your needed o/p format 

희망이 당신에게

+0

통해 UR 답장을 유 감사 아이디어를 줄 것이다 ... 내가 그 코드가 있습니까. 하지만 난 우리가 C#에서 할 수 있는지 알고 싶어요 # – user3797438

+0

당신은 C#에서 그것을 확인 했습니까? 그때 당신은 무엇을 그렇게 시도 했습니까? – Backtrack

+0

Environment.SetEnvironmentVariable ("HADOOP_HOME", @ "C : \ Hadoop"); Environment.SetEnvironmentVariable ("JAVA_HOME", @ "C : \ Java \ jdk1.7.0_51"); var config = new HadoopJobConfiguration(); config.InputPath = "/sample.docx"; config.OutputFolder = "/ Count"; 작업 작업 = 새 작업 (구성); job.setOutputFormatClass (SequenceFileOutputFormat.class); 이것은 내 코드이며 Job을 해결할 수 없다는 것을 보여줍니다 ... 일부 dll이 누락되었음을 알고 있지만 그 위치를 알 수는 없습니다. – user3797438