2
나는 hadoop에 새로 왔습니다. 나는 단어 수로 끝내었고 지금 나는 수정을하고 싶다.hadoop 단어 수와 최대 발생 단어를 얻으십시오.
텍스트 파일에서 가장 많이 발생한 단어를 가져오고 싶습니다.
a 1
b 4
c 2
I 출력을 나에게 여기 만
b 4
내 감속기 기능 ::
public static class Reduce extends Reducer<Text, IntWritable, Text, IntWritable>
{
int max_sum=0;
Text max_occured_key;
public void reduce(Text key, Iterable<IntWritable> values, Context context)
throws IOException, InterruptedException
{
int sum = 0;
for (IntWritable val : values)
{
sum += val.get();
}
if(sum > max_sum)
{
max_sum = sum;
max_occured_key = key;
}
context.write(max_occured_key, new IntWritable(max_sum));
//context.write(key, new IntWritable(sum));
}
}
을 줄 것이다 프로그램을 쓰고 싶은 : 일반 워드 카운트 프로그램은 출력을 제공하는 경우하지만 올바른 출력을 제공하지 않습니다. 누구든지 plz를 도울 수 있습니까?
덕분에 많은라고하지만 질문이됩니다.. 당신이 당신의 3 점을 exaplin 주실 래요을 ... 내가 을 그 얻을 건설시 max_occured_key를 초기화하지 않았다 선언 의미 WordC 클래스의 공용 변수로 이모? – Ronin
예를 들어 주시겠습니까 ?? – Ronin
예제와 조금 더 설명이 추가되었습니다. 더 자세히 설명 할 것이 필요하면 알려주세요 –