word-count

    1

    5답변

    나는이 코드를 no로 설정했다. 단어 수. 그것은 내가 입력으로 "q w r " 입력 즉 경우, 모든 단일 문자에 대해 잘 작동, 그것은 나에게 3 개 단어를 제공하지만, 내가 입력으로 "qwe ed df "를 입력 할 때, 그것은 2 #include<stdio.h> int main() { int c=getchar(); int wor

    2

    1답변

    하둡의 단어 카운트 예제의 경우 map 함수에서 단어와 하나를 파일에 중간 결과로 쓰고 reduce를 사용하여 합계를 계산합니다. 매퍼 함수에서 해시 맵을 사용하지 않는 이유는 키가 단어이고 값이 카운트인데, 한 단어가 한 파일에서 여러 번 발생하면 단어 값이 추가됩니다. 매퍼 함수가 끝나면 결과를 출력합니다. 이러한 방식으로 결합기를 사용하기는하지만 원본

    0

    1답변

    이 Hadoop MapReduce 단어 개수 예제를 데이터 분석과 Hadoop에 입력하면 Hadoop 의사 분산 개발 환경을 설정할 수 있습니다. 이제 Word Count 예제를 실행하려고합니다. Hadoop Fundamentals에서 .java 파일, WordCount 폴더를 다운로드했습니다. 이 과정을 시작하는 책에 주어진 코드는 다음과 같습니다 hos

    1

    3답변

    https://hadoop.apache.org/docs/stable/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html#Source_Code 결합기 감속기로 모두 사용되는 예는 기능을 감소 카운트. public static class IntSumReducer extends

    0

    2답변

    나는 this guide을 따라,하지만 난 내 IDE에서 단어 수를 실행하는 경우 나는 예외를 얻을 /usr/lib/jvm/java-8-oracle/bin/java -Didea.launcher.port=7536 -Didea.launcher.bin.path=/home/marc/Programs/idea-IC-162.2032.8/bin -Dfile.encodin

    0

    1답변

    일괄 처리에서 존재하지 않는 문제의 클래스에 부딪 혔지만 스트리밍의 경우 중요하지 않은 것처럼 보였습니다. 이 스트림의 모든 단어에 대한 결과를 출력합니다 lines .flatMap(_.split("\\W+")) .map(word => (word, 1)) .keyBy(0) .sum(1) , 예를 들어 :의 고전적인 단

    2

    2답변

    a.txt이라는 파일이 100 줄 길이입니다. 이 100 개 라인의 grep rake a.txt | wc #returns 10 lines grep -v rake a.txt | wc #returns 90 lines grep Rake a.txt | wc #returns 3 lines 하나는 모두를 가지고,하지만 난 만 '레이크'와 라인을 원한다. 내

    0

    1답변

    저는 간단한 단어 수 (여러 속성을 키로 사용)를 해결하려고 Spark-scala에 익숙합니다. 입력을받을 수 있습니까? 제가 (A, B, 1) (a, C, 1) (a, C, 1) (B, B, 1) (B, B와 같은 RDD (문자열, 문자열 롱)가 1) 원하는 결과 같은 RDD은이다 (A, B, 1) (a, C, 2) (B, B, 2)

    0

    1답변

    나는 많은 방법이 counting words in a LaTeX document이고 다른 것들보다 더 정확하다는 것을 알고 있습니다. 내가 한 것은 LaTeX 문서에서 간단한 통계를 수행하는 방법입니다. 즉, 모든 단어를 그룹화하고 길이를 계산하는 대신 각 단어의 인스턴스 수를 개별적으로 계산하고 싶습니다. 1. (15% - 456) that ++++++

    0

    2답변

    텍스트 파일에서 문구 수를 얻으려고하고 있지만 지금까지는 단어 수 (아래 참조) 만 얻을 수 있습니다. 텍스트 파일에 2 단어 구문이 나타나는 횟수를 계산하려면이 논리를 확장해야합니다. 내 이해에서 NLTK의 논리를 사용하여 구문을 정의하거나 그룹화 할 수 있습니다. 컬렉션 함수가 원하는 결과를 얻는 데 필요한 함수라고 생각하지만 NLTK 문서를 읽지 않고