HDFS @/user/Cloudera/Test/에 일부 데이터가 있습니다. "hdfs -dfs -cat Test/"을 실행하여 레코드를 볼 수 있습니다.HDFS 파일 시스템 용 URL
이제 동일한 파일을 scala에서 RDD로 읽어야합니다. 나는 scala shell에서 다음을 시도했다.
발 파일 = sc.textFile ("HDFS : //quickstart.cloudera : 8020/사용자/클라우 데라/테스트")
은 그럼 어떤 필터를 작성하고 루프 단어를 읽을 수 있습니다. 하지만 내가 마지막으로 Println을 사용하면 파일을 찾을 수 없다고 말합니다.
누구든지이 경우 HDFS URL이 무엇인지 알 수 있습니까? 참고 : 나는 클라우 데라 CDH5.0 VM을 사용하여
'/ user/Cloudera/Test /'는 텍스트 파일입니까 ?? 그것은 마치 폴더 같아 보입니다. –