150GB 데이터 폴더가 있습니다. 그 안에 파일 내용은 모든 형식 (doc, jpg, png, txt 등)입니다. 중복 된 파일 콘텐츠가 있는지 확인하기 위해 모든 파일 콘텐츠를 서로 검사해야합니다. 그렇다면 파일 경로 이름 목록을 인쇄하십시오. 이를 위해 먼저 ArrayList<File>
을 사용하여 모든 파일을 저장 한 다음 FileUtils.contentEquals(file1, file2)
메서드를 사용했습니다. 소량의 파일 (폴더)을 시도 할 때 작동하지만이 150Gb 데이터 폴더의 경우 아무런 결과도 표시되지 않습니다. 먼저 ArrayList에 모든 파일을 저장하면 문제가 발생합니다. JVM 힙 문제, 확실하지 않습니다.Java를 사용하여 중복 파일 내용 확인
누구나이 양의 데이터를 처리하기위한 더 나은 조언과 샘플 코드가 있습니까? 도와주세요.
파일을 읽는 대신 체크섬을 계산해 보았습니까? – Prashant
FileUtils.contentEquals 메서드를 직접 사용하여 파일의 look을 확인하고 결과를 저장했습니다. – Mostafizur
@Prashant 저에게 샘플 코드를 써주시겠습니까? – Mostafizur