HTML5 파일 API를 사용하여 파일 업 로더를 제작하고 있습니다. 중복 된 파일이 포함 된 실제 데이터를 기반으로 업로드되지 않도록하고 싶습니다. 즉, 이름이 다르거 나 다른 폴더에있는 경우에도 두 개의 파일을 동일하게 간주해야합니다.HTML5 파일 API로 업로드하기 전에 파일을 고유하게 식별합니다.
나는 md5로 해시를 계산하는 것을 고려해 왔지만,이 모든 것이 클라이언트 측에서 자바 스크립트와 함께 발생해야하기 때문에 더 큰 파일은 너무 오래 걸릴 것이다. 내가 큰 말을 할 때, 최대 5GB의 비디오를 의미합니다.
그냥 체크섬을 사용할 필요가 없습니다. 파일을 고유하게 식별하려고합니다. 해싱은이 목적을 위해 잔인 함을 느낄 수도 있지만 마음에 드는 것은 처음이었습니다.
업데이트 : 가벼운 fingerprint 알고리즘이 필요합니다. 위키 피 디아에서 예제로 Rabin을 발견했지만 자바 스크립트에서 이것을 구현하는 방법을 모릅니다.
좋은 질문이지만, 해시가 마음에 오는 유일한 것입니다. 각 바이트를 확인하지 않고 파일이 고유한지 확인할 수 없으므로 궁극적으로 전체 파일을 통과 할 수 없습니다. – JJJ