나는 사용자가 이미지를 업로드 할 수있는 Flask (Python)를 사용하는 서버를 운영 중이다. (결국 이미지는 S3 버킷으로 보내지지만 현재는 디스크에 저장됩니다.) 그러나 중복되거나 유사한 이미지를 방지하려고합니다.많은 이미지를 내용으로 비교하기
이것은 사용자가 이미지를 업로드하려고 할 때마다 tineye과 비슷한 방식으로 데이터베이스를 검색해야한다는 것을 의미합니다. 유사한 결과가있는 경우 앱에서 이미지를 업로드하지 않습니다. 파이썬 이미징 라이브러리만으로도 "역 이미지 검색"이 가능합니까? 유사한 작업을 수행하는 데 사용 된 다른 파이썬 프레임 워크가 있습니까? 아마존 도구일까요?
중복이 쉽고, md5 합계를 저장하고 검색 할 수 있지만 "유사"하는 것이 훨씬 어렵습니다. – jordanm
여기에 매우 유용한 답변이있는 것처럼 보이지만 ... "앱이 이미지를 업로드하지 않습니다"*라고 고정되어 있지 않습니다. * 규모에 따라, 그리고 동기에 따라 -있을 수 있습니다. 앞으로 나아가서 업로드를 허용하고 백그라운드에서 중복을 감지/처리하는 것이 더 적절합니다. 새로운 이미지가 예를 들어 이미 가지고있는 이미지보다 높은 화질을 갖는다면 어떨까요? 합법적 인 99.999 %의 업로드 속도를 늦추고 싶지는 않지만 중복 제거가 필요한 이유에 따라 크게 달라집니다. 저장 비용이 저렴합니다. –