1

나는 사용자가 이미지를 업로드 할 수있는 Flask (Python)를 사용하는 서버를 운영 중이다. (결국 이미지는 S3 버킷으로 보내지지만 현재는 디스크에 저장됩니다.) 그러나 중복되거나 유사한 이미지를 방지하려고합니다.많은 이미지를 내용으로 비교하기

이것은 사용자가 이미지를 업로드하려고 할 때마다 tineye과 비슷한 방식으로 데이터베이스를 검색해야한다는 것을 의미합니다. 유사한 결과가있는 경우 앱에서 이미지를 업로드하지 않습니다. 파이썬 이미징 라이브러리만으로도 "역 이미지 검색"이 가능합니까? 유사한 작업을 수행하는 데 사용 된 다른 파이썬 프레임 워크가 있습니까? 아마존 도구일까요?

+0

중복이 쉽고, md5 합계를 저장하고 검색 할 수 있지만 "유사"하는 것이 훨씬 어렵습니다. – jordanm

+0

여기에 매우 유용한 답변이있는 것처럼 보이지만 ... "앱이 이미지를 업로드하지 않습니다"*라고 고정되어 있지 않습니다. * 규모에 따라, 그리고 동기에 따라 -있을 수 있습니다. 앞으로 나아가서 업로드를 허용하고 백그라운드에서 중복을 감지/처리하는 것이 더 적절합니다. 새로운 이미지가 예를 들어 이미 가지고있는 이미지보다 높은 화질을 갖는다면 어떨까요? 합법적 인 99.999 %의 업로드 속도를 늦추고 싶지는 않지만 중복 제거가 필요한 이유에 따라 크게 달라집니다. 저장 비용이 저렴합니다. –

답변

4

이미지 라이브러리를 사용하면 독특한 이미지의 지문을 만들 수 있습니다. 새 이미지가 나타나면 지문을 확인하고 적절히 결정하십시오. 당신이 이 autoencoder를 찾아보십시오, 여기에 인공 지능을 가지고 싶다면 지문에 대한

https://realpython.com/blog/python/fingerprinting-images-for-near-duplicate-detection/

를 참조하십시오.

+0

지문을 어떻게 만드나요? 같은 이미지 크기가 조정 된 것과 같은 "비슷한"이미지의 지문이 동일합니까? – jordanm

+0

참조 https://realpython.com/blog/python/fingerprinting-images-for-near-duplicate-detection/ – bigbounty