1

나는 파이썬 3에서 유클리드 distance를 사용하여 LSH를 효율적으로 구현하려고한다.LSH 구현은 파이썬 3에서 유클리드 거리를 가지고 있고 LSHForest에서 모든 이웃들을 볼 수있다.

"in-python"LSHForest 구현이 있지만 코사인 거리가 사용됩니다.

또한이 구현을 사용해도 클러스터링에 LSH를 사용하는 경우와 같이 각 바구니의 내용을 볼 수있는 방법을 찾지 못했습니다. 특정 반경 내에서 특정 개수의 근사 이웃을 반환합니다. 그러나 모든 이웃을보고 싶다면 어떻게 할 수 있는지 보지 못합니다 (임의의 반경을 사용하고 싶지 않고 이걸 사용하여 매우 크거나 무한한 반경의 의미가 무엇인지 잘 모릅니다. 이행).

통찰력을 얻었습니다. 많은 감사합니다.

답변

1

소프트웨어 권장 사항은 Software Recommendations으로 문의하십시오. 이것이 어떻게 작동하는지에 대한


먼저 내 answer 한 다음 큰 K (k 소프트웨어 반환하는 이웃의 수 있어야한다) (나는 그것을 사용하지 않은) 패키지에서 요구한다고 가정 읽기 큰 반경 내에서 r. 그것은 많은 이웃을 돌려 보내야합니다. k = N을 설정하십시오. 여기서 N은 데이터 세트의 포인트 수이며 모든 이웃을 얻습니다.

특정 버킷 내에있는 모든 이웃을 보려면 버킷에 포함 할 수있는 포인트 수를 조사하고 k을 해당 수로 설정해야합니다.

+0

"그러면 양동이가 얼마나 많은 지점을 포함 할 수 있는지 조사해야합니다."- 소스 코드로 갈 필요가 있다는 것은 해당 구현이 아마 기반 기사와 다르다는 것을 의미합니다. 패키지 옵션을 사용하여이 작업을 수행 할 수있는 다른 방법이 없습니다. 어쩌면 패키지를 사용하는 사람이이 문제에 답변 할 수 있습니까? 고맙습니다. – user3861925

+0

@ user3861925 예, 구현이 정의되었습니다. 기사에서 해당 정보를 지정하면 해당 정보를 기반으로 할 수 있습니다. upvote 주셔서 감사합니다, 당신은 또한 원하는 경우 답변을 수락하실 수 있습니다. 좋은 질문 BTW! – gsamaras