다른 알고리즘을 연구했지만 찾고있는 것을 찾지 못했습니다. Levenstein 거리 (같은 길이의 문자열 만 좋은) 해밍 거리가 내가 무엇을 찾고 있어요 것은 같은 생각에 대한 문장을 찾아 낼 것입니다 무언가이다 (새끼 고양이와 sitten 같은 유사한 단어를 찾습니다). 예를 들어 : 주제에 sentence 1 and 2하지만 하지sentence 3 or
두 바이너리 문자열의 해밍 거리는 서로 다른 비트 수임을 압니다. 2 개의 바이너리 스트링에 대해서 : 1110과 1101, 만약 내가 가장 높은 비트에서 같은 비트의 수로 그들의 유사성을 밝히고 싶다면. (이 예제에서는 왼쪽에서 오른쪽으로 두 비트가 다를 때까지 비트를 계산합니다. 결과는 2입니다.) 이러한 종류의 유사성이 정의되었거나 정식 이름입니까?
이진 벡터 (수백만 개)를 k 개의 클러스터에 클러스터하려고합니다. 초기 클러스터에 가장 가까운 이웃을 찾는 데 해밍 거리를 사용하고 있습니다 (매우 느립니다).). 나는 K- 평균 클러스터링이 실제로 여기에 맞지 않는다고 생각합니다. 문제는 중심점을 업데이트하기 위해 일부 초기 클러스터 중심에 가장 가까운 이웃 벡터 (이진 벡터)의 평균을 계산하는 데 있
은 다음 퍼즐의 Hamming distance을 계산하는 방법 : 을 지금까지 나는 다음과 같은 두 시퀀스 비교해야 이해 : 13-11-15-00-10-08-09-12-01-06-03-02-04-07-14-05
01-02-03-04-05-06-07-08-09-10-11-12-13-14-15-00
=
16
을 아니면 그렇게 쉬운가요?
Visual Studio 2010 C에서 구현 중입니다. 두 개의 바이너리 배열이 있습니다. 예를 들어, array1[100] = {1,0,1,0,0,1,1, .... }
array2[100] = {0,0,1,1,1,0,1, .... }
는 Hamming distance array1 및 array2의 xor 결과 저장 array3[100] , arra
바이너리 코드와 숫자 문자열을 사용하고 원래 문자열의 해밍 거리 내에서 모든 문자열을 출력하는 프로그램을 작성해야합니다. 모든 것을 수행하는 함수가 있지만 출력에는 목록 내에 목록이 있습니다. 이유는 무엇인지 이해합니다. 함수는 재귀 적이며 때로는 가능한 값의 목록을 반환합니다. 문제는 완전한 문자열을 출력하도록 변경하는 방법을 모르겠다는 것입니다. 예를
예 : 문자열 "asdf"와 문자열 집합 ("qwer", "aswr", "asdv")이있는 경우. "asdv"와 "asdf"가 해밍 거리 1을 가짐으로써 집합과 문자열 사이의 해밍 거리는 1이됩니다. 그것은이 def hamming_distance(string, set):
min = len(string)
for element in set:
나는 'template_phash'컬럼을 가진 테이블 A를 가지고있다. 400K 이미지에서 생성 된 phash를 저장합니다. 이제 임의의 이미지를 가져 와서 그 이미지에서 phash를 생성합니다. 지금 어떻게 내가 해밍 거리의 차이가 임계 값보다 작은 테이블 A에서 레코드를 얻을 수 있도록, 쿼리 내가 Hamming distance on binary str
내가 record no 1: 1111111111111011000100110001100100010000000000000011000000000000
record no 2: 1111111111111111111111100001100000010000000000000011000000000000
record no 3: 11100000111100001110100011