두 문자열을 사용하여 두 텍스트 간의 관계를 보여주는 코사인 유사성 값을 제공하는 함수가 있습니다.텍스트 비교 속도 향상 (희소 행렬 사용)
75 개의 텍스트를 서로 비교하려면 모든 텍스트가 서로 비교되도록 5,625 개의 단일 비교를 수행해야합니다.
이 비교 수를 줄일 수있는 방법이 있습니까? 예를 들어 스파 스 행렬 또는 k-means?
나는 내 기능이나 텍스트를 비교하는 방법에 대해 이야기하고 싶지 않습니다. 단지 비교 횟수를 줄이는 것입니다.
예, 비슷한 문자열을 찾고 싶습니다. Ben의 대답에 대한 자세한 내용은 내 의견에 나와 있습니다. 내 데이터베이스 (MySQL의) 이러한 공간 유형을 가지고있는 것 : http://dev.mysql.com/doc/refman/5.0/en/mysql-spatial-datatypes.html Theres는 quadtree에 대해 아무것도!? – caw
많은 종류의 공간 인덱스가 사용자에게 도움이 될 수 있습니다. MySQL에서 사용 가능한 형식에 대해 읽어보십시오. –
나는이 공간적 특징에 대해 많이 읽었습니다. 내 질문에 단락을 추가했습니다. 좀 더 도와 줄 수 있어요? – caw