Google이 검색 창에 잘못 입력 했더라도 정확한 단어를 찾는 방법이 궁금합니다. 나는 그러한 오픈 소스 알고리즘을 사용할 수 있는지 알고 싶습니까?맞춤법이 틀린 검색 키워드에 대한 Google 검색 알고리즘
답변
위키 백과 항목을 Levenshtein distance에서 읽는 것은 맞춤법 오류를 감지하는 방법에 대한 더 나은 아이디어를 제공합니다.
+1 - Levenshtein 거리 FTW! –
저는 Levenshtein 거리를 원래의 단어의 길이로 나눈 값을 과거의 타이핑 정확도의 근본적인 척도로 사용했습니다. –
구글이하는 일과 비슷한 (의심 할 여지없이 구글처럼 현명하지는 않지만) 비슷한 것을 구현하는이 수호자의 Python Implementation을 살펴보십시오.
+1 - 1 초가 더 빠르기 때문에) –
Peter Norvig의 How to Write a Spelling Corrector 문서를 확인하십시오.
+1 - 1 초 전에 똑같은 링크를 올리려고 조용히 나 자신에게 즐거웠지만! –
자바를 사용하는 경우 원래 기능이 개선 된 Compass's support of the "Did you mean feature"과 this blogpost을 확인하십시오.
사실 Google은 다른 알고리즘을 사용합니다. How does the Google "Did you mean?" Algorithm work?
내가 poeple을 검색하면 실수를하고 사람들을 검색 할 것입니다. Google은 이러한 추세를 추적하고 많은 사람들이 일반적으로 비슷한 단어를 찾는 단어를 검색하면 첫 번째 검색에서이 단어를 제안합니다.
가능한 복제본 : http://stackoverflow.com/questions/307291/how-does-the-google-did-you-mean-algorithm-work – jamesaharvey
Google은 실수로 잘못된 단어를 검색 한 사용자에 대한 정보를 실제로 수집합니다. 그들이 찾은 것을 찾아서 그 단어를 바로 잡습니다. 그들은 단순히 톤과 톤의 데이터로 문제를 해결합니다. 따라서 100 명의 사람들이 "searech"를 잘못 입력하고 아무 것도 찾지 않고 "검색"을 입력하면 Google은 "검색"이 "searech"의 철자법 일 가능성이 높다는 것을 알고 있습니다. –
@vipin k., @Damien - 그 소위 deliberete의 missspellling 이었습니까? –