가장 가까운 기존의 문제와 같은 문자열입니다 this 또는 thisPHP 판사 내가 찾은 사람의 이름이나 다른 텍스트
나는 기준이 될 수 있습니다 무엇을 기반으로 다음 문자열을 받아 함수 나 클래스를 작성하고 싶습니다그것을 프로그래밍하면 실제 인간 이름이라는 확률이 반환됩니다. 지금은 영어 나 유럽 이름이나 다른 이름의 영문 음역으로 크게 편향되어있을 것이라고 기대합니다. (예 : "bob", "bob smith"및 "smith"는 모두 1.0을 반환하고 "sfgoisxdzzg"는 .001 또는 .0000001과 같은 값을 반환해야 함)
끝난? (다른 언어 인 경우에도) 첫 번째 생각은 스크립트를 배우는 일종의 기계를 사용해야한다는 것입니다. 내 문제는 모든 기계 학습 이론에 대한 내 완전 무지입니다.
제 질문의 두 번째 부분은 다음과 같습니다. 기계가이 문제를 해결하기위한 실행 가능한 옵션을 배우고 있습니까? 그렇다면 어떻게 시작해야합니까? 그렇지 않다면 올바른 방향으로 나를 가르 칠 수 있습니까?
첫 번째로 언급 된 질문에 대한 대답이이 답변으로 받아 들여 져야합니다. 데이터베이스를 모니터하고 유효하지 않은 이름에 대해 불량/처벌/벌칙을 발행하는 것은 귀하 자신/행정부의 책임입니다. –
관심없는 이유는 무엇입니까? – Jim
[Levenshtein] (http://php.net/manual/en/function.levenshtein.php)과 거기에서 링크 된 다른 유사한 기능을 살펴볼 수 있습니다. BCS 보울 선택과 마찬가지로, 여러 가지 테스트를 거치면서 끝낼 수 있는지 확인하십시오. 그러나 아마도 당신은 어떤 원형을 필요로 할 것입니다. –