프로그래밍 방식으로 단어의 동음어를 생성하고 싶습니다. 원래 단어와 비슷한 소리를 의미합니다.하위 문자열 수준에서 동음 이의를 생성하는 방법은 무엇입니까?
Soundex 알고리즘이 있지만 일부 문자가 다른 문자 (d 대신 t와 유사 함)로 바뀝니다. 좀 더 정교한 목록이나 알고리즘이 있습니까? 적어도 동음 전화 하위 문자열을 의미합니까?
사전에없는 단어에 적용하고 싶다는 뜻은 전체적이고 실제적인 단어에 의존 할 수 없다는 것을 의미합니다.
편집 :
입력 종종 진짜 (동음) 사전에 따라서 라는 이름의 실체이 있으며, 문자열입니다. 예를 들어 Google 또는 mcdonald의 일 수 있습니다. 이름이 알려진 두 개의 엔티티 이름을 지정하기도하지만 그 중 다수는 인기가 없습니다.
출력은이 문자열의 (임의의) 동음입니다. 단어에는 종종 하나 이상의 동음 이의어가 있기 때문에 하나의 (무작위) 하나의 것이 나의 목표입니다. 구글의 경우에 동음이 각각 gugel, 수 맥도날드의맥도날드의합니다.
는 코드, 입력 및 원하는 출력을 공유합니다. – skrubber