2012-06-18 5 views
0

자동 동의어 찾기 알고리즘 (주로 브랜드 이름 용)을 만들고 싶습니다. 예를 들어 사용자가 "Coca cola"라는 단어를 입력하면 "Coke"라는 단어를 반환하고 싶습니다.동의어 찾기 텍스트 마이닝 알고리즘

위의 내용은 위임장을 사용하여 쉽게 수행 할 수 있습니다. 그러나 나는 그것을위한 dictonary 파일을 필요로한다. 어떻게 자동으로 만들 수 있습니까? (나는 1 백만 + 레코드가있는 작은 자료집을 가지고 있으며, 동의어는이 정보에서 올 것입니다.)

이 문제에 대한 텍스트 마이닝 알고리즘이 있습니까? 또한,이에 대한 몇 가지 온라인 동의어 서비스가있다, 그러나 이들은

감사합니다, krisy :-(어떤 브랜드 이름을 포함하지

+0

비슷한 기록을 남길 수 있습니까? –

답변

0

기반 알고리즘은 동의어 또는 이와 유사한 단어를 찾을 수있는 트라이. 그것은 키하지만 위치를 사용하지 않는 것 트리에서 키를 정의하는 경우 예를 들어 A에서 B로 이동하고 B에서 C로 이동하면 트리에 대한 많은 데이터 구조가 있습니다 가장 단순한 것은 인접리스트 또는 삼항 검색 트리입니다

+0

"코카콜라"로 "코카콜라"를 찾는 것은 어떻게 시도할까요? ry 단어/철자가 틀린 단어, 그러나 나는 그들이 synonims를 위해 어떻게 사용될 수 있는지에 관해 안다 :-( – krisy

+0

문자 C에서 첫번째 매치 나무를 보여라? – Bytemain

+0

너무 많은 단어가 반환 될 우려가 있습니다 .-- ( – krisy