lexicon

    5

    1답변

    나는 간단한 러시아어 - 영어 단어 corpus를 찾고있다. 첫 번째 열에는 러시아 단어가 나열되고 두 번째 열에는 동등한 영어 단어가 나열된 csv처럼 간단 할 수 있습니다. 내가 그런 것을 찾을 수있는 어떤 아이디어? NLTK 툴킷에는 다음과 같은 것이 있습니까? 감사

    3

    1답변

    "Spelling correction as an iterative process that exploits the collective knowledge of web users"에 설명 된 방법을 구현하여 검색 엔진 검색어에 대한 맞춤법 교정기를 구축하고 있습니다. 높은 수준의 접근 방식은 다음과 같습니다. 주어진 쿼리에 대해 각 unigram 및 bigram

    1

    3답변

    통계표를 만들 수 있습니다. 일부 영어 텍스트 또는 책에서 각 단어가 얼마나 많이 사용되는지 상상해보십시오. 도서관의 각 텍스트/도서에 대한 통계를 수집 할 수 있습니다. 이 통계를 서로 비교하는 가장 간단한 방법은 무엇입니까? 매우 통계적으로 유사한 어휘집을 가진 텍스트의 집단/집단을 어떻게 찾을 수 있습니까?