lexicon

5열

1답변

나는 간단한 러시아어 - 영어 단어 corpus를 찾고있다. 첫 번째 열에는 러시아 단어가 나열되고 두 번째 열에는 동등한 영어 단어가 나열된 csv처럼 간단 할 수 있습니다. 내가 그런 것을 찾을 수있는 어떤 아이디어? NLTK 툴킷에는 다음과 같은 것이 있습니까? 감사

3열

1답변

English 검색어 수정 사전에 대한 답변

"Spelling correction as an iterative process that exploits the collective knowledge of web users"에 설명 된 방법을 구현하여 검색 엔진 검색어에 대한 맞춤법 교정기를 구축하고 있습니다. 높은 수준의 접근 방식은 다음과 같습니다. 주어진 쿼리에 대해 각 unigram 및 bigram

1열

3답변

영어 텍스트 어휘 비교

통계표를 만들 수 있습니다. 일부 영어 텍스트 또는 책에서 각 단어가 얼마나 많이 사용되는지 상상해보십시오. 도서관의 각 텍스트/도서에 대한 통계를 수집 할 수 있습니다. 이 통계를 서로 비교하는 가장 간단한 방법은 무엇입니까? 매우 통계적으로 유사한 어휘집을 가진 텍스트의 집단/집단을 어떻게 찾을 수 있습니까?