Word2Vec과 매우 유사한 FastText 인 https://pypi.python.org/pypi/fasttext을 가지고 놀고 있습니다. 이후 아직 많은 기능을 내장하지 않은 꽤 새로운 라이브러리 인 것 같습니다. 나는 형태학 비슷한 단어를 추출하는 방법을 궁금해했다. 예를 들면 : model.similar_word ("dog") -> dogs. 그러
저는 웹 스크랩을하고 있습니다. csv에 utf-8을 저장하고 정리 했으므로 이제는 교육 및 테스트 파일을 만들어 페이스 북을 사용할 수있게하려고합니다. 바로 지금 이다 내가 가진 그것은 나에게 오류 from sklearn.cross_validation import train_test_split
y_all = df["normalized"]
X_all
wiki (한국어)를 사용하는 사전 교육 된 '빠른 텍스트 모델'이 왜 제대로 작동하지 않는지 궁금합니다. :( 모델 = fasttext.load_model ("./ fasttext/wiki.ko.bin") model.cosine_similarity ("테스트 테스트 이건 테스트 문장", "지금 아무 관계없는 글 정말로 정말로") model.cosine_s
Java에서 Jfasttext 라이브러리를 사용하여 단어에 대한 벡터를 얻기 위해 고속 텍스트를 사용하면 오류가 발생합니다. 오류는 A fatal error has been detected by the Java Runtime Environment:
# SIGSEGV (0xb) at pc=0x00007f412c606444, pid=14379, tid=1