nltk

    0

    1답변

    word2vec 용 python gensim 패키지를 사용하고 있습니다. tokenize 단어와 2 단어 구문에서 모델을 실행하고 싶습니다. 나는 10,000 ~ 문서가 있고 nltk Regextoknizer를 사용하여 모든 문서에서 단일 단어 토큰을 얻습니다. 문서를 어떻게 토큰 화하여 2 단어 구를 얻을 수 있습니까? 예를 들어 : 문서 : 과 2 단어

    0

    1답변

    다음 코드가 있습니다. nltk stopword list에 단어를 더 추가해야합니다. 나는 thsi를 실행 한 후에 목록에 단어를 추가하지 않습니다. from nltk.corpus import stopwords from nltk.stem.wordnet import WordNetLemmatizer import string stop = set(stopwo

    -3

    1답변

    텍스트 문서에서 피쳐 추출을 배우고 있으며 this tutorial을 찾았습니다. 나는 끝에서 세 번째 줄에있는 np.asarray(doc_counts.sum(axis=0)).ravel()이 무엇을 반환하는지 이해할 수 없었다. 나는 이것을 검사했고 그것은 숫자 목록을 반환했다. 나는 이것이 용어 - 빈도라고 생각하지만 확실하지 않습니다. 무엇을 idx:

    0

    1답변

    나는 기계 학습에 초보자입니다. 현재 내가 원하는 것은 어떤 단어가 어떤 카테고리에 속하는지 아닌지를 분류하는 것입니다. 더 구체적으로 말하면 어떤 단어를 입력 할 때 "Malayalam"이라는 언어로되어 있는지 확인해야합니다. 예 : enthayi ninakk sugamanno? 영어로 표기된 일부 말라 얄 람어입니다. 이런 식으로 약간의 정보를 입력하면

    0

    1답변

    MAC OS에서 호출하지 않습니다하지만 난 이미 다음 사진으로 파이썬에서 NLTK를 설치했는지 확인 해요 내 NLTK이 곳은 내가 무엇을해야하는지 모르는,

    1

    1답변

    나는 자연 언어 이해에 기초한 프로젝트를 진행 중이다. 그래서 현재 내가하고있는 것은 대명사를 각각의 전례에 대한 참조로 사용하는 것입니다.이 모델의 경우 모델을 작성하려고합니다. 나는 그것의 기본 부분을 다뤘지만, 그 일을 완수하기 위해, 나는 그 문장의 내러티브를 이해할 필요가있다. 그래서 내가 원하는 것은 명사와 객체가 파이썬에서 API를 사용하는 동

    2

    1답변

    을 nltk3.2.5의 nltk.parse.stanford로 설정하십시오. from nltk.parse.stanford import * # CoreNLPServer = CoreNLPServer(path_to_jar="/home/fonttian/NLP/stanford/") # dep_parser=StanfordDependencyParser(model_

    -1

    1답변

    HTML 페이지에서 모든 내용을 읽고이를 목록에 저장하고 싶습니다. 는 PLS는 파이썬 예를 들어 의 옵션을 제안 할 수 : URL : https://en.wikipedia.org/wiki/Chancellor_of_Germany이 페이지의 모든 콘텐츠를하고 목록이 저장 독일의 총리 독일 정부의 수장이다. 독일어의 공식 제목은 Bundeskanzler (in

    1

    1답변

    중국어 단어 목록이있는 경우 : like reference = [ '我', '是', '好', '人'] , 가설 = [ '我', '是', '善良 的', '人'. 중국어 번역에 nltk.translate.bleu_score.sentence_bleu (참조, 가설)을 사용할 수 있습니까? 그것은 영어와 같은가요? 일본어는 어떻습니까? 영어를 좋아하는 단어 목록

    1

    1답변

    문법에 포함되지 않은 단어 목록을 프로그램이 반환하도록 만드는 방법은 무엇입니까? 그냥 오류 메시지를 표시 import nltk # Define the cfg grammar. grammar = nltk.CFG.fromstring(""" S -> NP VP VP -> V NP NP -> det N | N