nltk

    4

    1답변

    나는 셰익스피어의 NLTK 영장에서 문장 가져하려고 -this 도움말 사이트 다음 -하지만 난 문제 (A word2vec 모델을 학습하기 위해) 문장에 대한 액세스 권한을 얻는 데 : from nltk.corpus import shakespeare #XMLCorpusreader shakespeare.fileids() ['a_and_c.xml', 'dre

    0

    1답변

    우리는 우리 도메인에서 엔티티 추출을 위해 Stanford NER를 사용하려고합니다. 그래서 우리는 분류자를 재교육해야합니다. 그러나 Apache Spark 환경이 있습니다. 아무도 스탠포드 NER를 스파크에서 사용하는 방법을 제안 할 수 있는지 궁금합니다. 저는 파이썬 2.7 + NLTK를 사용하고 있습니다. 모든 응답은 크게 감사하겠습니다.

    3

    1답변

    이 오류와 관련하여 여러 게시물을 읽었지만 아직 해결할 수 없습니다. 내 함수를 반복하려고하면 형식 오류가 계속 발생합니다. TypeError : 예상되는 문자열 또는 바이트와 같은 개체입니다. Traceback (most recent call last): File "C:/Users/xxxxx/PycharmProjects/tronc/tronc2.p

    2

    1답변

    필자는 파이썬에서 텍스트 문장/단락 목록에서 명명 된 엔티티 (NLTK 사용)를 제거하는 몇 가지 사용자 정의 함수를 작성했습니다. 내가 가지고있는 문제는 나의 방법이 매우 느리다는 것이다. 특히 많은 양의 데이터에 대해. 누구든지 더 빨리 달릴 수 있도록 최적화하는 방법에 대한 제안이 있습니까? import nltk import string # Fu

    1

    1답변

    , 나는 이미 통해 찾아 여기에서 제안을 내 코드 가속화했습니다 Slow performance of POS tagging. Can I do some kind of pre-warming? 내가 파이썬을 사용하고 있습니다를 3.6. nltk를 사용하여 토큰 화 된 ~ 100,000 단어를 포함하는 목록이 있습니다. 이것들은 꽤 큰 목록입니다. 그래서 나는이 모

    0

    1답변

    Windows 7 컴퓨터에 NLTK를 설치하려고합니다. Python version -32 required, which was not found in the registry 나는 다음과 같은 작업을 수행 한 : 나는 파이썬 32 비트 버전 3.6.1을 설치 한 나는 다음과 같은 오류 메시지가 무엇입니까. 다른 컴퓨터에 아나콘다를 설치했습니다. this t

    0

    1답변

    현재 자연 언어 처리 및 텍스트 마이닝과 관련된 프로젝트를 진행 중입니다. 텍스트 파일의 고유 단어 빈도를 계산하는 코드를 적어 둡니다. Frequencey of: trypanosomiasis --> 0.0029 Frequencey of: deadly --> 0.0029 Frequencey of: yellow --> 0.0029 Frequencey o

    0

    1답변

    파이썬에서 nltk 라이브러리를 사용하고 있습니다. 제 배경은 자바입니다. 필자가 작성한 코드의 콘솔 출력을 이해하지 못합니다. 변수를 초기화 할 때 파이썬이 이상한 형식을 반환하는 이유는 무엇입니까? tokens을 목록으로 사용합니다. from nltk.tokenize import word_tokenize from nltk.corpus import st

    0

    1답변

    저는 문장 분석을하고 있습니다. 문장을 이해하고 키 값 쌍에 대한 정보를 해독합니다. 예를 들어 { "product" : "milk" , "money": "200 usd" } { "product" : "chair" , "cost": "200 usd" } { "product" : "chair" , "price": "200 usd" } 지금이 JSO

    2

    1답변

    저는 지금 Python 3.6을 전환했습니다. 그러나 유익한 기능을 실행하면 필자의 기능 추출기에서 러시아어를 인쇄하려고 할 때 멍청하게 끝납니다. 나는 тир이 잘 인쇄 얻을 수있는 특징 추출기 자체 def POS_features(word): return{'three_last_letters':word[-3:]} print(POS_features