nltk

4열

1답변

나는 셰익스피어의 NLTK 영장에서 문장 가져하려고 -this 도움말 사이트 다음 -하지만 난 문제 (A word2vec 모델을 학습하기 위해) 문장에 대한 액세스 권한을 얻는 데 : from nltk.corpus import shakespeare #XMLCorpusreader shakespeare.fileids() ['a_and_c.xml', 'dre

0열

1답변

Apache Spark에서 Stanford NER을 사용하는 방법

우리는 우리 도메인에서 엔티티 추출을 위해 Stanford NER를 사용하려고합니다. 그래서 우리는 분류자를 재교육해야합니다. 그러나 Apache Spark 환경이 있습니다. 아무도 스탠포드 NER를 스파크에서 사용하는 방법을 제안 할 수 있는지 궁금합니다. 저는 파이썬 2.7 + NLTK를 사용하고 있습니다. 모든 응답은 크게 감사하겠습니다.

3열

1답변

예상되는 문자열 또는 바이트 형 개체

이 오류와 관련하여 여러 게시물을 읽었지만 아직 해결할 수 없습니다. 내 함수를 반복하려고하면 형식 오류가 계속 발생합니다. TypeError : 예상되는 문자열 또는 바이트와 같은 개체입니다. Traceback (most recent call last): File "C:/Users/xxxxx/PycharmProjects/tronc/tronc2.p

2열

1답변

NLTK를 사용한 빠른 명명 된 엔티티 제거

필자는 파이썬에서 텍스트 문장/단락 목록에서 명명 된 엔티티 (NLTK 사용)를 제거하는 몇 가지 사용자 정의 함수를 작성했습니다. 내가 가지고있는 문제는 나의 방법이 매우 느리다는 것이다. 특히 많은 양의 데이터에 대해. 누구든지 더 빨리 달릴 수 있도록 최적화하는 방법에 대한 제안이 있습니까? import nltk import string # Fu

1열

1답변

느린 POS 태깅 속도를 높이려면 어떻게해야합니까? 내가 POS 태그를 가속화에 대한 몇 가지 질문이 알고 있기 때문에 다른 유래 페이지로 저를 리디렉션하기 전에

, 나는 이미 통해 찾아 여기에서 제안을 내 코드 가속화했습니다 Slow performance of POS tagging. Can I do some kind of pre-warming? 내가 파이썬을 사용하고 있습니다를 3.6. nltk를 사용하여 토큰 화 된 ~ 100,000 단어를 포함하는 목록이 있습니다. 이것들은 꽤 큰 목록입니다. 그래서 나는이 모

0열

1답변

승리 7에 NLTK 설치 중 오류가 발생했습니다.

Windows 7 컴퓨터에 NLTK를 설치하려고합니다. Python version -32 required, which was not found in the registry 나는 다음과 같은 작업을 수행 한 : 나는 파이썬 32 비트 버전 3.6.1을 설치 한 나는 다음과 같은 오류 메시지가 무엇입니까. 다른 컴퓨터에 아나콘다를 설치했습니다. this t

0열

1답변

목록에서 파이썬을 사용하여 단어 "Exm", "potential", this, "are"등을 분류/제거 할 수 있습니까

현재 자연 언어 처리 및 텍스트 마이닝과 관련된 프로젝트를 진행 중입니다. 텍스트 파일의 고유 단어 빈도를 계산하는 코드를 적어 둡니다. Frequencey of: trypanosomiasis --> 0.0029 Frequencey of: deadly --> 0.0029 Frequencey of: yellow --> 0.0029 Frequencey o

0열

1답변

왜 출력물에 목록이 인쇄되지 않습니까?

파이썬에서 nltk 라이브러리를 사용하고 있습니다. 제 배경은 자바입니다. 필자가 작성한 코드의 콘솔 출력을 이해하지 못합니다. 변수를 초기화 할 때 파이썬이 이상한 형식을 반환하는 이유는 무엇입니까? tokens을 목록으로 사용합니다. from nltk.tokenize import word_tokenize from nltk.corpus import st

0열

1답변

의미로 단어를 정규화하십시오.

저는 문장 분석을하고 있습니다. 문장을 이해하고 키 값 쌍에 대한 정보를 해독합니다. 예를 들어 { "product" : "milk" , "money": "200 usd" } { "product" : "chair" , "cost": "200 usd" } { "product" : "chair" , "price": "200 usd" } 지금이 JSO

2열

1답변

유용한 기능이 키릴 문자를 반환하지 않습니다

저는 지금 Python 3.6을 전환했습니다. 그러나 유익한 기능을 실행하면 필자의 기능 추출기에서 러시아어를 인쇄하려고 할 때 멍청하게 끝납니다. 나는 тир이 잘 인쇄 얻을 수있는 특징 추출기 자체 def POS_features(word): return{'three_last_letters':word[-3:]} print(POS_features