tokenize

0열

1답변

수 난 단지 자바 분할 방법 예를 이용하여 "2 이상의 공백"으로 문자열을 분할하는 방법 : "cat dog horse elephant" 가로 갈라됩니다 : cat dog horse elephant 감사합니다.

0열

1답변

난 식처럼 가지고 다음과는 eg 1: (f1 AND f2) eg 2: ((f1 OR f2) AND f3) eg 3: ((f1 OR f2) AND (f3 OR (f4 AND f5))) F 각 (N) SQL의 단편을 생성하기 위해 사용되며, 각각의 조각은 OR 사용하여 접합 및/발현에 대하여 설명한다. 1)이 발현 2) 3) 표현에 대해 "표현의 나

-1열

1답변

나는 파이썬 오류 builtins.ImportError이 없다 : 나는 스크립트의 시작 부분에 다음과 같은 쓴 없음 모듈 이름 'nltk.tokenize'

그러나 from nltk.tokenize import sword_tokenize 을, 나는 다음과 같은 오류 얻을 : builtins.ImportError: No module named 'nltk.tokenize' 을 이 문제의 해결책은 무엇입니까?

0열

2답변

파이썬 : 파일에서 토큰을 만드는 방법?

저는 파이썬에서 초보자입니다. 파일에서 트위터 데이터를 토큰 화하는 방법을 알고 싶습니다. 내 코드는 다음과 같습니다 with codecs.open('example.csv', 'r',"utf-8") as f: for line in f: tweet = f.readlines() tokens = word_tokenize(tweet[

0열

1답변

탄성 검색 : 특수 문자가 작동하지 않는 용어 검색

Elasticsearch 최신 버전 5.6.4를 사용 중입니다. 특수 문자를 색인화하고 필드 title.special을 검색하려고합니다. PUT index1 { "mappings": { "isContainer:false": { "properties": { "connectorSpecific": {

0열

1답변

Solr 6.1 PatternTokenizerFactory 토크 나이저 사용 방법 번호 받기

텍스트를 분석하고 번호를 알아야합니다. 1.e.g. "acbt-10.2"=> 10.2 2.e.g. "acbt - 10.2"=> 10.2 3.e.g. "acbt"=> 0 이 기능의 PatternTokenizerFactory 토크 나이저에 패턴 및 그룹을 설정하는 방법은 무엇입니까?

1열

1답변

Spacy tokenizer, 토크 나이저 예외 추가

안녕하세요! spacy 2.02를 사용하여 일부 토큰을 토큰 화하는 데 예외를 추가하려고합니다. .tokenizer.add_special_case() 일부 경우에는 사용하지만 예를 들어 US $ 100과 같은 토큰, 두 토큰에서 spacy가 사용되는 경우 ('US $', 'SYM'), ('100', 'NUM') 하지만 대신 각 숫자 이후에 대한 특별한 경우

0열

2답변

마무리 파일 클래스

lineNumber를 변수로 해석 할 수 없다는 오류가 계속 나타 납니까? 이 문제를 정확하게 해결하는 방법을 잘 모르겠습니다. 내가 이걸로 도움이되는 특정 파일을 자바로 가져 오지 않았습니까? 또한 공백없이 공백없이 문자의 수를 어떻게 계산합니까? 또한 고유 한 단어를 계산하는 방법이 필요하지만 고유 한 단어가 무엇인지 잘 모르겠습니다. import ja

0열

1답변

Python .words 문제가 있습니까?

그래, 그 paulryan.txt 파일의 각 라인이 얼마나 긍정적인지 음수인지를 알려주는 프로그램을 만들려고합니다. opinion_lexicon을 사용하고 있는데 파일이 '_io.TextIOWrapper'입니다. .words 대신 사용할 수있는 것이 있습니까? 기타 덜 중요한 문제 : 줄 단위로 토큰을 유지하면서 내 전체 paulryan.txt 파일을 소문

0열

2답변

NLTK에서 스탠포드 워드 토크 나이저를 사용하는 방법은 무엇입니까?

스탠포드 워드 토크 나이저를 nltk에서 사용하는 방법을 찾고 있습니다. 스탠포드와 nltk 워드 토크 나이저의 결과를 비교할 때 둘 다 다르므로 사용하고 싶습니다. 스탠포드 토크 나이저를 사용할 방법이 있다는 것을 알고 있습니다. 스탠포드 POS 태거 (POS Tagger)와 NLTK의 NER처럼 말입니다. 서버를 실행하지 않고 스탠포드 토크 나이저를 사