스탠포드 CoreNLP를 사용하여 25,000 편의 영화 리뷰의 정서 분석을 얻고 있습니다. 그러나 나는 각 문장에 대해 각 문장의 감정을 얻었지만 리뷰에있는 각 문장 대신에 어떻게 전체적인 리뷰의 감정을 얻을 수 있는지 궁금해했다. 사용하여 코드 메신저는 다음과 같습니다 import java.io.*;
import java.util.*;
import
Stanford CoreNLP를 사용할 때 xml 출력 파일에 결과가 표시됩니다. 그 안에 스피커의 이름을 가진 열이 있습니다. 예를 들어 <word>Mike</word>
<lemma>Mike</lemma>
<CharacterOffsetBegin>0</CharacterOffsetBegin>
<CharacterOffsetEn
스탠포드 NLP를 적용하는 동안 불용어 제거를 위해 아래 해결책을 사용하고 있습니다. https://github.com/jconwell/coreNlp 이 프로젝트는 내가 루씬의 latestfeatures을 활용하기 위해 5.5.2 루씬이 코드를 마이그레이션 할 필요가 루씬 (3.6.2) 의 이전 버전에 대한 종속성이 있습니다. 나는 아래의 클래스는 루씬에서
코어 -nlp에서 'SUTime'기능을 사용하려고했습니다. 내가하려고 할 때, <TIMEX3 range="(2017-02-01,2017-02-28,P1M)" tid="t1" type="DATE" value="2017-02">next month</TIMEX3>
을하지만 (: 2017년 1월 1일를 참조 날짜) 나는 'sampleInput'결과 From n
나는 다음과 같은 오류가 발생 유형 문자열에 대한 정의되지 않은 : 나는이 문제를 얻을 이유 The method get(Class) is undefined for the type String.
이해를하기 때문에 GET() 메소드는 할 수 없습니다 String에서 실행된다. 그러나 누군가가이 문제를 해결하는 방법에 대해 조언 해 줄 수 있기를 바랬습니다.
저는 Stanford POS Tagger를 Python으로 사용하려고합니다. Python NLTK pos_tag not returning the correct part-of-speech tag 다음과 같은 오류 받기 :이 Traceback (most recent call last):
File "<stdin>", line 1, in <module>
원래의 트윗은 다음과 같은 구조의 파일에 저장되어있는 스테이지 : 트윗 언어 || 트윗 다음은 URL, RT, 사용자 이름 및 영숫자가 아닌 문자를 제거하기위한 사전 처리 단계입니다. 데프 cleanTweets는() { File dirtyTweets = new File("result.txt")
File cleanTweets = new File("c
감정 분석을 위해 감정 스탠포드 NLP 라이브러리를 사용하고 있습니다. 가 지금은 문장에서 treebank을 생성 할 입력 문장 : "유효하지만 너무 미지근한 일대기를 다룬 영화" 출력 나무 은행 (2 (3 (3 유효) (2 만)) (1 (너무 미지근한) (2 biopic))) 아무에게도 어떻게 할 수 있습니까? 감사합니다.