내 목표는 감정적 인 콘텐츠를위한 일부 코퍼스 (지금은 트위터)를 분석하는 것입니다. 오늘 나는 감정적 인 단어 줄기의 철저한 목록을 갖는 것과는 대조적으로 단어 줄기를 검색하는 것이 약간의 의미가 있다는 것을 깨달았다. 그래서 저는 네 가지 형태의 줄기가 있다는 것을 깨닫기 위해서만 nltk.stem을 탐구했습니다. 나는 LancasterStemmer,
내 질문을 읽어 주셔서 감사합니다 :) 이것은 대단한 사람들로 가득 찬 매우 달콤한 장소입니다! "단어로 문장 만들기"에 대한 질문이 있습니다. NO NO 그것은 내가 "person apple apple person person a eat person will apple eat hungry apple hungry"
같은 단어의 가방이있는 경우 가, 설명
저는 텍스트 파서의 아키텍처를 설계하고 있습니다. 예문 : Content here, content here. 전체 문장은 ... 명백한 문장입니다. The, quick 등은 단어입니다. , 및 .은 문장 부호입니다. 그러나 일반적으로 단어와 구두점은 모두 무엇입니까? 그들은 단지 상징일까요? 나는 하나의 문장이 가장 합리적인 추상적 인 방법으로 구성되는 것
언어학 과정에서 숨김 변수가 품사 인 숨겨진 마코프 모델을 사용하여 부분 음성 (POS) 태그를 구현했습니다. 우리는 태그가있는 일부 데이터에 대해 시스템을 교육 한 다음이를 테스트하고 결과를 금 데이터와 비교했습니다. 태그가 지정된 교육 세트없이 HMM을 학습 할 수 있었습니까?
나는 "어휘 인코딩"이라는 단어를 사용하여 더 나은 언어를 찾지 못했습니다. Word는 틀림없이 Letter와는 달리 의사 소통의 기본 단위입니다. 유니 코드는 알려진 모든 알파벳의 각 문자에 숫자 값을 할당하려고합니다. 한 언어에 대한 편지는 무엇인가, 다른 언어에 대한 문양입니다. 유니 코드 5.1은 현재이 글리프에 100,000 개 이상의 값을 할당합