필자가 보유한 데이터로 내 기계 학습 모델에 대해 어떤 기능을 갖게되는지 연구 중입니다. 내 데이터에는 많은 텍스트 데이터가 포함되어 있으므로 귀중한 기능을 추출하는 방법이 궁금합니다. 이전의 신념과는 달리 이것은 종종 bag-of-words 또는 word2vec와 같은 표현으로 구성됩니다. (http://scikit-learn.org/stable/modules/feature_extraction.html#text-feature-extraction)기계 학습 모델의 기능으로 텍스트 감정을 사용 하시겠습니까?
주제에 대한 이해가 제한되어 있기 때문에 왜 텍스트를 분석 할 수 없는지 이해할 수 없습니다. 먼저 숫자 값을 가져옵니다. (예 : textBlob.sentiment = https://textblob.readthedocs.io/en/dev/, Google Clouds Natural Language = https://cloud.google.com/natural-language/)
내 컴퓨터 학습 모델의 기능으로이 값을 사용할 수 있습니까?
미리 도움을 청하십시오!
답변 해 주셔서 감사합니다. 고마워, 고마워. 나는 youtube, twitter 및 facebook에서 userdata에 기초를 둔 영화의 박스 오피스 succes를 예측하는 모델을 만들고 있습니다. 나는 그 정서가 가치있는 특징이라고 말하고 싶다. 게다가, 텍스트를 클러스터링 또한 내 경우에는 사용할 수 있습니까? – Lourens
아니요, 문제는 클러스터링이 아니라 성공을 측정하는 방법에 대한 회귀 또는 분류 작업을 기반으로합니다. 나는 정서 분석이 당신의 문제를 해결한다고 생각합니다. 왜냐하면, 사용자의 코멘트가 박스 오피스보다 영화에 대해 긍정적이라면, 그 반대도 마찬가지입니다. –