text-classification

    0

    2답변

    다음 문제로 격려했습니다. 많은 텍스트 문서를 분류하려고합니다. 20 개의 클래스가 있습니다 : 1 정상, 19 비정상. Naïve bayes 분류를 사용하면 다음과 같은 결과가 나옵니다. 분류는 19 개의 클래스에서 잘 작동하지만 "보통"클래스의 경우 많은 잘못된 분류 오류가 있습니다. "정상"범주의 거의 모든 사례가 다른 (비정상적인) 범주로 분류되었습

    0

    1답변

    데이터베이스에 포함 된 트위터 설명에 tokenize를 적용하고 스톱 워드 필터를 적용하고 프로세스 문서에는 아무런 영향이 없습니다. 내가 도대체 ​​뭘 잘못하고있는 겁니까? 내 목표는 이러한 필터를 적용하는 것이지만 단일 단어 벡터 대신 행에 주석을 유지하는 것입니다. <?xml version="1.0" encoding="UTF-8" standalone=

    0

    1답변

    다양한 전자 메일 서비스 공급자가 구현 한 스팸 필터링 기술에 대해 배우고 있습니다. 정확하게 이것은 분류 문제로 취급되며 베이지안 (Bayesian), SVM (Support Vector Machines), KNN 등과 같은 다양한 기술을 사용하여 분류 모델을 생성합니다. 나는 이러한 방법론까지 모든 것을 이해했습니다. 그러나 사용자 맞춤 설정을 보았을

    1

    1답변

    저는 R이 매우 새롭고 다음을 수행 할 수있는 패키지에 대한 정보를 찾을 수 없습니다 : 데이터 세트 (예 : 다른 텍스트 문서)가 있다고 가정하면 여러 클래스를 가질 수 있습니다. 예를 들어, 데이텀은 스포츠, 볼이있는 스포츠, 볼이없는 스포츠 및 자동차 일 수 있습니다. 데이터가 속한 스포츠라는 것을 고려하면 데이터가 속한 카테고리를 예측할 수 있기를

    0

    2답변

    나는 기계 학습에 들어가려고하고있다. 그래서 나는 짹짹에 텍스트 분류를 시험해보고 싶었다. 나는 작은 짹짹 샘플을 수집했지만, 내가 감독 한 학습을 ​​수행하기 위해 나는 내가 수집 한 짹짹 중 일부에 레이블을 붙일 필요가있다. 데이터를 확장 할 때 힘든 작업입니다. 많은 트윗을 손으로 표시하지 않고도 분류를 수행 할 수있는 방법이 있습니까? 이 작업을 위

    9

    1답변

    저는 Python과 Stackoverflow에 익숙하지 않으므로 (부드럽게하십시오) 정서 분석 방법을 배우려하고 있습니다. import csv #import regex import re import pprint import nltk.classify #start replaceTwoOrMore def replaceTwoOrMore(s):

    0

    1답변

    weka를 사용하여 텍스트를 프로그래밍 방식으로 분류해야하지만 교육 데이터와 분류 할 데이터를 필터링해야하는 등의 문제가 있습니다 (같은 방식) 분류 자와 함께 사용되기 전에. 내 접근 방식은 현재 다음과 같습니다. 문자열 특성 및 클래스를 사용하여 학습 데이터로 arff를 만듭니다. 데이터 세트에 대해 StringToWordVector를 사용하고 나중에

    1

    1답변

    텍스트 분류에 Naive Bayesian 분류자를 사용합니다. 기능 선택을위한 상호 정보 측정을 사용하여 알고리즘의 정확도를 향상시킬 수 있습니까?

    -2

    2답변

    안녕하세요 저는 컴퓨터 학습에 익숙하며 문자 분류 솔루션을 찾고 있습니다. 하나는 자바로 작성된 멋진 프레임 워크를 추천 할 수 있습니까? 나는 WEKA를 사용하는 것에 대해 생각했지만, 또한 MALLET에 대해서도 들었다. 주요 차이점은 무엇입니까? 내 목표는 레이블이없는 텍스트를 분류하는 것입니다. 따라서 학습을 위해 각 주제에 대해 약 18 개의 주제

    0

    1답변

    Java에서 Rapid miner를 통합하여 Rapid miner에서 텍스트 분류 작업을 수행하고 있습니다. 10 배 교차 유효성 검사 (x_validation 연산자) 사용하고 있습니다. 각 폴드에서 테스트/트레인 스플릿의 샘플에 액세스해야한다는 요구 사항이 있습니까? 많은 노력을했지만 각 폴드를 반복 할 수 없었습니다. 나는 여기에 붙어있어 신속한 광부