2

텍스트 분류 문제 (정서 분석)를 다루고 있습니다. scikit에 어떤 옵션이 있는지 알고 싶습니다. 기능에 "중요도"로 "가중치"를 추가하는 방법을 배우십시오. Scikits Learn : 선형 커널 SVM의 특징 가중치

coef_ array, shape = [n_class-1, n_features] 
    Weights asigned to the features (coefficients in the primal problem). 
    This is only available in the case of linear kernel.coef_ is readonly property derived from dual_coef_ and support_vectors_ 

그러나,이 속성은 읽기 전용 것 같습니다 : 나는 아래에 정의, 문서를 확인하고 the attribute "coefs" of SVC을 발견했다.

답변

5

coef_ 벡터는 기계 학습 알고리즘에서 학습 한 매개 변수에 대한 뷰입니다. 데이터에서 자동으로 최적으로 조정되므로 수동으로 설정하는 것은 의미가 없습니다. 당신이 대신 할 수있는 것은 : 당신이 어떤 클래스는 데이터 세트에서 이전에 몇 가지 샘플에 대한 지식 (행이있는 경우 경우

  • 세트 sample_weight 다른 사람보다 더 중요한 것에 대해 사전 지식이있는 경우

    • 세트 class_weight)가 다른 것보다 더 중요하다. RBF 커널을 사용하고 일부 기능을 다른 것보다 중요하게 만들려는 경우 일부 기능을 재조정 할 수있는 기능을 다시 조정하십시오 (일반적으로 모든 기능을 다음과 같이 확장하는 것이 가장 좋습니다. 단위 차이)

    • 커널을 사용하고 이런 사전 특별한 지식을 인코딩하려는 경우 사용자 정의 사전 계산 된 커널을 사용하십시오. 텍스트 분류

    , 데이터는 높은 희미한이며, 커널은 대개 거의 또는 전혀 추가 예측 정확성을 위해 자원을 낭비하고, 그래서 마지막 두 점은 아마 당신의 특정 문제에 관련이 없습니다.

  • +0

    깔끔하고 감사합니다. –