0
2 년 전에 NLTK 분류기를 사용했습니다. 이제 텍스트 분류에 오렌지색 SVM을 사용하는 방법을 배우고 싶습니다. 오렌지 튜토리얼의 SVM 예제는 iris.tab입니다 :주황색 SVM 열차의 텍스트 데이터를 준비하는 방법은 무엇입니까?
sepal length sepal width petal length petal width iris
c c c c d
class
5.1 3.5 1.4 0.2 Iris-setosa
4.9 3.0 1.4 0.2 Iris-setosa
텍스트를 분류하고, 데이터를 준비하는 방법. 그것은 아래처럼?
token frequency tokenlength
the 23 3
for 21 3
at 10 2
다른 방법으로 데이터를 준비해주십시오. SVM에서 토큰을 레이블로 볼 수 있습니까? 그렇지 않다면 어떻게 할 수 있습니까?
대단히 감사드립니다.