scikit-learn

1열

1답변

scikit-learn을 사용하여 여기에 설명 된대로 여러 카테고리로 분류하고 싶습니다. use scikit-learn to classify into multiple categories, 대신 분류 자에서 계산 한 레이블을 반환하는 대신 멤버십 확률을 반환하고 싶습니다. . 이것이 scikit-learn과 가능한가?

5열

1답변

nltk, multiclass 케이스 내에서 scikit-learn 분류 자 사용

텍스트 문서의 분류는 simple task with scikit-learn이지만 NLTK에서이를 명확하게 지원하지 않으며 또한 this과 같이 어려운 방식으로 샘플을 작성합니다. NLTK로 전처리하고 sckit-learn로 분류하고 NLTK에서 SklearnClassifier를 찾았지만 약간의 문제가 있습니다. scikit 배우기 모든 일에 은 OK입니다

5열

1답변

Scikit Decistion Tree 시각화 : 오류 값의 의미

저는 기계 학습의 초보자이며 의사 결정 트리를 실험하고 있습니다. 결정 트리 http://scikit-learn.org/dev/_images/iris.svg의 시각화를보고 있으며 오류 값의 의미를 궁금해합니다. 지니 인덱스 (Gini Index) 또는 정보 이득인가? 또한 그것이 직관적으로 의미하는 바를 이해할 수있을 것입니다.

0열

1답변

Scikits 내가 문서에 참조 최대 - ITER

을 정의 배울 수있다 max_iter 옵션 http://scikit-learn.org/dev/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC 하지만 그것을 사용하려고 할 때마다, 나는이 svc = svm.SVC(kernel=kernel_option[kernel_gene], degree=degree_value

2열

2답변

SciKit-learn 및 대용량 데이터 세트로 텍스트 분류

우선 나는 어제 파이썬으로 시작했습니다. 나는 SciKit과 큰 데이터 세트 (250.000 개의 짹짹)로 텍스트 분류를하려고합니다. 알고리즘의 경우 모든 트윗은 4000 x 1 벡터로 표시되므로 입력이 250.000 개의 행과 4000 개의 열로 구성됩니다. 파이썬으로 이것을 만들려고 할 때 8500 개의 짹짹 (목록으로 작업하고 추가 할 때)이 부족하여

5열

1답변

SciPy NumPy 및 SciKit 배우고 희소 행렬을 만듭니다.

현재 텍스트를 분류하려고합니다. 데이터 세트가 너무 크고 here으로 제안되었으므로 스파 스 매트릭스를 사용해야합니다. 내 질문은 지금, 스파 스 매트릭스에 요소를 추가하는 올바른 방법은 무엇입니까? 예를 들어, 행렬 X가 제 입력이라고 가정 해 봅시다. X = np.random.randint(2, size=(6, 100)) 이 매트릭스 X는 ndarr

2열

1답변

sklearn.metric classification_report의 정밀도

sklearn (scikit)의 classification_report를 사용하여 쉼표 뒤에 숫자를 더 많이 입력 할 수 있는지 알고 싶습니다. 기압은 다음과 같습니다 precision recall f1-score support 1 0.61 0.73 0.67 71194 2 0.64 0.33 0.43 13877

2열

1답변

평균 정밀도를 잘 표시되지 않는 (scikit)

내가 sklearn의 분류 보고서를 사용하고 있는데이 출력입니다 : 때를하지만 precision recall f1-score support 1 0.5525 0.8118 0.6575 71194 2 0.8782 0.1371 0.2372 13877 3 0.5343 0.6083 0.5689 61591 4

11열

1답변

Scikit을 사용하여 텍스트 분류를위한 데이터 준비 Learn SVM

Scikit의 SVM을 적용하려고하는데 내가 수집 한 트윗을 분류하는 법을 배웁니다. 그래서 A와 B의 두 가지 카테고리가 있습니다. 지금은 두 개의 텍스트 파일 인 'A.txt'와 'B.txt'로 분류 된 모든 트윗이 있습니다. 그러나 Scikit Learn SVM에서 어떤 유형의 데이터 입력을 요구하는지 잘 모르겠습니다. 필자는 레이블 (A와 B)을 키

4열

1답변

파이썬에서 거리 매트릭스를 취하는 좋은 계층 적 클러스터링 패키지가 있습니까?

필자는 페어 와이즈 levenshtein의 거리로 구성된 거리 매트릭스를 가지고 있습니다. 나는 scikits-learn을 사용하고있었습니다. 그러나 계층 적 클러스터링 알고리즘은 클러스터링을위한 입력으로 거리 매트릭스를 사용하지 않습니다. 그래서 나는 이것을 할 수있는 새로운 꾸러미를 찾아야한다. 계층 적 클러스터링에 사용한 패키지가 빠르고 테스트가 잘되