(망치 또는 웨카)이 텍스트 분류 작업에 대한 더 나은 어떤 제품 :망치
- 간단한 훈련을
- 더 나은는
- 문서에게 난
결과 이 문제에 대한 새로운 내용은 모든 의견이 훌륭하게 될 것입니다.
(망치 또는 웨카)이 텍스트 분류 작업에 대한 더 나은 어떤 제품 :망치
결과 이 문제에 대한 새로운 내용은 모든 의견이 훌륭하게 될 것입니다.
MALLET은 사용하기가 훨씬 쉬우 며 대부분의 작업을 수행합니다. nvisibly. 형식을 변환 할 필요가 없으며 텍스트 파일 만 제공하면 결과가 다시 제공됩니다.
Weka는 텍스트를 특정 형식으로 변환해야합니다 (Weka 스크립트는 너무 느리고 비효율적이어서 직접 작성하는 것이 좋습니다).
MALLET의 문제점은 교육에 GB의 메모리를 사용하고 큰 교육용 세트가있는 경우 몇 시간이 걸릴 수 있다는 것입니다.
Weka는 더 많은 문서를 가지고 있지만 대부분은 이해가되지 않습니다. 몰렛은 문서가 거의 없지만 사용하기가 매우 쉽습니다.
두 제품 모두 테스트 한 후 솔직하게 말해서 나는 내 자신의 분류자를 쓰는 것을 선택했습니다.
저는 Weka 대 Mallet을 정말 즐기고 있습니다. 어쩌면 아직 충분한 지식이 없어도 GUI로 기계 학습을하는 것은 대단합니다. 매개 변수를 조정할 수 있고 다른 실험을 실행할 수 있습니다 (이전 실험 결과도 사용자 앞에 너무 쉽게 유지). 나는 Weka에 익숙하지 않아 FWIW입니다.
나는 어느 쪽이 더 훈련하기 쉬운지에 관해서, 나는 Weka가 더 간단하다는 것을 안다. 나는 Mallet을 텍스트로 가리켜 어쩌면 당신의 feature 공간에 어떤 종류의 제어를 할 수 있는지 모른다. (아마도 충분하다.) Mallet에 대한 나의 경험은 Weka와 비슷했다. Mallet에서 일종의 직렬화 된 데이터 버전을 활용하기 위해 여러 단계를 거쳐야한다는 경고와 함께 적절한 형식을 사용했습니다.
다른 질문에 관해서는 지금 당장은 대답 할 수 없지만 어쨌든이 대답은 좋은 정보이기 때문에 답을 얻지 못하기를 바라고 있습니다.
Ack - 전에 (학교에서) 내 자신의 분류자를 작성 했으므로 다른 사용자 (GUI 기반 !!) 도구를 사용하여 야생 상태가되었으므로 결코 되돌아 가지 않습니다. 너의 경험은 너의 자신을 돌아가고 돌아 가기 위하여이 공구에 아주 참담했을 것입니다. –