저는 Scikit의 Semi-supervised Naive Bayes (Bernoulli) 구현을 사용하고자합니다. this link in github에 따르면, 1 년 전 (SemisupervisedNB 클래스) 그것에 대해 몇 가지 작업과 토론이있었습니다. 반면에 another different implementation (function fit_semi?) which seems it was polished by another user afterwards 인 것 같습니다. 그러나 현재 안정적인 릴리스에서는 사용할 수 없습니다.Scikit-learn : 반 감독 Naive Bayes 구현이 가능합니까?
다른 누군가가 세미 구현 된 Naive Bayes를 빌드하기 위해 scikit-learn의 현재 릴리스에서이 두 구현 중 하나를 어떻게 사용할 수 있습니까? 감사.
PS : 나는 클래스와 NLTK에서 분류를 scikit가 배울 사용하고 SklearnClassifier
내가 레이블이없는 클래스 레이블을 변경 내 프로젝트에 SemiSupervisedNB의 코드를 시도
편집 -1 2 (나는 SKLarnClassifier NLTK에서 사용하고 내 레이블이없는 클래스는 레이블 2 가져옵니다). 그러나 ValueError 점점 : I 배열을 inf 값이 포함되어 있기 때문에 배열을 infs 또는 NaNs d (현재 및 이전 매개 변수 사이의 차이를 계산할 때) 포함 할 수 없습니다 ...이 문제를 해결하는 방법에 대한 아이디어?
지점을 확인하고 그 지점에서 작업을 시도 할 수는 있지만 현재 상태가 양호한 지 확신 할 수 없습니다. 또한 현재 안정 상태에 상당히 뒤떨어져 있습니다. 분기를 현재 마스터에 리베이스/병합하려고 할 수 있습니다. 그러나 git/프로젝트에 익숙하지 않은 경우에는 몇 가지 문제가있을 수 있습니다. 또는 @larsmans에서 의견을 남기고 무엇을해야할 지 알려주십시오.) –
답장을 보내 주셔서 감사합니다. 불행히도 지금은 코드를 검토 할 시간이별로 없습니다 ... @ogrisel도 기다릴게요. :) – AM2
미안하지만,이 문제를 해결할 수있는 시간이 없거나 해. semi-supervised NB는 (몇 달 전에 시도한 동료가) 작동해야하지만 현재의 scikit-learn을 전혀 사용하지 않습니다. @ amueller가 제안했듯이 리베이스를 시도 할 수 있습니다. –