Naive Bayes 기반 구현을 위해 노력 중이며 모델 튜닝에 관해서는 Spark 2.0을 사용하고 있습니다. 모델, 나는 스파크 2에서 모델 지속성 지원을 잘 알고 있지만 걱정은 저장된 모델의 데이터 폴더에서 순진한 베이 즈에 대한 저장된 모델의 내용과 관련이 있습니다. 파이 (벡터)의 값은 저장됩니다 클래스의 수에 대해서는 & 이외는 Naive Bayes에 설정되어있는 클래스 수 &의 수에 의존하는 theta (매트릭스)이기 때문에, 모델의 데이터 폴더의 소트 내용에는 실제의 데이터에 의존해 데이터 사이즈가 커지므로Spark Naive Bayes 모델 지속성 : pi & theta 이해
아무도 내가 위트를 도울 수 있습니까? h 정확히 무엇이 저장되는지 이해하면 기본적으로 동일한 데이터를 내 프로덕션 아키텍처에 저장할 위치를 결정해야합니다.
는 나는 그들이 그 차원 C (인 클래스 전과의- 파라미터 : 파이 로그, 상기 언급 된 스파크 자바 문서에 .. t는 그들이 정확히 이해하고, 돈 그러나이에 많이 찾으려고 차원이 클래스의 수) 클래스 조건부 확률의
- 파라미터 : 세타 로그, 기능 (수)
D에 의해 C (클래스의 수)하지만 난 정확하게 이러한 값이 무엇인지 이해할 수 없습니다입니다 왜 그들이 필요한지, 누군가가 도와 주면 도움이 될 것입니다. 이해
질문은 그들이 그렇게하기 전에이 1.6이이 두 속성은 나이브 베이 즈 모델을 포함하는 파이 & 세타
좋은 자료를 찾을 수 있었습니까? – woodhead92