여기에 속한 질문이 여기에 속하기를 바랍니다. 그래서 제가 지금 다루고있는 문제는 여기에 있습니다 : 제조 공정 (센서 데이터, 프로세스 매개 변수 등)에서 수집 한 데이터가 있고 스크랩 여부에 관계없이 생산 라인을 떠나는 모든 부품에 대한 데이터가 있습니다. 그래서 각 부분마다 공정 데이터와 품질이 있습니다. (0 : 좋은 1 : 나쁜)불명확 한 데이터 세트
목표는 제조 공정을 최적화하는 것입니다. 즉, 스크랩을 최소화하는 최적의 공정 매개 변수를 찾는 것입니다.
지금까지 내가 한 것은 : 다른 분류 알고리즘 (임의의 포리스트, SVM, 신경망)을 시도했지만 아무도 좋은 정확도를 얻을 수 없었습니다. 그 이유는 데이터가 매우 모호하다고 생각합니다. 즉, 동일한 프로세스 매개 변수가있는 부품이있는 경우 일부는 좋지 않을 수 있지만 일부는 스크랩되었을 수 있습니다. 그러나 품질과 공정 매개 변수 사이에는 분명히 관련이 있습니다. 내가 원했던 부분이 좋거나 나쁘다고 생각되는 "확률"을 예측하는 것입니다. 나는 확률 밀도를 추정하고 싶습니까? K- 가까운 이웃들과이 작업을 수행 할 수 있습니까?