나는 문제 해결을 위해 최선의 접근법에 대한 전문가의 조언을 원한다. 몇 가지 기계 학습, 신경 네트워크 및 그런 것들을 조사했습니다. 나는 weka, 일종의 baesian solution을 조사했습니다. R .. 몇 가지 다른 것들. 그래도 어떻게 진행해야할지 모르겠다. 여기 내 문제가있다.내가 생각하는 것에 대한 최선의 접근법은 기계 학습 문제이다.
나는 많은 이벤트 컬렉션을 가지고있다. 결국 약 100,000 정도가 될 것이다. 각 이벤트는 몇 가지 (30-50) 개의 독립 변수와 하나의 종속 변수로 구성됩니다. 종속 변수의 값을 결정할 때 일부 독립 변수가 다른 변수보다 중요합니다. 그리고이 사건들은 시간과 관련이 있습니다. 오늘날 일어나는 일들은 10 년 전 발생한 사건보다 더 중요합니다.
일종의 학습 엔진에 이벤트를 공급하고 종속 변수를 예측할 수 있기를 바랍니다. 그런 다음,이 이벤트 (그리고 전에 따라 왔던 모든 이벤트)에 대한 종속 변수에 대한 실제 응답을 알고 있으므로, 추후 추측을 훈련시켜야합니다.
프로그래밍 방향에 대한 아이디어가 있으면 연구를 수행하고 아이디어를 코드로 변환하는 방법을 파악할 수 있습니다. 그러나 내 배경은 병렬 프로그래밍이며 이것과 같은 것이 아니다. 그래서 이것에 대한 몇 가지 제안과 지침을 갖고 싶다.
감사합니다.
편집 : 다음은 내가 해결하려고하는 문제에 대한 세부 정보입니다. 가격 문제입니다. 임의의 만화책 가격을 예측하고 싶다고 가정 해 봅시다. 가격이 내가 걱정하는 유일한 것입니다. 그러나 많은 독립 변수가 있습니다. 그것은 슈퍼맨 만화인가, 헬로 키티 만화인가? 몇 살입니까? 조건은 무엇입니까? 잠시 훈련을 마치고 내가 생각할 수도있는 만화책에 대한 정보를 제공하고 만화책에 대해 합리적으로 기대되는 가치를 부여 할 수 있기를 바랍니다. 승인. 따라서 만화책은 가짜 일 수 있습니다. 그러나 당신은 일반적인 아이디어를 얻습니다. 지금까지의 답변에서 저는 Support vector machines와 Naive Bayes에 대한 연구를하고 있습니다. 지금까지의 모든 도움에 감사드립니다.
태그 "classification"과 "regression"은 상호 배타적이라고 생각합니다. 그것은 "분류"또는 "회귀"중 하나입니다. 둘 다있을 수는 없습니다. –