2016-11-23 8 views
-1

을 사용하여 예측 수정하고 후 내가 아래 dataframe으로 결국 몇 가지 전처리 : enter image description here가격 나는 금 가격의 데이터 집합을 가지고 regreddion

데이터 세트에 50,000 레코드가와 morethan 500 개 다른 시장이 서로 다른 주파수, 모든 열이있다 예상 날짜는 int 유형이고 날짜는 datetime 객체입니다. 나는 특정 날짜에 단위당 가격을 예측해야합니다. 하지만 어쨌든 나는 여러 가지 방법으로 당혹 스러웠다.

제 질문은 회귀 알고리즘/방법이 결과로이 종류의 데이터를 예측하는 것입니다.

+2

이 질문은 너무 광범위합니다. 시장 분석은 현존하는 데이터에 대한 많은 분류를 포함하는 꽤 복잡한 주제입니다. 그리고 당신이 분명히 이것을 교차 시장 규모로 구현하려고 계획하고 있다고해서 더 쉬운 일은 아닙니다. 이 주제는 전체 서적을 채울 수 있습니다. 분명히 여기에서 대답 할 수있는 질문의 형식이 아닙니다. 나는 당신이 스스로 계산 된 시장 분석을 읽고 좀 더 구체적인 질문으로 돌아 가기를 권합니다. – Paul

+0

무작위로 선택한 몇 가지 예제 시장에서 선형 회귀 분석을 사용하여 탐험을 시작하는 것이 좋습니다. 그들이 잘 모델링한다면, 모든 시장으로 확장하고 아마도 시장 간 상관 관계를 조사 할 것입니다. 이런 큰 데이터 세트를 가진 초보자라면 기계 학습 영역에 들어가는 것을 권장하지 않습니다. 준비가 안 된 육체를 사랑하는 동물들이 거기에 있습니다. –

+0

일부 검색 및 웹 탐색을 마친 후, 나는 ** 시간 시리즈 **를 분석하고 예측하기 위해 알아 냈습니다. **이 데이터는 그대로입니다. ** ARIMA ** 모델은주의 깊게 활용하면 잘 작동합니다. – samanv

답변

1

기계 학습 또는 데이터 마이닝에서 항상 그렇듯이 많은 방법으로 많은 작업을 수행 할 수 있습니다. 주어진 문제에 대한 알고리즘을 결정하기 위해 제거를 시도 할 수 있습니다. 주요한 경우는 클래스 변수 (예측되는 피쳐)가 연속적이므로 회귀 알고리즘을 사용해야합니다. 선형 회귀 분석을 제안하고, r^2 스코어를 사용하여 정확성을 확인하십시오. 이는 기본적으로 실제 값과 예측 값의 제곱 차이입니다. 동위 원소가 아닌 경우, 우회적 회귀선을 시도하십시오.