-2

기계 학습의 기능을 작업하고 매트릭스로 표현할 때 시간 예측과 요일 표시 방법이 가치 예측 모델의 기능으로 추천됩니다.머신 러닝의 가치 예측 모델을위한 시간대와 요일을 나타내는 가장 좋은 방법은 무엇입니까?

모든 시간 값에 대해 0을 사용하고 이러한 속성을 피쳐로 표시하는 기본 방법을 나타 내기 위해 1을 사용합니까? 요일에도 같은가요?

감사 이때

+0

에서

답변은 귀하의 질문에 여기 오프 주제를 만드는, 기계 학습에 초점을 맞추고, 직접 프로그래밍 관련이없는 것으로 보인다. [Cross Validated] (https://stats.stackexchange.com) 또는 [Data Science SE] (https://datascience.stackexchange.com)가 이러한 질문에 더 적합 할 수 있습니다. –

답변

0

주기 주간 추이 및 장기 위쪽 경향이있다. 그래서 당신은 두 시간 변수를 인코딩 할 것이다 : 년

  • DAY_OF_WEEK
  • absolute_time

를 일반

몇 가지 일반적인 시간이 추세가 발생한다는 프레임이 있습니다 이상 :

  • absolute_time
  • DAY_OF_YEAR
  • DAY_OF_WEEK
  • month_of_year
  • HOUR_OF_DAY
  • MINUTE_OF_HOUR 모든 이들의 동향에 대한

봐.

이상한 동향 너무 이상한 동향에 대한

봐. 예를 들어, 당신은 드물지만 지속 시간 기반 동향 볼 수 있습니다 :

  • is_easter
  • is_superbowl
  • is_national_emergency 등을
  • 이 종종 당신이 기준을 통과해야

외부 소스로부터 데이터가 이벤트를 시간에 매핑합니다.

왜 그래프입니까?

그래프가 너무 중요하다고 생각하는 이유는 두 가지입니다.

이상한 동향 : 일반적인 추세가 아주 쉽게 자동화 할 수 있지만 가 (단지 그들에게 모든 시간을 추가)은, 이상한 경향이 자주 찾는 인간의 눈과 세계에 대한 지식이 필요합니다. 이것이 그래프 작성이 중요한 이유 중 하나입니다.

데이터 오류 : 너무 자주 데이터에 심각한 오류가 있습니다.예를 들어 날짜가 두 가지 형식으로 인코딩되었으며 그 중 하나만 프로그램에 올바르게로드되었음을 알 수 있습니다. 그런 문제가 무수히 많으며 놀랍게도 흔합니다. 이것은 그래프 작성이 시계열뿐만 아니라 모든 데이터에 중요하다고 생각하는 또 다른 이유입니다. https://datascience.stackexchange.com/questions/2368/machine-learning-features-engineering-from-date-time-data