2010-03-23 2 views
5

문제 제약베스트 피팅 곡선

  • 데이터 세트의 크기가 아닌 데이터 자체는 공지되어있다.
  • 데이터 세트는 한 번에 하나의 데이터 포인트만큼 증가합니다.
  • 트렌드 라인은 한 번에 하나의 데이터 포인트로 그래프 화됩니다 (스플라인/베 지어 곡선 사용).

그래프

아래 합성 합리적으로 정확한 트렌드 라인 데이터 세트를 보여준다

enter image description here

그래프이다 :

  • 가 좌상.
    시간당 ~ 24 데이터 포인트.
  • 오른쪽 상단. 하루 기준으로 ~ 365 데이터 포인트.
  • 왼쪽 아래. 일주일 단위로 ~ 52 데이터 포인트.
  • 오른쪽 아래. 1 년 동안 월별로 ~ 12 데이터 포인트.

사용자 사용자가 선택할 수있는

입력 :

  • 시계열 (시간별, 일별, 월별, 분기 별, 연간)의 유형;
  • 시계열의 시작 날짜와 종료 날짜입니다.

예를 들어, 사용자는 6 월에 30 일 동안 일일 보고서를 선택할 수 있습니다.

트렌드 무게

, 다음과 같은 표현이 사용된다 (추세선을 계산할 때 즉, 데이터 포인트의 수를 평균하는) 창 크기를 계산하려면 :

data points/trend weight 

data points 인 경우 사용자 입력에서 파생되며 trend weight6.4입니다. 추세 가중치 6.4이 적합 함에도 불구하고 다소 임의적이며 다른 사용자 입력에 적합하지 않을 수 있습니다.

질문

trend weight 계산 방법이 문제의 제약 주어진?

+1

트렌드 라인을 맞추는가 아니면 윈도우 내에서 이동 평균을 계산하고 값을 통해 스플라인을 넣는가? – Aniko

+1

나는 스무딩 스플라인 이후라고 생각합니다. http://en.wikipedia.org/wiki/Smoothing_spline –

답변

1

그래프의 외형에 따라 나는 12 포인트 그래프에 대해 너무 많은 점을 가지고 있다고 말할 것입니다. (이것은 단지 t의 스플라인입니다. 그는 주어진 시각을 기쁘게하지만 실제로 추세를 이해하려고 할 때 선보다 해를 끼칩니다.) 365 점 그래프는 너무 적습니다. 아마 같은 것을 조금 지수를 시도해보십시오

(Data points)^1.2/14.1 

나는이 더욱 임의 당신이 이미 가지고있는 것보다 실감 않지만, 임의의 세계에서 최악의 일이 아니다.

(나는 그 사람이 (52^(1.2)/52)*6.4=14.1을 취함으로써, 멋진 외모 때문에, 52 점 그래프는 고정 유지하는 시도하여 14.1 있어요. 당신은 당신이 시각적으로 무엇을 얻을 볼 수는 1.2 이외의 다른 힘을 시도 할 수이 기술을 사용.

Dan

+0

제 제안이 잘못되었을 수도 있습니다. 대체 윈도우 크기 계산을 제안합니다. – Dan

0

귀하의 결과물의 질과 귀하의 글쓰기의 명확성을 위해 투표했습니다.나는 당신의 이미 훌륭한 업적을 향상시킬 수있는 대답을 제공해주기를 바란다.

트렌드 무게로 시행 착오의 문제가있을 수 있음을 알았습니다.

사용자가 입력 할 수있는 것 : 만족스러운 값을 얻을 때까지 현실적인 제약 조건이있는 값으로 피딩 할 수 있습니다.

또한 각 그래프의 무게가 다르기 때문에 각 그래프의 점의 수가 서로 다르기 때문에 궁금합니다. 모든 그래프에 대해 작동하는 단일 가중치를 얻으려고합니까?

우수 작품; 좋은 질문입니다. 잘 했어. 내가 더 도움이 되었으면 좋겠다. 아마도 다른 누군가가 나보다 더 많은 지혜를 줄 것입니다.

+0

이 문제를 해결하기위한 "실제 방법"은 책을 설명하는 데 사용됩니다. 기본적으로 데이터베이스에서 R 함수를 호출하는 것이 포함됩니다. 그런 다음 통계 분석을 수행하고 추가 데이터 열을 보고서에 제공합니다. iReport에서 트렌드 라인을 계산하는 것은 좋은 생각이 아닙니다. –

+0

훌륭해, 나는 그것을 한 번 봐 주겠다. – duffymo

0

트렌드 라인이 4 개의 그래프에서 정확하지만 실제로는 꽤 떨어져있는 것처럼 보일 수 있습니다. (이것은 왼쪽 하단 구걸과 오른쪽 상단 구걸에서 가장 잘 보입니다. 추세선을 찾을 때 포인트의 절반 이상을 사용하고 싶을 것입니다. 나는 2의 동향 무게를 최대로 제안 할 것이다. 정말로 1-1.5 범위에 가깝게 붙여야한다. 그것은 임의적이기 때문에 사용자에게 "추세선의 정확성"슬라이더를 제공 할 것을 제안한다. 가장 정확한 설정에서 추세 가중치 1을 사용하고 최소 정확도가 #of data points +1의 가중치를 사용하는 곳에서 사용할 수 있습니다. 통계 소프트웨어는 다를 수 있지만 0 점 (항상 반올림하여 즐겁습니다)을 사용하고, 해협 수평선을 생성합니다.

+0

안녕하세요, David. 도와 주셔서 감사합니다. API로 인해 각 데이터 요소는 추세선의 일부 지점이되어야합니다. 추세 가중치 2를 사용하면 작동하지 않습니다. 1 월과 3 월 사이에 데이터 포인트가 거의 없기 때문에 오른쪽 상단이 꺼져있는 이유는 프로덕션 데이터의 경우가 아니기 때문입니다. 추세선의 가중치 (제안 된 가치)에 대한 가치를 선택하게하는 것에 대해 생각했지만 적용 할 수있는 공식이 있기를 희망했습니다. –

+0

오른쪽 상단에있는 것은 데이터가 부족하여 보이지 않는 것처럼 보입니다. 그것 없이는 데이터가 너무 많아서 거기에 도달하지 못합니다. 첫 달에는 다음 달 최대치 이상으로 정점을 찍었고 다음 달에는 평균치를 크게 상회했습니다.나는 커브가 첫 달에 파란 선을 울려 야한다고 생각할 것입니다. 그 달에 파란 선 위로 끌어 올리려는 데이터가 없기 때문에 두 번째 달에 데이터를 유지해야합니다. – David

+0

나는 통계에 관해 전혀 몰랐다는 것에 충격을 받았다. 나는 이것에 대해 알지 못한다. – David