2016-06-29 4 views
1

mpow(P, 18)을 벡터 양식 & 행렬 형식으로 작성하려고합니다. 누구든지 저를 도울 수 있습니까?전환 확률 행렬이 주어진다면 마르코프 체인의 고정 분포를 어떻게 얻을 수 있습니까

또한 각 상태의 고정 분포를 찾으려고합니다. 여기

Pi_0 = ? 
Pi_1 = ? 
Pi_2 = ? 
... 
Pi_5 = ? 

는 내가 작성한 코드입니다 : 귀하의 질문에

P <- matrix(c(0, 0, 0, 0.5, 0, 0.5, 0.1, 0.1, 0, 0.4, 0, 0.4, 0, 0.2, 0.2, 0.3, 0, 0.3, 0, 0, 0.3, 0.5, 0, 0.2, 0, 0, 0, 0.4, 0.6, 0, 0, 0, 0, 0, 0.4, 0.6), nrow = 6, ncol = 6, byrow = TRUE) 

mpow <- function(P, n) { 
if (n == 0) diag(nrow(P)) 
else if (n == 1) P 
else P %*% mpow(P, n - 1) 
} 

mpow(P, 18) 
+0

고정 분포는 각각의 상태로 끝날 확률 인 사용자의 행 벡터입니다. 행의 합계를'rowSums (mp (P, 18)) '로 확인하면 고정 분포 인 1 – toni057

+0

까지 합계됩니다. – toni057

+0

나는 그것이 옳은 대답이라고 생각하지 않습니다. Pi_0 ..... Pi_5는 모두 1보다 작은 부분이어야합니다. – PeterNiklas

답변

3

, 매트릭스 P은 전이 확률이다. 다음 상태 j 동안 현재 상태 i 인 확률이다

P[i, j] = Pr(k = j | k = i) 

mpow(P, n)은 천이 행렬의 n 승을 산출한다. 당신이 볼 수 있듯이 n가 큰 경우 예를 들어,

> mpow(P, 3) 
     [,1] [,2] [,3] [,4] [,5] [,6] 
[1,] 0.000 0.030 0.105 0.250 0.280 0.335 
[2,] 0.001 0.025 0.111 0.254 0.260 0.349 
[3,] 0.006 0.032 0.113 0.266 0.224 0.359 
[4,] 0.006 0.048 0.144 0.289 0.172 0.341 
[5,] 0.000 0.024 0.156 0.400 0.248 0.172 
[6,] 0.000 0.000 0.048 0.272 0.432 0.248 

> mpow(P, 10) 
      [,1]  [,2]  [,3]  [,4]  [,5]  [,6] 
[1,] 0.002603379 0.02615891 0.1174816 0.3118660 0.2703684 0.2715217 
[2,] 0.002591038 0.02612154 0.1175283 0.3121341 0.2705060 0.2711190 
[3,] 0.002565915 0.02600925 0.1174628 0.3124644 0.2710401 0.2704575 
[4,] 0.002523007 0.02573033 0.1169686 0.3125272 0.2725643 0.2696866 
[5,] 0.002560361 0.02545419 0.1150961 0.3094197 0.2749053 0.2725643 
[6,] 0.002708774 0.02649409 0.1171436 0.3096530 0.2690952 0.2749053 

> mpow(P,50) 
      [,1]  [,2]  [,3]  [,4]  [,5]  [,6] 
[1,] 0.002590674 0.02590674 0.1165803 0.3108808 0.2720207 0.2720207 
[2,] 0.002590674 0.02590674 0.1165803 0.3108808 0.2720207 0.2720207 
[3,] 0.002590674 0.02590674 0.1165803 0.3108808 0.2720207 0.2720207 
[4,] 0.002590674 0.02590674 0.1165803 0.3108808 0.2720207 0.2720207 
[5,] 0.002590674 0.02590674 0.1165803 0.3108808 0.2720207 0.2720207 
[6,] 0.002590674 0.02590674 0.1165803 0.3108808 0.2720207 0.2720207 

는, 당신은 모든 행이 동일한 고정 분포를 도달한다. 즉, 초기 상태에 관계없이 특정 상태로 끝날 확률은 동일입니다.

이러한 수렴에 도달하면이 행렬의 모든 행은 고정 분포입니다. 예를 들어, 첫 번째 행을 추출 할 수 있습니다.

> mpow(P,50)[1, ] 
[1] 0.002590674 0.025906736 0.116580311 0.310880829 0.272020725 0.272020725 
+0

나는 모든 행이 1과 같은 이유를 이해합니다. 당신의 대답에 감사드립니다. 그래서, 즉 : Pi_0 = 0.02589806 Pi_1 = 0.02590271 등? – PeterNiklas

+0

감사합니다. 지금 이해합니다. :) – PeterNiklas