2016-09-04 4 views
2

나는 AI에 대한 근대 접근법에서 간단한 보드 게임에 대한 확률 론적 에이전트를 풀려고 노력하고 있지만, 기본 수학 및 대부분 전체에 문제가있다. 공동 배포, 그래서 나는 몇 가지 포인터를 요구하고있다.확률 분포가있는 4x4 격자 세계를 가로 지르는 확률 론적 에이전트

보드 근처에 4 × 4 구덩이가있는 경우 1 몬스터와 보드 괴물 및 구덩이에 어딘가에 2 피트 에이전트 단서를 제공 인접한 사각형의 악취/바람을주고있다 사각형 /몬스터

입니다 예를 들어 1-4

로부터 (X, Y) :들은 그리드 좌표 튜플 기록

방 (1,1), (1,2), (2,1) 방문한 우리는 객실 (1,2) 및 (2, 1) 산들 바람을 발견

,

이 (1,2) 및 (2,1)

P이 변수 균일 4x4 그리드 위에 분산 피트 의 확률 (16 실에 인접하거나 방 피트가있을 수 하더군요) 처음에는 평방당 구덩이 또는 괴물이 있다는 확률이 0.2가됩니다.

B는 방문한 객실에 산들 바람이나 악취가 있는지 여부입니다 (즉, 옆에있는 구덩이 일 확률을 의미 함). 그들보다 높다

전체 접합 분포는 P (P11, ..., P44, B11, B12, B21)이어야한다.

제품 규칙은 우리가 제공하는

P (P11, ..., P44, B11, B12, B21) =

P (B11, B12, B21 | P11, ..., P44) P (P11, ..., P44)

Product Rule on Full Joint Distribution

지금까지

너무 좋아하지만, 내가 다음 단계를 취할 수없는 것 것이 여기에있다.

두 번째 용어는 객실에 균등하게 분포 된 0.2의 확률입니다. 첫 번째 용어는 바람이있는 방 (B21 및 B12)이 구덩이/괴물과 인접한 경우 1이어야합니다. 그러나 B의 숫자는 무엇입니까? 어떻게 알 수 있을까요?

AIMA 서적은 다음과 같이 말합니다. "첫 번째 용어는 피트 구성이있는 브리즈 구성의 조건부 확률 분포입니다. 그 값은 바람이 피트에 인접하면 1이고 그렇지 않으면 0입니다. "

나는 며칠 동안 이걸로 고생 중이며 아무런 진전을 보이지 않고 있습니다. 어떤 도움을 주시면 감사하겠습니다.

+1

"처음에는 4x4 격자 (16 개 방)에 균일하게 분포되어 있으므로 평방당 구덩이 또는 괴물이있을 확률이 0.2가됩니다." 뭔가 빠졌습니까? 아니면 3/16 = 0.1875의 확률이어야하나요? – kabdulla

+0

나는 조금 혼란스러워. P11이 취할 수있는 가능한 값은 무엇입니까? (1,1)에 구덩이/짐승이 있는지 여부에 따라 0 또는 1입니까? 무작위적인 변수 출력을 구덩이의 실제 위치로 만드는 것이 자연스럽게 보일 것입니다. 사용중인 교과서의 문제에 연결할 수 있습니까? – eigenchris

+2

나는 그것이 매우 혼란 스럽다는 것에 동의한다. '영웅'이 사각형 중 하나에서 시작하여 3/15가 시작되므로 3/15 = 0.2부터 시작하여 15 개만 알 수 있습니다. 저는 Russel & Norvig의 인공 지능에 대한 근대적 접근이라는 책에서 499 쪽의 13.6 장을 재창조하려고합니다. 그것은 죽은 것처럼 보입니다. 그러나 나는 그 머리를 감당할 수 없습니다. "정확하게 n 개의 구덩이를 가진 특정 구성의 경우, P (P1,1,., P4,4) = 0.2^n × 0.8^16-n."(Norvig, p500) – Fred

답변

1

Bxy 값은 셀 xy에서 바람이 감지되었는지 여부를 나타내는 지표입니다.

이 Bxy = 1 산들 바람이 (x, y)를,
Bxy에서 관찰 된 경우에만 = 0, 그렇지 않으면

따라서, 귀하의 예제 상황에서, 우리가 이미 알고있는 경우 : 그들은 공식적으로 정의하고
B11 = 0, B12 = 1, B21 = 1

마찬가지로 변수 P11, P12 ..., P44는 이진 변수 어디 Pxy = 1의 경우 만, 피트가 셀 내에있을 경우 (x, y)이다. , P11 |

P (B11, B12, B21 : 이제

내가 당신의 질문은 당신이 이해하지 않은 일에 대해 무엇이라고 생각 첫 번째 용어를 살펴해야합니다. ..., P44)

이 관측 (B11 세포 (X에있는 피트가 있다고 주어진 B12, B21), Y) Pxy = 1

하여 결정의 조건부 확률 분포는 예제 상황에서는 B11, B12 및 B21 값을 채울 수 있습니다. 당신은 B11 = 0, 그리고 B12 = B21 = 1 (그것이 관찰 된 것이기 때문에)이라는 것을 알고 있습니다. 피트가있는 위치를 모를 수 있으므로 상황에 맞는 Pxy 값을 직접 채울 수는 없습니다. 그러나 수 있습니다 당신이 생각할 수있는 임의의 상황에 대한 해당 값을 기입하십시오.

"ok, 위치에 피트가 있다고 가정 해 봅시다 (1, 3)"). 그런 다음 P13 = 1이고 다른 모든 Pxy = 0을가집니다. 이러한 특정 상황에서 해당 특정 상황이 발생할 확률을 계산할 수도 있습니다 (0 일 것입니다 (2에서 바람을 볼 수 없으므로 0이됩니다). , 1) (1, 3)에 구덩이가있는 경우).

상상할 수있는 모든 상황에 대해이 작업을 반복하면 결과를 결합하여 관찰 결과에 따라 특정 위치에 구멍이 생길 확률과 같은 더 흥미로운 답변을 얻을 수 있습니다. 저것은 더 아래로 원본이 그러나 대략 인 무슨이고, 나는 당신의 질문이 인 무엇에 관하여 더 이상이지 않는다는 것을 믿는다.