다음과 같이 MDP 자동차 공급 및 수요 문제를 해결하고 수동으로 전환 확률 매트릭스를 자동으로 생성하는 기술이 있는지 생각하고있었습니다. , 1030 3 1 1,100 1,2,3 는 스테이션 1에서 차 가정, 시간, 1 국, 2 국 (1000) 3 : 는 수요가 다음과 같다 가정 자동차가 역 1에서 떨어지고 40 %의 기회가 역 2에서 떨어질 확률은 60
저는 현재 Markov 결정 프로세스에 대한 동적 프로그래밍 솔루션을 연구 중입니다. 나는 VI와 PI에 대한 적절한 파악력을 가지고 있고 PI에 대한 동기가 나에게 분명하다고 느낍니다. 올바른 상태 유틸리티를 수렴하는 것은 불필요한 작업처럼 보입니다. 필요한 모든 것이 올바른 정책 일 것입니다. 그러나, 나의 실험 중 어떤 것도 런타임 측면에서 PI를 유
IBM은 JMS MDP (Message Driven POJO)와 함께 JMS 공급자로 IBM WebSphere MQ를 사용하고 있습니다. 특정 정의 된 시간에만 메시지를 사용할 수 있도록 메시지에서 시간 관련 등록 정보를 구성 할 수있는 JMS에는 어떤 방법이 있습니까? 예를 들어, M1, M2 및 M3 대기열에 세 개의 메시지를 보내는 경우. 어디서 오전
JMS 대기열을 수신하고 동기 요청 - 응답 메시지에 대해 다시 회신하는 WAR로 배포 된 Spring MDP 수신기가 있습니다. 리스너가 살아 있는지 모니터링하는 가장 좋은 방법은 무엇입니까? 또는 웹 응용 프로그램의 모니터를 설정하여 Java 응용 프로그램 서버에서 실행 중인지 확인하는 방법에 대해 생각해보십시오.
나는 환경 다음 (3 × 4지도)와 MDP 문제가 생겼어요 : 가능한 행동에 /하/좌/우 오른쪽 방향으로 이동의 0.8 기회 , 인접한 각 방향에 대해 0.1 (예 : 의 경우) : 0.1 기회 가야 왼쪽이 일 때, 0.1 기회가 오른쪽). [업, 위, 오른쪽 오른쪽, 오른쪽,] : 지금은 (1,1)에서 시작하는 행동의 다음과 같은 순서로 실행 가능한 결과