reinforcement-learning

4열

3답변

우리 요원이 xx 및 yy 축을 따라 이동할 수있는 방에 있다고 가정 해 봅시다. 각 지점에서 그는 위, 아래, 오른쪽, 왼쪽으로 이동할 수 있습니다. 그래서 우리의 상태 공간은 (x, y)로 정의 될 수 있고 각 점에서의 우리의 행동은 (위, 아래, 오른쪽, 왼쪽)에 의해 주어진다. 우리 요원이 그를 벽에 부딪치게 할 행동을 취하면 우리는 그에게 -1의

5열

4답변

신경 네트워크를 사용하여 "소프트"솔루션을 해결하는 방법은 무엇입니까?

저는 건물에있는 우주 사수 게임에서 적들을 공격하기 위해 신경망을 사용하는 것을 고려하고 있습니다. 네트워크에 대한 확실한 결과물 세트가 없을 때 신경 네트워크를 어떻게 훈련합니까?

3열

2답변

Connect 4에 어떤 기계 학습 알고리즘을 사용해야합니까?

필자는 Connect 4 (미니 맥스 사용)를 잘 사용하는 인공 지능을 가지고 있습니다. 이제는 내가 가지고있는 인공 지능을 배우기 위해 기계 학습 알고리즘을 사용하고 싶습니다. 그리고 서로를 상대로 게임을하고 싶습니다. 어떤 알고리즘이 좋을까요? 어떻게 훈련시킬 수 있습니까? 누군가가 이것을하는 방법을 이름을 짓는다면 나는 쉽게 내 스스로 그것을 Goog

8열

2답변

가변 작업으로 학습 강화 학습

내가 읽은 알고리즘은 일반적으로 고정 된 동작 수를 가진 단일 에이전트에 적용됩니다. 다양한 액션 수를 고려하면서 결정을 내리는 보강 학습 알고리즘이 있습니까? 예를 들어, 플레이어가 N 명의 병사를 통제하고 각 병사가 조건에 따라 임의의 액션 수를 갖는 컴퓨터 게임에서 RL 알고리즘을 적용하는 방법은 무엇입니까? 병사가 생겨 죽을 때 계속 사용 가능한 조

3열

2답변

강화 학습 장난감 프로젝트

&이 강화 학습 적용 배울 수있는 내 장난감 프로젝트는 다음과 같습니다 는 - 에이전트는 "안전"& "빨리"는 목표 상태에 도달하려고 .... - 그러나 발사체가와 로켓 등이 있습니다. - 에이전트가 일부 소음 가진 - 로켓 위치를 확인할 수 있습니다 - 그들은 "근처에"경우에만 - 에이전트는 ..이 로켓에 충돌 피하기 위해 배워야한다 - 에이전트와 -re

16열

4답변

지속적인 * 작업 * 공간으로 작업하기 위해 Q- 학습 일반화

강화 학습 설정에서 최상의 작업을 수행하는 데 필요한 마우스 동작을 배우기 위해 에이전트를 얻으려고합니다 (즉, 보상 신호가 배우기). Q- 학습 기술을 사용하고 싶지만 a way to extend this method to continuous state spaces을 찾았지만 연속 동작 공간에서 문제를 해결하는 방법을 찾지 못했습니다. 모든 마우스 움직임

1열

1답변

강화 학습 - 주어진 점수로 가중치를 최적화

미리 정의 된 "감지 위치"로 이동하여 알 수 없지만 패턴이있는 환경 (예 : 사무실 건물)을 탐색하는 시뮬레이션 로봇이있는 프로젝트를 진행 중입니다. 즉, 각 점에서 로봇은 사용 가능한 가시 위치에서 이동할 새 위치를 선택해야합니다. 우리의 궁극적 인 목표는 로봇이 글로벌 탐사 시간을 최적화하기 위해 환경 패턴을 악용하는 방법을 배우도록하는 것입니다. 로

1열

1답변

Q- 러닝 향상

저는 현재 벽/장애물로 가득 찬 방에서 움직이는 방법을 봇에게 가르치려고 Q- 러닝을 사용하고 있습니다. 그것은 방의 어느 곳에서나 시작하여 목표 상태 (예를 들어, 문이있는 타일)에 도착해야합니다. 현재 다른 타일로 옮기고 싶을 때, 그 타일로 이동 하겠지만, 미래에는 타일 대신 다른 타일로 이동할 가능성이 무한하다고 생각했습니다. 그것은 위로, 아래로,