alpha-beta-pruning

    1

    1답변

    11x11 보드로 Tic Tac Toe 게임을 만들기로 결정했습니다. 우승 조건은 5 셀 X 또는 O 연속 (세로, 가로 또는 대각선) 또는 보드가 꽉 찬 경우입니다 , 즉 이동이 불가능합니다. 저는 미니 맥 알고리즘을 사용하여 보드에서 최상의 움직임을 찾는 AI 상대방을 만듭니다. (알파 - 베타 가지 치기와) 최소 최대의 의사 코드는 다음과 같다 : f

    2

    1답변

    나는 MCTS "나무 정책"가 어떻게에 관하여 실행되는지 조금 혼란 스럽다. 나가 읽는 각 종이 또는 기사는 현재 게임 국가 (MCTS teminology에서 대략 움직이는 것을위한 뿌리)에서 나무의 아래에가는에 대해서 이야기한다. 내 질문은 내가 MIN 플레이어 레벨에있을 때 (내가 MAX 플레이어라고 가정 할 때) 어떻게 최고의 아이를 선택 하는가이다.

    0

    2답변

    나는 간단한 액티비티에 대해 negamax를 구현하려고합니다. 총 21 점을 얻는 플레이어. 3. 아니에요 컴퓨터가 쉽게 0 모드로 총 합동하게 수를 추가하여 승리해야하므로 https://en.wikipedia.org/wiki/Negamax#Negamax_base_algorithm이 인간의 선수가 먼저 이동 : 여기 의사 코드를 사용하고 동적 이동 생성을

    -1

    1답변

    othello 게임에서 인공 지능의 다음 이동을 시뮬레이트하고 싶지만 다음 이동을 반환하는 대신 복제본을 시뮬레이트하는 대신 원본 보드에서 모든 이동을 수행합니다. 게임이 끝납니다. public class GameState implements Cloneable{ private Node[][] board; // Game board private i

    0

    1답변

    Alphabeta 가지 치기를위한 게임 트리를 만들고 있는데 svg를 사용하여 트리를 만들었지 만 지금은 편집 가능한 텍스트를 트리에 추가하고 입력 된 값을 계산에 사용할 수있게하려고합니다. 내 계산에 입력 된 값을 사용하십시오. 아무도 나를 도와 줄 수 없습니까? html, body { background: #EEE; } svg {

    2

    1답변

    저는 Norse tafl 보드 게임 패밀리 (project here, source file at issue here)의 인공 지능을 작성하고 있습니다. 그들은 체스 AI에 대한 지식을 폭넓게 사용하여 여기에 적용 할 수 있습니다. 문제의 변형은 방사형 대칭 시작 위치를 가진 7x7 보드에서 재생됩니다. 흰색은 가운데에서 시작하고 검정색은 가장자리에서 시작합

    1

    2답변

    점과 박스를 재생하는 프로그램을 작성 중이며 반복 심화 체계에서 휴리스틱 값을 기반으로 알파 베타에서 고려한 동작을 정렬하여 시간 효율성을 높이고 싶습니다. 본질적으로, 나는 검색 트리에 들어가서 각 반복마다 깊이를 증가시키고 alphaBeta로 각 노드를 평가하려고합니다. 각각의 연속 반복에서 노드를 고려하는 순서는 이전 반복의 노드의 경험적 값에 의해

    1

    2답변

    이 수정 된 의사 코드를 다시 작성하여 점수뿐만 아니라 이동을 반환 할 수 있습니까? 발견 된 here. 이는 Minimax 알고리즘의 최적화 된 버전 인 Alpha-Beta 알고리즘이며 Tic-Tac-Toe과 같은 완벽한 정보 게임에서 최적의 이동을 찾는 데 사용됩니다. function alphabeta(node, α, β, maximizingPlayer

    4

    1답변

    점수와 최고의 이동을 찾으려 고 시도합니다. 나는 게임의 점수를 올바르게 되돌려 놓기 위해 나의 프로그램을 얻었지만, 나는 또한 그것을 돌려 주길 원한다. 어떻게하면 내 코드를 바꿀 수 있습니까? this 및 this과 유사합니다. 내 실패한 코드 here을보고, 게임이 끝나면 None이 반환되어 대신 이동해야합니다. def alphabeta(game_st

    2

    1답변

    기존 구현 : minimax로 구현 한 Tic-Tac-Toe에서는 최상의 결과를 얻을 수있는 상자를 모두 찾아 무작위로 1 개를 선택하므로 매번 동일한 솔루션이 표시되지 않습니다 . 예 : 반환 된 목록이 [1, 0, 1, -1]이면 어느 시점에서 두 개의 가장 높은 값 사이에서 무작위로 선택합니다. 알파 - 베타 가지 치기에 대한 질문 : 내가 알고리즘은