기존 구현 :
minimax로 구현 한 Tic-Tac-Toe에서는 최상의 결과를 얻을 수있는 상자를 모두 찾아 무작위로 1 개를 선택하므로 매번 동일한 솔루션이 표시되지 않습니다 .
예 : 반환 된 목록이 [1, 0, 1, -1]이면 어느 시점에서 두 개의 가장 높은 값 사이에서 무작위로 선택합니다. 알파 - 베타 가지 치기에 대한alpha-beta pruning은 minimax를 사용하여 내 솔루션에서 무작위성을 제거합니까?
질문 :
내가 알고리즘은 하나 개의 경로에서 승리하는 것이, 더 이상 /로 연결되지 않을 수 있습니다 다른 경로를 찾을 필요가 발견 없을 때, 이해 무엇을 기반으로 이기는 케이스.
이렇게 생각 하듯이 가능한 가장 빠른 해결책이 결과로 표시되고 매번 똑같이 보일 수있는 가능한 상자가 생깁니 까? 예를 들어 첫 번째 이동시 모든 이동은 끌기로 연결됩니다. 매번 첫 번째 상자가 선택됩니까?
minimax 솔루션과 같이 솔루션에 임의성을 가져올 수있는 방법은 무엇입니까? 지금 생각한 한 가지 방법은 인덱스를 무작위로 알파 베타 알고리즘에 전달하는 것입니다. 결과는 무작위로 정렬 된 순위 목록에서 가장 좋은 솔루션이됩니다.
미리 감사드립니다. 이것에 관한 약간의 문헌이 있다면, 나는 그것을 읽게되어 기쁠 것입니다. 누군가가 aplha-beta pruning에 대한 좋은 참고 자료를 게시 할 수 있다면, 적용하는 방법을 이해하는 데 어려움이 있으므로 탁월한 방법이 될 것입니다.
알파 -beta 알고리즘은 특정 상태에 대해 여러 최상의 솔루션을 반환합니다 (모두 동일). 내가 생각한 바는 그것이 최선의 해결책으로 멈추고 나머지 것들은 잘랐다는 것입니다. –
@The_coder에서 편집 된 답변에 대한 추가 정보가 있습니다. –