日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

用Python編寫一個國際象棋AI程序

系統 1850 0

最近我用Python做了一個國際象棋程序并把代碼發布在Github上了。這個代碼不到1000行,大概20%用來實現AI。在這篇文章中我會介紹這個AI如何工作,每一個部分做什么,它為什么能那樣工作起來。你可以直接通讀本文,或者去下載代碼,邊讀邊看代碼。雖然去看看其他文件中有什么AI依賴的類也可能有幫助,但是AI部分全都在AI.py文件中。

AI 部分總述

AI在做出決策前經過三個不同的步驟。首先,他找到所有規則允許的棋步(通常在開局時會有20-30種,隨后會降低到幾種)。其次,它生成一個棋步樹用來隨后決定最佳決策。雖然樹的大小隨深度指數增長,但是樹的深度可以是任意的。假設每次決策有平均20個可選的棋步,那深度為1對應20棋步,深度為2對應400棋步,深度為3對應8000棋步。最后,它遍歷這個樹,采取x步后結果最佳的那個棋步,x是我們選擇的樹的深度。后面的文章為了簡單起見,我會假設樹深為2。

生成棋步樹

棋步樹是這個AI的核心。構成這個樹的類是MoveNode.py文件中的MoveNode。他的初始化方法如下:

          
def __init__(self, move, children, parent) :
  self.move = move
  self.children = children
  self.parent = parent
  pointAdvantage = None
  depth = 1
        

這個類有五個屬性。首先是move,即它包含的棋步,它是個Move類,在這不是很重要,只需要知道它是一個告訴一個起子往哪走的棋步,可以吃什么子,等等。然后是children,它也是個MoveNode類。第三個屬性是parent,所以通過它可以知道上一層有哪些MoveNode。pointAdvantage屬性是AI用來決定這一棋步是好是壞用的。depth屬性指明這一結點在第幾層,也就是說該節點上面有多少節點。生成棋步樹的代碼如下:

          
def generateMoveTree(self) :
  moveTree = []
  for move in self.board.getAllMovesLegal(self.side) :
    moveTree.append(MoveNode(move, [], None))
 
  for node in moveTree :
    self.board.makeMove(node.move)
    self.populateNodeChildren(node)
    self.board.undoLastMove()
  return moveTree
        

變量moveTree一開始是個空list,隨后它裝入MoveNode類的實例。第一個循環后,它只是一個擁有沒有父結點、子結點的MoveNode的數組,也就是一些根節點。第二個循環遍歷moveTree,用populateNodeChildren函數給每個節點添加子節點:

          
def populateNodeChildren(self, node) :
  node.pointAdvantage = self.board.getPointAdvantageOfSide(self.side)
  node.depth = node.getDepth()
  if node.depth == self.depth :
    return
 
  side = self.board.currentSide
 
  legalMoves = self.board.getAllMovesLegal(side)
  if not legalMoves :
    if self.board.isCheckmate() :
      node.move.checkmate = True
      return
    elif self.board.isStalemate() :
      node.move.stalemate = True
      node.pointAdvantage = 0
      return
 
  for move in legalMoves :
    node.children.append(MoveNode(move, [], node))
    self.board.makeMove(move)
    self.populateNodeChildren(node.children[-1])
    self.board.undoLastMove()
        

這個函數是遞歸的,并且它有點難用圖像表達出來。一開始給它傳遞了個MoveNode對象。這個MoveNode對象會有為1的深度,因為它沒有父節點。我們還是假設這個AI被設定為深度為2。因此率先傳給這個函數的結點會跳過第一個if語句。

然后,決定出所有規則允許的棋步。不過這在這篇文章討論的范圍之外,如果你想看的話代碼都在Github上。下一個if語句檢查是否有符合規則的棋步。如果一個都沒有,要么被將死了,要么和棋了。如果是被將死了,由于沒有其他可以走的棋步,把node.move.checkmate屬性設為True并return。和棋也是相似的,不過由于哪一方都沒有優勢,我們把node.pointAdvantage設為0。

如果不是將死或者和棋,那么legalMoves變量中的所有棋步都被加入當前結點的子節點中作為MoveNode,然后函數被調用來給這些子節點添加他們自己的MoveNode。

當結點的深度等于self.depth(這個例子中是2)時,什么也不做,當前節點的子節點保留為空數組。

遍歷樹

假設/我們有了一個MoveNode的樹,我們需要遍歷他,找到最佳棋步。這個邏輯有些微妙,需要花一點時間想明白它(在明白這是個很好的算法之前,我應該更多地去用Google)。所以我會盡可能充分解釋它。比方說這是我們的棋步樹:

如果這個AI很笨,只有深度1,他會選擇拿“象”吃“車”,導致它得到5分并且總優勢為+7。然后下一步“兵”會吃掉它的“后”,現在優勢從+7變為-2,因為它沒有提前想到下一步。

用Python編寫一個國際象棋AI程序_第1張圖片

在假設它的深度為2。將會看到它用“后”吃“馬”導致分數-4,移動“后”導致分數+1,“象”吃“車”導致分數-2。因此,他選擇移動后。這是設計AI時的通用技巧,你可以在這找到更多資料(極小化極大算法)。

所以我們輪到AI時讓它選擇最佳棋步,并且假設AI的對手會選擇對AI來說最不利的棋步。下面展示這一點是如何實現的:

          
def getOptimalPointAdvantageForNode(self, node) :
  if node.children:
    for child in node.children :
      child.pointAdvantage = self.getOptimalPointAdvantageForNode(child)
 
    #If the depth is divisible by 2, it's a move for the AI's side, so return max
    if node.children[0].depth % 2 == 1 :
      return(max(node.children).pointAdvantage)
    else :
      return(min(node.children).pointAdvantage)
  else :
    return node.pointAdvantage
        

這也是個遞歸函數,所以一眼很難看出它在干什么。有兩種情況:當前結點有子節點或者沒有子節點。假設棋步樹正好是前面圖中的樣子(實際中每個樹枝上會有更多結點)。

第一種情況中,當前節點有子節點。拿第一步舉例,Q吃掉N。它子節點的深度為2,所以2除2取余不是1。這意味著子節點包含對手的一步棋,所以返回最小步數(假設對手會走出對AI最不利的棋步)。

該節點的子節點不會有他們自己的節點,因為我們假設深度為2。因此,他們但會他們真實的分值(-4和+5)。他們中最小的是-4,所以第一步,Q吃N,被給為分值-4。

其他兩步也重復這個步驟,移動“后”的分數給為+1,“象”吃“車”的分數給為-2。

選擇最佳棋步

最難的部分已經完成了,現在這個AI要做的事就是從最高分值的棋步中做選擇。

          
def bestMovesWithMoveTree(self, moveTree) :
  bestMoveNodes = []
  for moveNode in moveTree :
    moveNode.pointAdvantage = self.getOptimalPointAdvantageForNode(moveNode)
    if not bestMoveNodes :
      bestMoveNodes.append(moveNode)
    elif moveNode > bestMoveNodes[0] :
      bestMoveNodes = []
      bestMoveNodes.append(moveNode)
    elif moveNode == bestMoveNodes[0] :
      bestMoveNodes.append(moveNode)
 
  return [node.move for node in bestMoveNodes]
        

此時有三種情況。如果變量bestMoveNodes為空,那么moveNode的值是多少,都添加到這個list中。如果moveNode的值高于bestMoveNodes的第一個元素,清空這個list然后添加該moveNode。如果moveNode的值是一樣的,那么添加到list中。

最后一步是從最佳棋步中隨機選擇一個(AI能被預測是很糟糕的)

          
bestMoves = self.bestMovesWithMoveTree(moveTree)
randomBestMove = random.choice(bestMoves)
        

這就是所有的內容。AI生成一個樹,用子節點填充到任意深度,遍歷這個樹找到每個棋步的分值,然后隨機選擇最好的。這有各種可以優化的地方,剪枝,剃刀,靜止搜索等等,但是希望這篇文章很好地解釋了基礎的暴力算法的象棋AI是如何工作的。

本文由 伯樂在線 - 許世豪 翻譯自 mbuffett


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 沅陵县| 江永县| 南部县| 鄂伦春自治旗| 中超| 丰县| 仙游县| 龙海市| 德安县| 修水县| 二手房| 济阳县| 凤阳县| 伊春市| 开远市| 常德市| 青田县| 闻喜县| 香格里拉县| 宁陕县| 金乡县| 邯郸县| 峡江县| 屏山县| 南通市| 邳州市| 思南县| 东乡| 武穴市| 余庆县| 衡南县| 惠水县| 应城市| 攀枝花市| 炉霍县| 马尔康县| 菏泽市| 额济纳旗| 满洲里市| 荥经县| 准格尔旗|