【聲明】港生活網站並無進行電話推廣活動

棋王AlphaGo進化 自學3天完勝舊版

發佈時間: 2017/10/20

曾經擊敗多位人類頂尖圍棋好手的人工智能程式AlphaGo再進化,更具備自我學習功能,無師自通自學成才,只花3天「左右互搏」就完勝舊版本的AlphaGo,被形容為「用40天時間就自學了人類累積了三千年的知識」。

AlphaGo是Google旗下DeepMind團隊開發的人工智能程式,之前版本分別擊敗多位棋王,時隔5個月DeepMind又發表更進化的AlphaGo Zero。

舊版AlphaGo在於曾受多名圍棋好手教導數百萬手旗的下法,自己亦能預計勝算後調整策略。AlphaGo Zero的優勝之處,在於能自己摸索創造知識,未使用任何人類棋譜,開發員只教導基本玩法,從零開始學習圍棋規則,透過神經網路強大的搜索算法跟自己對弈學習棋藝,從數百萬手棋中找出最佳的對弈方法,逐漸調整提升預測下一步的能力。

「40天摸通三千年心得」

經過3日自學後,棋術已超越曾戰勝南韓棋王李世乭的AlphaGo Lee,賽果為100:0;自行學習21日後,其技術已與曾擊敗世界第一、中國棋手柯潔的AlphaGo Master看齊;40日後,AlphaGo Zero棋藝超越所有的AlphaGo版本,更自創過去人類根本不知道的新策略走法,顯示出它所具有的創意,開發員形容它「自學了人類三千年才累積得來的知識」,是一次里程碑。