李世石:谷歌圍棋軟件并非我對手

2月22日,韓國李世石九段對谷歌人工智能阿爾法(Alpha GO)的“人機大戰(zhàn)”第二次新聞發(fā)布會在韓國棋院舉行,李世石堅持認為“五番棋自己不會輸一盤”。
Deep Mind公司CEO兼谷歌副總裁戴密斯·哈薩比斯從倫敦視頻連到新聞發(fā)布會現(xiàn)場。他說:“無論勝負如何,谷歌DeepMind團隊都會藉此開發(fā)出更加智能化的系統(tǒng)。為了開發(fā)人工智能,我們采用游戲為測試工具,但終究來說我們的目的并不是研究游戲,而是把我們掌握的技術(shù)適用于現(xiàn)實的世界。”目前圍棋被公認為是電腦程序尚未攻克的“人類智慧堡壘”,而在1997年和2006年,國際象棋、象棋軟件已經(jīng)打敗了人類最高級別棋手,等于說,電腦在國際象棋、象棋領(lǐng)域已經(jīng)沒有對手。
谷歌人工智能在圍棋領(lǐng)域的突破因于“深度學習”(Deep Learning),是目前人工智能領(lǐng)域中最熱門的科目,它能完成筆跡識別、面部識別、駕駛自動汽車、自然語言處理、識別聲音、分析生物信息數(shù)據(jù)等非常復雜的任務(wù)。阿爾法如果打敗李世石,等于宣布谷歌人工智能攻破人類“智慧堡壘”,世界著名雜志《自然》評論:意義或許不亞于我們第一次接觸外星生命。
這天的新聞發(fā)布會吸引了200多名記者,超過之前任何一次圍棋活動。圍棋圈外的媒體也被吸引過來,就在“人機大戰(zhàn)”日程確定后,中國的騰訊網(wǎng)、樂視網(wǎng)都將赴比賽現(xiàn)場進行全方位直播。這在以前的純粹圍棋比賽中難得一見。
李世石坦承:“阿爾法在時間上還不夠充分,大概5個月的時間,也就是更新提高了4個多月吧,也就是阿爾法的實力還沒有得到充分的提高,我想還需要1年或者1年以上的時間,才能夠形成真正的勝負。這次比賽的難點在于,不是和人下。我是按我的方式做準備,也就是假想對局。入睡前花一兩個小時,用腦子假想對局。”
阿爾法的實力究竟如何,李世石答道:“我可以讓先的水平。去年10月和樊麾二段較量的阿爾法實力,還不足以和我爭勝負。現(xiàn)在時間過去半年,阿爾法的實力肯定得到提高,但這次比賽不是3比2那種比分的勝負,而是看我會不會輸一盤。”
為何選定李世石為阿爾法的挑戰(zhàn)對象?戴密斯·哈薩比斯說:“既然是會載入史冊的比賽,就需要挑戰(zhàn)傳奇棋手。我們認為十年以上稱霸世界棋壇的李世石九段是最適合的對手。”
還有,比賽為何采取中國規(guī)則,而不是韓國規(guī)則?戴密斯·哈薩比斯答道:“過去十八個月,阿爾法都是按中國規(guī)則開發(fā)和訓練,所以短期內(nèi)很難讓阿爾法適應(yīng)韓國規(guī)則并提高實力。”對于電腦程序而言,收完棋盤上所有單官,用數(shù)子法確定勝負顯然比比目法更易于掌握。
現(xiàn)在比賽的唯一懸念在于:從2015年10月阿爾法對樊麾二段的比賽結(jié)束后,其水平會驟升到何種程度?戴密斯·哈薩比斯解析:“圍棋的變化非常龐大,靠窮舉計算是很難取勝。哪怕是世界最強的超級計算機,也難以辦到。就是以后出現(xiàn)更先進的計算機,恐怕也是做不到。圍棋可下的變化,可以說接近無限。阿爾法靠兩層神經(jīng)網(wǎng)縮減變化的數(shù)量。第一層神經(jīng)網(wǎng)是‘政策網(wǎng)’,會提出可行的下一手,那么無限蔓延的搜索樹立刻會縮小范圍。第二層神經(jīng)網(wǎng)‘價值網(wǎng)’會提示黑白哪一方更好,而且好多少,并提示和限制算路的范圍。舉例說國際象棋每下一步會搜索約2億個變化,阿爾法是只須考量10萬個變化。雖然10萬個變化依然比1000個變化要多,但計算機為此減去了很多負但。”
谷歌公司為此次“人機大戰(zhàn)”勝者準備了100萬美元獎金,此外李世石還有對局費。下滿五盤并贏得比賽的話,他可以獲得125萬美元。