電競體談 | AI崛起,凡人退散?言之過早了

乏善可陳的“VR年”過后,全球都將AI看作IT行業(yè)的新風(fēng)口。和AI一樣,電競也依托于虛擬網(wǎng)絡(luò),這兩者存在非常巨大的互融空間。電競是AI的最佳試驗(yàn)場,而AI的發(fā)展也會(huì)極大改變電競行業(yè)的面貌。但僅從TI7的solo對抗而言,說AI戰(zhàn)勝Dendi是劃時(shí)代的勝利還為時(shí)過早。
AI有沒有那么神奇
TI7期間,久違的Dendi出現(xiàn)在比賽現(xiàn)場。不過他過來并不是參加正式比賽,而是跟AI程序打了兩場solo友誼賽,0比2慘敗。吊打Dendi的AI來自O(shè)penAI公司,據(jù)說明年TI8它們就要組團(tuán)跟人類選手打5v5比賽了。
整個(gè)2017年,AI被視為IT行業(yè)風(fēng)口,包括谷歌、騰訊、百度都在發(fā)力。OpenAI亮相TI7,很大程度上是在蹭熱點(diǎn),solo戰(zhàn)勝Dendi說明不了太多。
人工智能?還早的很呢!
OpenAI的投資人包括了埃隆·馬斯克(Elon Musk),他麾下的特斯拉被視為世界上最好的電動(dòng)汽車。他說:“OpenAI首次在電競比賽中擊敗了世界上最棒的選手,這比在象棋和圍棋那種傳統(tǒng)桌面游戲的范疇要復(fù)雜得多。”
不過這年頭,造電動(dòng)汽車的不僅有馬斯克,也有賈躍亭。他們對自己產(chǎn)品的褒獎(jiǎng),不僅要聽其言,更要觀其行。
馬斯克這句話就有點(diǎn)偏離事實(shí)。
首先,這只是電競solo比賽,不是正式電競比賽。而且Dendi老司機(jī)現(xiàn)在是世界上最棒的選手嗎?剛拿到TI7冠軍的miracle笑而不語。
其次,舞臺上Dendi確實(shí)被OpenAI打的灰頭土臉,但隨后幾天各路玩家就用野路子教AI做電腦了。前Navi選手Pajkatt仙靈火大魔棒出門,直接懟翻;有人風(fēng)靈出門直接繞后勾兵,AI不知所措;還有人出門不學(xué)“死靈支配”學(xué)“影壓”,直接越塔擊殺正在專心卡兵的AI……
可見這個(gè)AI離完美還遠(yuǎn)得很,微操無敵,大局觀堪憂,很容易被人類玩家針對。
第三,電競和象棋、圍棋,不能膚淺地說誰更復(fù)雜。
人類跟電腦是兩種模式,人類擅長擬人化抽象化,機(jī)器擅長數(shù)據(jù)化規(guī)?;O笃?、圍棋誕生于人類手下,但它的思維模式其實(shí)相當(dāng)數(shù)據(jù)化。棋類游戲規(guī)則很明確,而且是回合制,所以AI比較容易取得算法上的突破。電競游戲誕生于電腦平臺,但它的思維模式卻非常擬人化,做AI算法的難度是相當(dāng)高的。
簡單說,人類下棋易學(xué)難精,AI打電競也是易學(xué)難精,并不存在誰高誰下。
棋類AI與電競AI
前陣子,谷歌DeepMind開發(fā)的阿爾法狗完勝李世石和柯潔,被看做是AI的里程碑,其引發(fā)的轟動(dòng)比早年深藍(lán)戰(zhàn)勝國際象棋第一人卡斯帕羅夫大得多。
為什么呢?
棋類AI的思路較為明確:利用電腦超高運(yùn)算能力,把所有能走棋的路徑都走一遍,選擇勝率最高的路徑,這叫“樹搜索”。
和圍棋比,象棋變化相對較少。根據(jù)手頭查閱的資料,國際象棋窮舉變化數(shù)大概10的46次方,“樹搜索”比較容易成功。但圍棋窮舉變化數(shù)為10的172次方,比宇宙所有原子的總數(shù)還高幾十個(gè)數(shù)量級,也大大超越了當(dāng)前計(jì)算機(jī)的窮舉能力。為此,DeepMind為阿爾法狗引入了學(xué)習(xí)和場上形勢判斷機(jī)制。它自己左右互搏,每天下幾十萬盤棋,每一盤棋都成為之后的經(jīng)驗(yàn)。從結(jié)果看,DeepMind的算法很完美,阿爾法狗在棋盤上的學(xué)習(xí)能力是驚人的。
從單純暴力窮舉,到深度學(xué)習(xí),這是了不起的進(jìn)步。
當(dāng)然,DeepMind的學(xué)習(xí)量也靠谷歌計(jì)算機(jī)強(qiáng)大的性能實(shí)現(xiàn)的。據(jù)說阿爾法狗有超過170個(gè)GPU,粗略估計(jì)有超過800萬核并行運(yùn)算。
電競游戲AI設(shè)計(jì),并不能完全照搬棋類AI。
初一看,電競游戲計(jì)算量比不上圍棋。但圍棋的決策機(jī)制是相當(dāng)簡單的,只需要選擇一個(gè)點(diǎn)位下子就行,而電競游戲決策機(jī)制非常復(fù)雜(走位、攻擊、正補(bǔ)、反補(bǔ)、施法、使用物品、搶神符、開霧、打roshan),且存在非常多因果邏輯不明確元素。單個(gè)決策元素而論,電競游戲的變化數(shù)遠(yuǎn)遠(yuǎn)少于圍棋,但所有元素疊加在一起取乘法時(shí)整體變化數(shù)驟然膨脹。從這次solo比賽也能看出來,野路子玩家斷兵時(shí),AI不知所措。說明在AI之前左右互搏學(xué)習(xí)過程中,并未遍歷到這一情形。
最關(guān)鍵的一點(diǎn),圍棋是回合制,電競游戲卻是即時(shí)制。
在圍棋比賽中,AI落子前有足夠長的時(shí)間去進(jìn)行“樹搜索”。而電競比賽中,形勢瞬間萬變,AI決策時(shí)間勢必要縮短。OpenAI的細(xì)節(jié)不得而知,據(jù)我猜測,AI的決策一定是離散化的,而且決策時(shí)間間隔與人類的APM差不多。證據(jù)是OpenAI官方說法“AI 的每分鐘操作數(shù)相當(dāng)于人類玩家的平均水平”。按照人類平均APM為150計(jì)算,AI的決策時(shí)間差不多為70ms,只有圍棋比賽的千分之一到萬分之一。短短70ms中要算清場上情勢,對各種可能選擇進(jìn)行優(yōu)劣判斷,難度太大。要想進(jìn)行DeepMind那樣的樹搜索,OpenAI的性能必須在DeepMind的萬倍以上,這顯然不可能。
到這里,我們似乎可以理解官方所說的“該 BOT 通過自學(xué)從頭學(xué)習(xí) DOTA2,但并沒有使用模仿學(xué)習(xí)或樹搜索”。
非不為也,實(shí)不能也。
從TI7的表現(xiàn)來看OpenAI的學(xué)習(xí)才剛剛開始,很多局面根本應(yīng)付不來。這只是solo,正式5v5比賽的復(fù)雜度又上一個(gè)量級,對AI將是更大的挑戰(zhàn)。
據(jù)說OpenAI明年TI8會(huì)跟明星選手們打一場5v5,我建議:人類選手要想提升勝率,拼微操和團(tuán)戰(zhàn)是不行的,野路子(增加AI決策的變數(shù))才是王道,多換線,多開霧,多插眼,多使用隱身英雄,多使用推推等位移道具。
按圖靈的定義,如果一臺機(jī)器能與人類進(jìn)行交互,而人類沒辦法分清楚它到底是機(jī)器還是人,這才是成功的AI。從這個(gè)角度看,五個(gè)AI打五個(gè)人類也不算稀奇,AI與人類的搭配才是終極考驗(yàn),不過這已經(jīng)是后話了。
成熟的AI對電競來說值得期待
就開發(fā)AI而言,電競游戲是最好的試驗(yàn)品,因?yàn)樗骖檾?shù)據(jù)化基礎(chǔ)和人性化表象。游戲里的AI即便失敗,造成的損失也比較有限。除了OpenAI,谷歌也在跟暴雪展開合作,用DeepMind開發(fā)《星際爭霸2》的AI,這將給現(xiàn)實(shí)中的AI研究積累非常寶貴的經(jīng)驗(yàn)。
盡管電競AI還處于起步階段,但未來的潛力不容小覷。數(shù)年前我們不也認(rèn)為AI不可能學(xué)會(huì)圍棋的么?IT行業(yè)變化太快,永遠(yuǎn)不要說“不可能”。
最后遐想一下,如果電競游戲里的角色有AI,游戲體驗(yàn)將有革命性的提升,這或許將給游戲開發(fā)開拓新的領(lǐng)域。AI成熟后,AI代打必然泛濫,未來的電競游戲天梯或許也將失去意義。AI配合VR技術(shù),未來人類會(huì)不會(huì)真的可能愛上游戲中的異性角色?不能想,太可怕了……