人機(jī)大戰(zhàn)人類終獲一勝 李世石一招挖出電腦Bug

原標(biāo)題:小李神之一招挖出電腦Bug

 

人機(jī)大戰(zhàn)人類終獲一勝 李世石一招挖出電腦Bug

 

人類終獲一勝,而且是以極具戲劇性的方式。昨天結(jié)束的人機(jī)大戰(zhàn)第四局,李世石在中盤階段第78手“挖”,被多位觀戰(zhàn)棋手稱為神之一招,此后電腦連續(xù)下出多步詭異的臭棋,觀戰(zhàn)網(wǎng)友戲稱其為死機(jī)性招法。期間“阿法狗”的作者黃士杰忍不住搖頭嘆息,就連小李也一度笑場(chǎng)。最后電腦中盤認(rèn)輸。局后,谷歌有關(guān)負(fù)責(zé)人稱電腦一度在形勢(shì)評(píng)估方面發(fā)生嚴(yán)重錯(cuò)誤,下了9手之后才恢復(fù)正常。而職業(yè)棋手多數(shù)認(rèn)為,也許電腦的棋路中回避打劫的傾向是導(dǎo)致這一連串失常的誘因。

 

李喆:更好的是小李的嘗試

 

此前在李世石0比3落后時(shí),外界的不少批評(píng)與質(zhì)疑都直指這位韓國(guó)棋手,但中國(guó)圍棋職業(yè)六段李喆一直對(duì)李世石給予肯定和尊重。在昨天接受北京晨報(bào)記者采訪時(shí),李喆表示,三局過(guò)后,他也終于找到了AlphaGo的弱點(diǎn)。

 

李喆認(rèn)為:“李世石做得很好,當(dāng)然他也有失誤,但圍棋AI的水平更高,在強(qiáng)大的對(duì)手面前不出現(xiàn)失誤是不可能的,在這個(gè)角度上指責(zé)他并不公正。”李喆最肯定的是李世石在不斷探索和嘗試:“他用了不同策略來(lái)試探,到現(xiàn)在為止,李世石應(yīng)該用了四五種不同的方式來(lái)攻擊電腦,終于在今天取得成功??梢哉f(shuō),如果沒(méi)有之前三局的嘗試,也不會(huì)有他今天的勝利。”

 

李喆在自己的個(gè)人公眾號(hào)上發(fā)布的多篇文章中,不斷強(qiáng)調(diào)他肯定李世石的原因:“一開始他是有好奇心的,他拋開了人類的自負(fù),努力去了解AI的思考方式。如果沒(méi)有這樣做,我們可能不會(huì)這么快了解到AlphaGo的特點(diǎn)”。

 

李喆認(rèn)為:“從第一局就可以看出,電腦是回避打劫的。第三盤出現(xiàn)打劫之后,電腦并沒(méi)有采取最佳處理方法。今天(13日)這一局很可能展示,電腦在面對(duì)打劫和與打劫相關(guān)的復(fù)雜局面時(shí)處理得并不好,可能出現(xiàn)這種情況與復(fù)雜計(jì)算有關(guān)。之前打劫是否能成為攻擊電腦的方向還是一個(gè)疑問(wèn),但今天李世石驗(yàn)證出了這一點(diǎn)。”

 

余平:打劫是它的弱點(diǎn)

 

作為職業(yè)棋手,余平六段少年時(shí)就在國(guó)家隊(duì)有著“電腦專家”的稱號(hào),他制作的圍棋程序YOGO,曾獲得過(guò)世界電腦圍棋大賽的第三名。

 

之前余平曾經(jīng)發(fā)表看法認(rèn)為,并不看好圍棋AI使用蒙特卡洛算法來(lái)對(duì)抗人類頂尖棋手,但在AlphaGo與李世石的“人機(jī)大戰(zhàn)”后,他在接受北京晨報(bào)記者采訪時(shí)表示,電腦人工智能這一次取得的突破令他震驚,但棋界不應(yīng)就此灰心。

 

在余平看來(lái),這一次的“人機(jī)大戰(zhàn)”前,職業(yè)棋手們很驕傲,認(rèn)為自己不會(huì)敗給電腦,但李世石前三局的失敗顛覆了棋界的看法,大家很沮喪挫敗。在圍棋領(lǐng)域,電腦這一次的成功在于他們的突破,余平分析說(shuō):“確實(shí)是讓我感到很震驚,因?yàn)閺囊郧暗那闆r看,電腦圍棋程序都是存在自己的Bug,比如Zen和Crazy Stone(瘋石)都是在蒙特卡洛算法基礎(chǔ)上研究的。之前電腦圍棋程序在這方面有明顯弱點(diǎn),但這一次谷歌的團(tuán)隊(duì)取得了突破,他們解決了這個(gè)問(wèn)題,他們將評(píng)價(jià)函數(shù)與蒙特卡洛算法整合了,這就變得更強(qiáng)。”

 

這一次AlphaGo取得了勝利,但余平認(rèn)為,職業(yè)棋手們不應(yīng)就此氣餒:“李世石做了一個(gè)嘗試,雖然這一次他輸了,但并不是說(shuō)AlphaGo就沒(méi)有弱點(diǎn)。比如第三局,李世石做了一個(gè)劫,AlphaGo對(duì)此的處理并不是很好,這是很重要的信息,因?yàn)檫@體現(xiàn)了它的弱點(diǎn)。”

 

雖然余平認(rèn)為,圍棋AI終將戰(zhàn)勝人類棋手,但現(xiàn)在遠(yuǎn)沒(méi)到推盤認(rèn)負(fù)的時(shí)候:“可以被消滅,但不能被打敗”。

 

柯潔:我們也幫電腦抓抓Bug

 

當(dāng)李世石與AlphaGo鏖戰(zhàn)時(shí),18歲的中國(guó)棋手柯潔九段也因自己的言論受人關(guān)注。不過(guò)從一開始認(rèn)為AlphaGo無(wú)法擊敗自己到現(xiàn)在,柯潔的態(tài)度似乎也在逐漸變得客觀。

 

今年1月,柯潔擊敗李世石,成為目前圍棋界的“第一人”。對(duì)于“人機(jī)大戰(zhàn)”,柯潔也十分關(guān)注,李世石輸?shù)羰拙趾螅聺嵏挛⒉┓Q:“就算‘阿法狗’戰(zhàn)勝了李世石,但它贏不了我”。對(duì)于一些網(wǎng)友的質(zhì)疑,年少氣盛的柯潔很快又發(fā)布了一條微博,列出了自己之前所取得的成績(jī)。

 

李世石第二局再負(fù)于AlphaGo時(shí),柯潔的態(tài)度是“不服氣”:“大部分職業(yè)棋手都不服氣,覺(jué)得李世石下得太糟糕了。在那時(shí),柯潔認(rèn)為如果自己對(duì)戰(zhàn)AlphaGo,勝算應(yīng)該在六七成。”

 

AlphaGo取得三連勝時(shí),不少聲音都開始傾向柯潔,希望他之后也能出戰(zhàn),這位少年棋手自己也在當(dāng)天深夜發(fā)微博表示:“來(lái)吧!管你是阿法狗還是阿法貓!我柯潔在棋上什么大風(fēng)大浪沒(méi)見(jiàn)過(guò)?讓暴風(fēng)雨來(lái)得更猛烈些吧!”當(dāng)昨天李世石終于扳回一局后,柯潔似乎也松了口氣:“電腦系統(tǒng)在短兵相接的時(shí)候也會(huì)出現(xiàn)漏洞,我之前雖然很生氣好多人都說(shuō)電腦下圍棋完美,但卻沒(méi)法反駁——畢竟人沒(méi)有贏,所以現(xiàn)在看,還是要多試幾盤,我們也幫電腦抓抓Bug。”

 

■名詞解釋

 

余味

 

圍棋術(shù)語(yǔ),在某個(gè)局部為今后的戰(zhàn)斗留下契機(jī)。本次人機(jī)大戰(zhàn),人類雖敗局已定,但尋找電腦漏洞以利下次再戰(zhàn)的努力從未停止。

 

■鏈接

 

四局神劇情

 

AlphaGo英文意思是“阿爾法圍棋”,網(wǎng)友一般稱其為“阿法狗”。Alpha是希臘字母中的第一個(gè)字母,Go在日語(yǔ)里是“圍棋”的意思,但這一詞其實(shí)最早起源于中國(guó)古代吳語(yǔ)中“棋”的發(fā)音。

 

人機(jī)大戰(zhàn)已進(jìn)行了四局,AlphaGo3比1領(lǐng)先李世石,四局的進(jìn)程堪比一部連續(xù)劇。

 

第一局,李世石以無(wú)譜布局進(jìn)行試探,但這一策略失敗,最終告負(fù)。

 

第二局李世石多次回避打劫,輸?shù)舯荣惡笠鹁薮鬆?zhēng)議。次日,AlphaGo的設(shè)計(jì)者黃士杰公開辟謠否認(rèn)有“禁止打劫”這樣的協(xié)議。

 

第三局,第一次出現(xiàn)打劫局面,但AlphaGo當(dāng)時(shí)已有巨大的優(yōu)勢(shì),最終中盤取勝。

 

第四局中,李世石下出“神之一手”,AlphaGo出現(xiàn)諸多失誤,最終系統(tǒng)判斷告負(fù)。職業(yè)棋手普遍認(rèn)為,AlphaGo的失誤是由于其回避打劫的策略造成的。