繼象棋之后 人機(jī)大戰(zhàn)為何選中圍棋?
問凝
關(guān)于人機(jī)大戰(zhàn),早在1997年,一臺(tái)叫做“深藍(lán)”的超級(jí)計(jì)算機(jī)在國際象棋上下贏了國際象棋冠軍卡斯帕羅夫。“深藍(lán)”是一臺(tái)超級(jí)計(jì)算機(jī),雖然跟人工智能程序Alpha Go好像不是同一回事,但是其實(shí)人工智能程序也需要以計(jì)算機(jī)作為載體才能工作,就像大腦也需要有身體才行。因此,把它們放在一起比較并不奇怪。而隨著超級(jí)計(jì)算機(jī)技術(shù)的不斷發(fā)展,即使是今天最普通的集成顯卡的性能也超過了700GFLOPS。“深藍(lán)”已經(jīng)從逐漸跟不上腳步到被甩開了一大截。值得一提的是,世界上最快的超級(jí)計(jì)算機(jī)是我們國家的天河2號(hào),其性能達(dá)到了33.86PFLOPS,是“深藍(lán)”計(jì)算機(jī)的30萬倍。
那么,跟“深藍(lán)”計(jì)算機(jī)相比,谷歌Alpha Go的性能又怎么樣呢?此前谷歌曾經(jīng)在《自然》雜志上發(fā)表過關(guān)于這個(gè)人工智能系統(tǒng)的文章,其中稱,Alpha Go人工智能的計(jì)算機(jī)裝有48個(gè)CPU和8個(gè)GPU。我們似乎無法將兩者放在一起直接比較,因?yàn)锳lpha Go是在云計(jì)算平臺(tái)上運(yùn)行的,我們可以通過競(jìng)爭對(duì)手的計(jì)算機(jī)數(shù)據(jù)來進(jìn)行大概的比較,比如阿里云。
2015年12月,阿里云對(duì)外開放高性能計(jì)算服務(wù)。這些計(jì)算機(jī)的單機(jī)浮點(diǎn)運(yùn)算能力是11TFLOPS。如果谷歌的計(jì)算機(jī)性能與阿里云接近的話,那么Alpha Go所驅(qū)動(dòng)的硬件的性能至少是深藍(lán)的1000倍。
說起圍棋和人工智能,我們可能多少都了解一些,不過二者是怎么聯(lián)系到一塊的呢?
那是因?yàn)闄C(jī)器戰(zhàn)勝人類,一個(gè)關(guān)鍵就是圍棋。擁有悠久歷史的圍棋高度反映了人類的智慧,圍棋棋盤縱橫19道,361個(gè)交叉點(diǎn),涉及到的可能出現(xiàn)的局面數(shù)量最大可達(dá)3^361,大致的體量是10^170,而已經(jīng)觀測(cè)到的宇宙中,原子的數(shù)量才10^80,國際象棋最大只有2^155種局面,這是什么概念?看似簡單的縱橫19道,361個(gè)交叉點(diǎn),形成了浩瀚的宇宙。所以有人說,圍棋是體現(xiàn)人類智慧的最好游戲,之前還有人預(yù)測(cè),人工智能(AI)需要再花十幾年才能戰(zhàn)勝人類,所以若拋去商業(yè)元素,這場(chǎng)比賽的意義可能在于見證歷史,足以說明當(dāng)前人工智能的技術(shù)研究已經(jīng)達(dá)到新高度。
AI下圍棋,究竟有多難?
難點(diǎn)1:圍棋對(duì)弈的基礎(chǔ)是死活的確認(rèn),確定棋盤上一塊棋的死活是最基本的,但要搞清楚一塊棋是死是活是非常困難的,而且,這種似死似活的狀態(tài)又是在不斷變化的。研究局部死活搜索是AI圍棋發(fā)展的一個(gè)難點(diǎn)。
難點(diǎn)2:棋形體現(xiàn)著人類形象思維獨(dú)有的特性,棋手對(duì)棋形的感覺完全依賴于自身的經(jīng)驗(yàn),而這種感覺恰恰是勝負(fù)的關(guān)鍵,也是棋手水平高低的標(biāo)志。人類棋手不愿意浪費(fèi)自己的棋子去無謂地攻擊對(duì)方活的棋形或無謂地試圖挽救自己死的棋形,要賦AI這種對(duì)棋形的感覺,則是人工智能面臨的重要課題。
難點(diǎn)3:此外,還需要研究特殊的算法來解決快速識(shí)別問題,著名的電腦圍棋程序設(shè)計(jì)者布恩說過: “有了快速的模式識(shí)別方法,就不難教程序利用手筋來吃棋。”所以說,模式識(shí)別算法是圍棋博弈程序的重要組成部分,高效的模式識(shí)別算法反映著博弈程序的水平,當(dāng)電腦的模式識(shí)別技術(shù)發(fā)展到能與人腦匹敵時(shí),電腦圍棋的棋力離專業(yè)九段就不遠(yuǎn)了。
簡單來說,一方面,圍棋規(guī)則非常復(fù)雜,每一步的調(diào)整,都會(huì)產(chǎn)生更多的可能,這對(duì)機(jī)器的計(jì)算能力要求很高。另一方面,即使機(jī)器中存儲(chǔ)了足夠多的已有圍棋大戰(zhàn)數(shù)據(jù),由于圍棋規(guī)則的復(fù)雜程度和棋手的無法預(yù)測(cè)的落子,對(duì)機(jī)器的應(yīng)變能力或深度學(xué)習(xí)能力有更高的要求。
4.下圍棋這么復(fù)雜,AI靠什么取勝?
上面說的那么難,難道AI就沒機(jī)會(huì)取勝了?NO NO NO~
為了擊敗人類,研究者們拿出了大殺器——這就是人工智能領(lǐng)域新一代的機(jī)器學(xué)習(xí)(machine learning)形式——深度學(xué)習(xí)(deep learning)和強(qiáng)化學(xué)習(xí)(reinforcement learning)。
深度學(xué)習(xí)的概念換句話說,就是讓計(jì)算機(jī)像人腦一樣去學(xué)習(xí)和思考。和傳統(tǒng)的機(jī)器學(xué)習(xí)不同,深度學(xué)習(xí)是把計(jì)算機(jī)科學(xué)和人類的神經(jīng)學(xué)結(jié)合起來,讓計(jì)算機(jī)自主學(xué)習(xí)。比如,不是由人告訴計(jì)算機(jī)這是一只貓,然后讓它來進(jìn)行識(shí)別和印證。而是給計(jì)算機(jī)提供大量的圖片數(shù)據(jù),讓它自己學(xué)習(xí)和分析,然后自主形成“貓”的概念,就像人類大腦的視覺皮層那樣反應(yīng)。有了具備深度學(xué)習(xí)能力的人工智能系統(tǒng),以后駕車出行時(shí),汽車就能主動(dòng)提醒你周圍的路況,還能應(yīng)用于語音和臉部識(shí)別、醫(yī)療診斷等領(lǐng)域。
強(qiáng)化學(xué)習(xí)一詞來自于行為心理學(xué),這一理論把行為學(xué)習(xí)看成是反復(fù)試驗(yàn)的過程,從而把動(dòng)態(tài)環(huán)境狀態(tài)映射成相應(yīng)的動(dòng)作。它類似于傳統(tǒng)經(jīng)驗(yàn)中的“吃一塹長一智”,強(qiáng)化學(xué)習(xí)可以做出策略選擇,廣泛應(yīng)用于下棋、走迷宮這一類別中。這種依賴于大數(shù)據(jù)和強(qiáng)大計(jì)算能力的被稱為“深度學(xué)習(xí)”的無監(jiān)督或半監(jiān)督機(jī)器學(xué)習(xí),使計(jì)算機(jī)可以在無需人力參與的情況下,完成原本只有經(jīng)過高度專業(yè)化訓(xùn)練的專業(yè)人士才能完成的任務(wù),甚至超過專家。
另外,為了達(dá)到更高的運(yùn)算能力,谷歌還把Alpha Go接入到了一個(gè)有1202個(gè)CPU組成的網(wǎng)絡(luò)中。這使得這個(gè)人工智能系統(tǒng)的計(jì)算能力在原來的基礎(chǔ)上增加了24倍。經(jīng)過推算,Alpha Go的性能大約是深藍(lán)計(jì)算機(jī)的2.5萬倍左右。按這個(gè)節(jié)奏計(jì)算,假如人類一年能玩1000局,AI一天就可能玩100萬局。所以Alpha Go只要經(jīng)過了足夠的訓(xùn)練,還是有可能擊敗人類選手。畢竟,人類在長時(shí)間的下棋比賽后,由于生理和心理限制可能會(huì)疲累,進(jìn)而犯錯(cuò),但機(jī)器不會(huì)。
不過谷歌董事長施密特表示,即使機(jī)器真的贏了,人類仍是贏家。即使AlphaGo機(jī)器最終贏了李世石,對(duì)于人工智能是否會(huì)“碾壓”人類,依然存疑,我們不必過于焦慮,人工智能可能還有很長的路要走。
歷史上的人機(jī)大戰(zhàn)
①深藍(lán)戰(zhàn)勝卡斯帕羅夫
1997年,美國IBM公司的“深藍(lán)”超級(jí)計(jì)算機(jī)深藍(lán)以二勝一負(fù)三平的戰(zhàn)績戰(zhàn)勝了當(dāng)時(shí)世界排名第一的國際象棋大師卡斯帕羅夫,成為贏家。
②浪潮天梭挑戰(zhàn)人類象棋大師
2006年的浪潮天梭超級(jí)計(jì)算機(jī),挑戰(zhàn)人類象棋大師一役,在最終的巔峰對(duì)決中,許銀川與浪潮天梭兩戰(zhàn)皆和。浪潮天梭向世人證明了自己超強(qiáng)的運(yùn)算能力。
③全才學(xué)霸沃森挑戰(zhàn)人類
2011年,“深藍(lán)”的同門師弟“watson”(沃森)在美國老牌智力問答節(jié)目《危險(xiǎn)邊緣》中挑戰(zhàn)兩位人類冠軍,并獲得成功。
④Alpha Go以5:0完勝歐洲冠軍樊麾
2016年1月,美國谷歌公司旗下的人工智能(AI)開發(fā)商“DeepMind”(位于英國)研發(fā)的圍棋電腦軟件“AlphaGo”(阿爾法圍棋)打敗了職業(yè)棋手樊麾,開創(chuàng)全球先河。
進(jìn)入21世紀(jì)后,科學(xué)研究從大數(shù)據(jù)、人工智能到虛擬現(xiàn)實(shí),從發(fā)現(xiàn)了類地球行星、引力波到無人駕駛、量子計(jì)算,這是一個(gè)創(chuàng)新不斷、驚喜不斷的時(shí)代,而我們有幸參與其中,這也許比單純討論比賽輸贏更有趣。