【世界】為圍棋界抹把汗 圍棋迷看AlphaGo與人類世紀大戰

撰文:顏石
出版:更新:
哈薩比斯在賽後記者會上說,AlphaGo 的勝利並不是人類的失敗,剛好相反是人類的勝利,AlphaGo 是人類智能的結晶。雖說是外交辭令,但我很同意,也很樂意看到 AlphaGo 的大勝,我的理由比較低俗,老夫子漫畫說:「人吃魚,沒人看;魚吃人,才好看。」
顏石
AlphaGo 對奕李世石的人機大賽,作者當時全程觀看即時大賽。(Getty Images)

文:顏石

由 Google DeepMind 公司開發的電腦圍棋軟件 AlphaGo 對奕韓國九段棋士李世石的人機大賽,於 2016 年 3 月在南韓首爾舉行,結果 AlphaGo 以 4 比 1 擊敗李世石。作者是狂熱圍棋迷,當時全程觀看即時大賽,目睹中國棋士即場反應,深有感觸,撰文回顧此一世紀大賽對中國棋壇的沖擊。

今年 1 月 28 日出版的 Nature《自然》雜誌刊登了 AlphaGo 5 比 0 擊敗歐洲圍棋冠軍樊麾(中國職業二段,2000年移居法國,3 屆歐洲冠軍,後成為法國圍棋總教練)。這條消息值得放在大名鼎鼎的《自然》封面上嗎?在此之前,電腦界和圍棋界一般估計,電腦要十幾二十年後才能打敗職業棋手。所以這次突如其來的消息除了圍棋界吃驚,連電腦界也大感意外。《自然》的着眼點是人工智能(AI)強大的計算力。幾十年來眼看電腦把各種棋類攻陷,除了圍棋:號稱人類智能最後的堡壘。這正是 AI 要堅攻的科題。

今年 1 月 28 日出版的 Nature《自然》雜誌刊登了 AlphaGo 5 比 0 擊敗歐洲圍棋冠軍樊麾。(《自然》雜誌封面)

人工智能勝人 棋壇生態變天

樊麾輸了棋之後,回到祖國北京,和當年國家少年隊的師兄弟飲酒敘舊,想把他成為全世界第一個被機器擊敗的職業棋手這樁悲慘遭遇和盤托出。但因和 Google 有保密協議,在《自然》出版前不能公開他和 AlphaGo 的任何消息。所以他雖然在酒精的刺激下也沒有違約洩密,只是半醉半醒不停的說:不得了了、出大事了、要變天了,等等。幾個師兄弟都一頭霧水,不知道大難就要臨頭。

在圍棋界,一般職業棋手都要在 10 歲左右就要被人認為是圍棋神童(不是萬中選一的神童,誰會傻到去選擇這條不歸路),然後要拜師學藝。學圍棋和學語言一樣,要在很年幼的時候開始,中國棋諺:「20 歲不成國手,終生無望。」日本也有類似的說法:「12 歲進不了段,成不了本因坊!」其艱苦的過程絕對不會比考名牌大學的什麼醫生律師容易。那邊廂突然來了一隻圍棋神獸「阿發狗」!雖然不一定大難臨頭,但肯定影響棋界的生態環境。

AlphaGo 影響到棋界的生存空間,職業棋手當然關心。那為什麼電腦界也震驚呢?電腦圍棋出現已有三四十年,早期的程式棋力非常弱,可以用慘不忍睹來形容,這也是為什麼後來的棋手都看不起電腦圍棋,中國圍棋英雄聶衛平九段(1980 年代 4 屆中日圍棋擂台賽中 11 連勝日本高手,掀起了中國的圍棋熱潮,對中國近年圍棋的發展影響很大,很有江湖地位)曾參觀了一次電腦圍棋,看了一眼就罵帶他來看棋的人:這種棋也叫我來看。要到最近 10 年才有比較強的電腦圍棋出現,大概有業餘五六段的棋力,這已經是業餘最高水平了,有很多棋迷終生都達不到這個程度。但這個水平和職業棋士的實力還差讓四子。這中間的差距就像愛恩斯坦和一個高中生的差距,恕我找不到更恰當的比喻。Google 在開發 AlphaGo 時並沒有向外界透露,所以電腦圍棋圈子都不知道他們已被 AlphaGo 遠遠拋離,這種突如其來的成就,對業界其它研究者都是非常震撼的。

三屆歐洲圍棋冠軍樊麾來自中國,屬於專業二段。(Google提供圖片)

兩年多前英國 DeepMind Technologies 公司兩個研究神經網絡、同時也是圍棋愛好者的工程師用他們開發的神經網絡軟件來試玩圍棋,他們很驚訝地發現自己的軟件能很輕易就達到相當高的水平,於是把這個意外的發現報告給公司老總哈薩比斯(Demis Hassabis)聽,還分析說照這個勢頭有可能他們會打破電腦圍棋界多年的瓶頸,很快就有可能達到職業棋手的實力。哈薩比斯聽了之後馬上就說:「那一定要確保是由我們來完成!」哈薩比斯何許人也?他出身於英國倫敦,父親是希臘裔,母親是華裔。13 歲就成為國際象棋大師,16 歲中學畢業,開始寫電腦遊戲程式,17 歲就成功推出大受歡迎的電腦遊戲,賣出了數百萬套。之後離開了這家令他賺了第一桶金的公司,進了劍橋大學讀電腦,畢業後進了 AI 公司,做了幾年又去了倫敦大學讀認知神經科學,拿了博士學位。2010 年創辦了 DeepMind Technologies,一家專研機器學習(machine learning)的 AI 公司。2014 年 Google 用 4 億英鎊(約 6.25 億美元)的天價收購了 DeepMind,成為了當時的新聞。

哈薩比斯 2010 年創辦了 DeepMind Technologies,2014 年 Google 天價收購了 DeepMind,成為了當時的新聞。(Getty Images)

電腦只要贏 人要贏得靚

Google 在 1 月底除了公佈 5 比 0 贏樊麾二段,還宣告天下會在今年 3 月挑戰世界冠軍李世石九段,5 盤 3 勝制,獎金 100 萬美元。這個消息在棋界造成的轟動,並不比機器贏了人類這件事來的低。AlphaGo 和樊麾下的 5 局棋是在去年 10 月,距離今年 3 月要和李世石的人機大賽只不過 5 個月,不到半年的時間。棋手們根據樊麾 5 局棋的棋譜來看,絕大多數專家都認為 AlphaGo 並不怎麼樣。樊麾自己則辯說他已盡了全力,並不是他一時發揮不好,而是 AlphaGo 實在強大,他原有的棋力手段好像都無法使出來。但專家還是認為樊麾和李世石沒法比,贏了樊麾不代表什麼。他們非常了解李世石的厲害;看了 AlphaGo 棋譜,他們也大約知道 AlphaGo 的水平,他們以為。

程式AlphaGo去年與三屆歐洲冠軍樊麾對弈,5局全勝。(DeepMind截圖)

圍棋專家對棋的判斷力,沒人可以質疑。但他們對 AI 深度學習(deep learning)自我提昇的能力,就和普通人一樣:一無所知。有棋手說他能讓 AlphaGo 四個子;聶衛平甚至說電腦圍棋是騙人的,不可能贏人,就是聶衛平說樊麾丟人,這種長期做慣英雄,目中無人的棋壇霸主,可以隨便罵人而沒人敢吭一聲,事後 AlphaGo 贏了李世石 2 比 0 之後,他說要向 AlphaGo 致敬,但聶衛平有沒有向他的同行樊麾致歉呢?圍棋專家們對 AI 的輕視是可以理解的,到底誰也沒有見識過什麼深度學習,什麼神經網絡,除了去國在巴黎的樊二段。可是他們為什麼就不停下來想一想,人家 Google 傻呀,無端端拿100 萬來跟你玩泥沙呀?雖說 100 萬對 Google 這種跨國大公司不算什麼,但人家不會評估呀?你在明他在暗,你們的棋他都知道,他的棋你就只看到樊五局。5 個月的時間好像不是很長,但這段時間,電腦能下的棋局比一個專業棋手一生人下的棋都要多的多。還有一點很容易被人忽略,就是電腦的目標只有一字:贏,而且是最安全最穩紮的贏。圍棋這個遊戲是看圍得多少地,圍的多就贏,贏 100 點地和贏 1 點地都沒有分別,一樣是贏。舉例:如果現在棋盤上出現兩個選點,A 點能好漂亮大勝 100 點,但有少少風險;而另一個 B 點只能贏 1 點,卻沒有什麼風險。面對 A 或 B 的選擇,人類就可能要看心情,看以往的成績,甚至要看教練隊友的臉色,等等來決定 A 還是 B。但電腦就一定會選 B。所以,驟眼看來,電腦下出來的棋,會給人不怎麼樣的觀感,甚至有點遲緩難看。像賽跑,如對手跑的快,你一定要比他快才能贏,所以遇強越強;如對手跑的慢,你不是要破世界紀錄,你只是想贏他,跑的比他快一點點就可以了,不用太快,因跑的太快有可能會容易受傷出意外等等的風險。AlphaGo 這種「遇強愈強,遇弱不怎麼樣」的棋風,便有可能誤導了專家棋士對 AlphaGo 的評估。

九段棋士李世石早於12歲已是職業棋手,出賽多年。(美聯社)

Google 選世界冠軍李世石做對手是恰當的。世界冠軍是指曾經拿過國際大比賽的冠軍,不是真的有一場圍棋世界冠軍大賽,如世界杯足球賽。所以中國、日本、南韓同時都有很多世界冠軍。Google 除了想揚名立萬:贏,還想有一個超級對手使出各種刁鑽罕見的招法來完善自己的軟件 AlphaGo,並不想和一個棋風斯文的高手對奕。李世石恰好是他們要的棋手。

在這麼多的世界冠軍,南韓李世石九段也是很特出的,他拿過 18 次國際大賽冠軍,棋風刁鑽橫蠻,時有神來之筆,戰鬥力特強的「殭屍流」令對手提心吊膽,他後來在與 AlphaGo 第 4 局使出了「神之一手」把電腦擊倒,絕非偶然。

在西方,圍棋上不了報,沒多少人玩。雖然 Google 預料 AlphaGo 在南韓有新聞價值,但當他們看到記者會上人頭湧湧,比伊拉克戰爭時的白宮記者會還要熱烈轟動,這確實出乎他們最大的預期。YouTube 英語直播全球有 10 萬人看, 中國有數個電視台同時直播,觀看人數達 6,000 萬,而這還是平常上班時間。加上南韓、日本的人數,全球有超過一億人在觀看直播。這在圍棋 3,000 年的歷史裏,還是第一遭。當職業棋士擔心電腦帶來災難時,電腦卻帶來了他們發夢也沒有想到的新機遇。

李世石在首盤不敵AlphaGo後表示,沒想到它會下得這麼好。(路透社)

小李出神手 AlphaGo 輸也贏

五局三勝制,誰先贏 3 局就可拿獎金 100 萬,但合同定明就算中途一方贏了 3 局,也要把 5 局下完。很簡單,AlphaGo 除了想要證明自己,最終還是想向高手深度學習,改善自身的棋力。

第 1 局,中國的電視直播也找來了電腦專家,他只不過很有禮貌的說 AlphaGo 可能會給李世石帶來驚訝,意思是有可能 AlphaGo 會贏,同台的嘉賓主持人都是職業棋手,馬上就起哄訕笑起這位研究電腦圍棋多年的教授,要和他打賭如「阿發狗」輸棋要他在電視台上扮狗爬。結果教授一語成讖,但也只說對了一半。AlphaGo 後來何止讓李世石驚訝,它簡直讓所有人類目瞪口呆(是的,很誇張,是人類,你沒看錯)。這第 1 局李世石選了一個沒人下過的佈局,原因可能是李認為用電腦數據庫裏找不到的招法,能讓電腦不知所措。誰知道 AlphaGo 根本不用數據庫,它每一步棋都不是從數據庫裏找一個固定的招法。它是根據棋局當場運算找出勝率最高的一步棋。第 1 局棋李世石輸了,中國棋手的情緒都非常低落,這次他們成了無國界義士,把李世石提昇到了人類的代表,同仇敵愾,雖然有點好笑,但倒也不失可愛。我相信韓國人更是不好受。

第 2 局,白子李世石不敵黑子AlphaGo。(Google圖片)

在一遍哀鴻遍野中,次日馬上迎來了第 2 局,AlphaGo 開局用了許多俗手,不按常規下,步法無理, 評論員都這樣認為,他們忍不住很是為小李開心。接着 AlphaGo 下出第 37 手「五路肩沖」,這一手是令聶九段脫帽致敬的一步棋,也是這場大賽 5 盤棋裏最令人注目的一步天外飛仙。李世石看了這步棋,木無表情就站了起來離開座位,比賽時鐘一秒一秒的飛逝,用的是李世石自己的比賽時間,聽說是去了洗手間洗了一把臉。當時在直播室的專家看到這步棋,以為是替電腦放棋子的人放錯位置,或記錄員記錯譜,當知道電腦真的這樣下的時候,世界冠軍古力和中國圍棋國家隊總教練俞斌馬上哈哈大笑,笑聲中更帶着嘲諷,又氣又好笑的樣子非常雀躍,替小李歡呼、更替他們自己歡叫。這次你還不死?我們人類的尊嚴那容你來這裏撒野!(真的,他們用了人「類的尊嚴」,作者沒有修辭加工。)當他們笑完之後冷靜下來,棋局慢慢進入中局,這時有的高段棋手世界冠軍驚訝的發覺局勢竟然是 AlphaGo 佔優,這一驚非同小可。一直要到李世石中盤投子認輸,人們才驚醒過來。這時候人類的心防被打的七零八落,但還抱着一絲希望的救命草,希望李世石最後能連贏 3 局反敗為勝。

第 3 局又在大家認為小李會贏的局勢下,最後輸掉這局棋,也輸掉了這場比賽,輸掉了 100 萬。

李世石苦戰多日,比賽期間很苦惱。(DeepMind Youtube 截圖)

第 4 局已不是為了金錢、尊嚴而戰了,因兩者都輸掉了。李世石只好拋掉一切雜念,輕裝上路,為自己而戰。一路奮戰,到了中盤又被 AlphaGo 逼到懸崖邊,眼看就要給推落萬丈深淵,絕望中人類的代表拋出了第 78 手「小李飛刀」,被世界冠軍古力譽之為神之一手。最戲劇性的結果是強如 AlphaGo 對這步將要名留棋史的妙手竟然手足無措以至完全亂套。能把世界冠軍打到 3 比 0 的人(對不起,作者已忘了他不是人了),居然下出了初學者的機器招了。賽前專家們預測機器的暈招竟然在賽果已定時發生。接着 AlphaGo 就中盤投降認輸。賽果 3 比 1。Google 輸了這局棋,工程師當然大為緊張,漏夜查找不足。我是他們的話,也會緊張但同時也會有一絲興奮,贏了比賽又能找到自身隱蔽的弱點,預定的兩個目標都達到了!軟件維護,最難的不是如何修理,而是不知道毛病在哪裏或根本不知道有毛病。李世石這次幫了他們一個大忙。

接着第五局 AlphaGo 又無懈可擊的贏了。

對圍棋士來講,把 AlphaGo 與吳清源(右)放在同一個平面上來比較的本身,就是對 AlphaGo 最大的讚美。(讀賣新聞圖片)

一覽群山小 誰可定千秋

在賽後記者會上,YouTube 直播評論員,世上唯一非東亞裔的職業九段,邁克.雷蒙(Michael Redmond)說 AlphaGo 的棋令他想起吳清源,稱之為繼吳清源圍棋革命之後的另一次革命。吳清源少年時已名震北京城,在中國大地難找對手,當時的大棋迷北洋政府總理段祺瑞資助了吳少年一家的生活費。14歲時與母親兄長一起東渡日本成為日本的職業棋手,養起一家老小。其後不久,吳的戰績震動了日本棋界。19 歲時,吳在選拔賽中連勝勁敵,取得與本因坊秀哉名人對局的權利。秀哉當時已 59 歲,被譽為「不敗的名人」、有份創辦日本棋院,無疑是地位崇高的棋界領袖人物。這次對局是新老對決、甚或有中日大戰的意味在。青年吳清源在這盤棋的前 3 手竟然破天荒用了奇特的新招,驚動了江湖,引起日本社會的熱議。重視禮儀、講究輩分的日本人,認為中國青年亂走新招態度不夠莊重,是對名人的大不敬。吳清源除了戰績彪炳,在下這盤棋的前後就提出新佈局理論,革新了舊下法,震撼日本棋壇(其實也是世界棋壇,那時中國、韓國還差很遠,要等多半個世紀才能追上來),此即是雷蒙九段所提到的吳清源圍棋革命。諾貝爾物理學獎得主楊振寧曾形容,吳清源對圍棋的貢獻超過愛恩斯坦之於現代物理,主要是指同時代和愛恩斯坦同等級的物理學家有不少,吳清源是一覽群山小,幾乎找不到可以分庭抗禮的對手。除了雷蒙,中國也有棋手提出 AlphaGo 與吳清源的神似。對圍棋士來講,把 AlphaGo 與吳清源放在同一個平面上來比較的本身,就是對 AlphaGo 最大的讚美。

哈薩比斯在賽後記者會上說,AlphaGo 的勝利並不是人類的失敗,剛好相反是人類的勝利,AlphaGo 是人類智能的結晶。雖說是外交辭令,但我很同意,也很樂意看到 AlphaGo 的大勝,我的理由比較低俗,老夫子漫畫說:「人吃魚,沒人看;魚吃人,才好看。」

說到最後,中國棋士在人機大戰上其實並不是表面看這般自大無知,他們主要是怕影響他們的生存。從今後,世界圍棋和圍棋世界何以自處?

(本文純屬作者意見。)

你想看更多精彩的深度文章嗎?請購買今期《香港01》周報,或點擊此處:成為我們的訂戶