自學話事啤 識吹牛拋窒對手 AI首贏人類高手成賭王

撰文:李藹明
出版:更新:

人工智能(AI)會駕駛、打官司、下棋,而且還懂賭博。周一(30日)在一場長達20日的德州話事啤賽事中,AI勝過四大高手,成為賭王。「啤牌屬於人性遊戲」,恐怕在未來我們再不能如此斷言。

美國匹茲堡的Rivers Casino近日舉辦人機話事啤大戰。(卡内基梅隆大學)

美國匹茲堡的Rivers Casino近日舉辦人機話事啤大戰,由4名啤牌高手輪流作賽,每日對着電腦熒幕長達11小時,與名為Libratus的AI軟件對戰。結果4人均不是Libratus對手,AI贏得的虛擬籌碼總值逾170萬美元,是史上首次有AI於牌桌上勝過人類。

  研發困難 團隊本無信心

卡内基梅隆大學的電腦科學教授桑德霍爾姆(Tuomas Sandholm)與學生布朗(Noam Brown)共同研發了Libratus,桑德霍爾姆表示研發相當困難且複雜,本來自己亦沒信心,「國際投注網站開出的賠率是四比一,認為我們處劣勢而人類會勝出。」

每日賽事長達11小時,對人類而言是情商及耐力的挑戰。圖為參賽者之一Dong Kim。(卡内基梅隆大學)

  遇強愈強 漏夜修正弱點

人類每日對戰完會休息進食、檢討失誤,而Libratus每日對戰完,亦會上載牌局資料至匹茲堡超級電腦中心,漏夜演算運作,令玩啤牌的能力更加精進。其中一名高手Jimmy Chou表示Libratus每日都變得更強,難以擊破:「開始數天我們甚有希望。但每次我們找到弱點,它都會從中學習,第二天該弱點就消失無存。」

  長時間作戰對人類不利

長時間對戰及落敗,對人類而言是情商的挑戰。曾與Claudico和Libratus對戰的萊斯(Jason Les)表示:「Libratus比我們想像的更優秀,令人有點情緒低落。與人類對戰,輸掉後你可以停止並休息一下。但在這兒我們每日要對戰11小時。當你不習慣如此頻密地落敗,這是非常不同的情緒體驗。」

玩啤牌時,每人都會隱藏自己的牌,因此玩家所得資料並不完備,不利於AI運算。(網上圖片)

  以大博小 與人類迥異

Libratus的風格相當激進冒險,會大量押注以博取小額彩金。萊斯表示:「一般人類不會這樣做,但這會迫你每一場都保持警覺。」

  啤牌資訊不完全 難以拆解運算

啤牌向來是AI業界公認難以攻陷的範疇。桑德霍爾姆於2015年亦研發了AI啤牌玩家Claudico,並派出參與人機大戰,最終慘敗而回。相較棋類而言,啤牌的運算較為困難。棋盤上的變化、活動,所有玩家都一目了然;然而玩啤牌時,每個人都收起手上的牌面,資料並不完全,難以拆解運算,需要以直覺猜測對手出牌。

除了估算對手出牌外,誇大其詞誤導對手對話事啤而言亦非常重要。(網上圖片)

Libratus不但運算能力較高,亦較擅於處理不完備資訊。布朗表示:「我們並未教導Libratus玩啤牌,只是輸入了遊戲規則讓它自己學習。」系統自動模擬了上萬億次牌局,自行捉摸出致勝之道。

  自學成材 懂虛張聲勢誤導對手

除此之外,以話事啤而言,以言語誤導對手亦是重要部分,而Libratus亦需要學會吹牛誇大,才能成為「賭神」。更令人意想不到的是,Libratus的吹牛能力亦是自學的。布朗指:「當我看見系統向人類吹牛,我想的是,『我沒叫它這樣做,我不知道它懂呢』。」

  未來或發展至商業談判

拋窒人類對手,同時自己運算牌面,就是AI的致勝之道。布朗表示:「不是要讀對手的心理、判斷對手是否在誇大,這只是關乎牌面與計算。」

《衛報》分析,AI學會「拋窒」和處理不完整資訊,是AI發展的重要一步。不少範疇亦需要以不完整資訊運算判斷,如商業談判、軍事策略、醫療決定等,今次AI的勝利尤如向人類寶座再近一步。

(綜合報道)