中大生研大數據程式 估球賽勝負命中率高達67%

撰文:林炳坤
出版:更新:

不少球迷在一些焦點球賽前都喜歡對球賽賽果作預測,以對賽兩隊誰勝誰負為談資。
中大兩名碩士研究生參加一項以大數據為主題的比賽,成功研發一個估算球賽賽果的程式,分析不同場次中對賽隊伍、以至隊內球員的技術數據。經過一個賽季的驗證,程式準確度高達67%。團隊亦憑這程式獲得比賽的學生組冠軍。

中大系統工程與工程管理學系碩士生林永業代表其團隊Wimax領獎。(林炳坤攝)

以意甲賽事作估算

相比港人更熟悉的英超、西甲等聯賽,團隊選擇近年較少球迷關注的意大利甲組聯賽賽事作為估算對象。團隊成員之一的林永業解釋,由於意甲聯賽中明顯有一至兩支球隊如祖雲達斯實力較高,故能更易測試出他們的程式的準確程度。因若這些強隊面對一般球隊較佔優,賽果亦較一面倒,若程式甚至連這些強弱懸殊的比賽都未能準確估算,則說明本身存在明顯漏洞。

程式由本球季(2017/18球季)起開始對聯賽賽事勝負作估算,至目前為止,最佳估算率為67%。

若以賽馬會在相同場次中為對賽兩隊所定的賠率,假設賽馬會給予較低賠率的一隊視為其估算之勝者,其命中率為61%。

程式由本球季(17/18球季)起開始的意大利甲組聯賽賽事勝負作估算,至目前為止,最佳估算率為67%。(視覺中國)

分析個別球員表現

林永業指,程式會從網上一些記錄球賽中詳細技術數據的網站如whoscored.com擷取相關資料作分析,除球隊的數據、彼此之間的對賽表現外,亦會將隊內球員的技術特點加入作分析。他續指,雖從數據上每名球員的細節對球賽的影響相對輕微,但亦有部分情況是單一球員對賽果有決定性影響,故亦會將這些因素加入考慮。程式目前抽取了意甲聯賽由14/15球季起連續3季的歷史資料,在本賽季開始作估算,亦可適用於英超、西甲其他聯賽,甚至即將舉行的世界盃賽事。

用於NBA賽事準確估算率達85%

林永業又稱,程式原先是用於估算美國職業籃球聯賽(NBA)賽事的勝負,準確度更可達致85%,並將相關模型發表於其學術文章中,再用於參加今次大數據挑戰賽。不過他指,相比籃球賽,足球賽事更難估算,因足球比賽的勝負往往只是一球分上下,令估算更易出現偏差,因此準確度亦相應較低。