【美國大選】特朗普揶揄初選錯估結果 「數據巫師」慶幸出錯

撰文:黃家欣
出版:更新:

美國共和黨總統大選候選人特朗普(Donald Trump)在一個公開場合,揶揄被稱為「數據巫師」的FiveThirtyEight.com創辦人兼總編輯西爾弗(Nate Silver),特朗普說:「他經常估中未來會發生的事,但他在初選沒有預估到我。」
西爾弗錯估特朗普在共和黨初選時不能勝出,又曾指特朗普的支持度會逐漸減少,結果特朗普勝出初選,成為共和黨的總統候選人。「數據巫師」光環褪色,西爾弗說:「某程度上,我很高興這個泡沫爆破了一點點……我從來不是所有預測都準確的。」

錯估特朗普不能勝出初選,雖然沒有打擊西爾弗對數字的信心,但他表示,事件令他變得謙卑,也變得聰明。

因在2012年美國大選中估中50個州結果而成名的西爾弗,表示每次出錯都可以學習。(美聯社)

西爾弗說話有點腼腆,被人稱讚時會有點不自然,執著於一般人容易忽視的地方,而當說到數字和統計時,他便會雙眼發光,口若懸河地談論工作和理論。這樣的人很易被歸類為「怪胎」。

估中兩屆總統選舉結果

事實上,連西爾弗也承認自己是個怪人。不過他的執著成就了不少奇蹟,他的工作主要是分析美國大選形勢,同時也分析棒球比賽。在2008年的美國大選,在50個州中他成功預測到49個州的結果;2012年,他更進一步,估中50個州及華盛頓的結果,因此被譽為「數據巫師」、「統計學大師」等。

他曾解釋熱愛統計數字的原因,指讓人們能作更好選擇的概念是很高尚的概念,雖然能提供數據未必能使人做好的決定,但人們有權得知這些數字。他認為與數據打交道的好處,是可以得到近乎準確的答案。

投身統計工作之前,他曾於畢馬威任職(KPMG)。他表示,人生最後悔就是花了4年時間在不喜歡的地方工作。在畢馬威工作期間,他在閒餘時研究棒球比賽及統計,創作出PECOTA系統,可預估球賽及球員表現。2003年,他開始撰寫關於棒球比賽的文章,並在2004年全心投身興趣行業,更在2007年涉足政治的統計研究。

接下來就是他在美國大選中的成名作。2008年,西爾弗開設了自己的博客FiveThirtyEight.com,並在《紐約郵報》(New York Post)社論版刊登文章解釋自己在政治議題統計關注的問題及所依行的邏輯,同年總統大選,他成功預測到49個州份的結果。

2010年FiveThirtyEight.com成為《紐約時報》旗下的網站,西爾弗則在2012年推出他的書《信號和噪音》(The Signal and the Noise : Why Most Predictions Fail – but Some Don't),分享他的預測經驗及理論;同年他又預估時任總統奧巴馬勝出機會率達九成,與一般預估的五成相差甚大,結果他的預測再次應驗,奧巴馬成功連任。

西爾弗在2012年推出書本《信號和噪音》,分享預測經驗及理論。

究竟西爾弗的方法與其他人有何分別?他是按照概率理論「貝斯理論」去整理從各民調機構收集的數據。民調機構的背景、立場傾向、覆蓋人群、舉辦時間等的差異極大,各有各參考意義。西爾弗根據過往12次大選的歷史紀錄,對民調機構的權威性分級,在計算時會有不同比重;加上不同的分析結果,他將這些資料整理,然後對候選人的勝出機會率作加減。截至10月19日,距離大選尚有21日,他預期希拉里有87.7%機會進駐白宮,特朗普則有12.3%機會當選。

統計狂熱者 讓數據說話

作為數據狂粉,西爾弗堅持讓數據說話,他純粹依賴數據,透過複雜的計算得出結論。不過此舉就惹來不少批評,指他沒提供深入的分析及組織,預測也不準確,其中一個批評是來自諾貝爾經濟學獎的得主克魯曼(Paul Krugman)。兩人曾在《紐約時報》合作,不過2013年ESPN收購FiveThirtyEight.com後,克魯曼便不時在文章中攻擊西爾弗。克魯曼指,西爾弗表明不想學權威人士,在專欄中不斷重覆同一說法,克魯曼表示明白他的想法,但應該利用數據支持分析,利用數據指出假設錯誤。他在文章中寫道:「告訴我有意思的東西!告訴我為什麼這些數據重要。」

而《紐約時報》的編輯蘇利萬(Margaret Sullivan)亦撰文表示:「我不認為西爾弗能融入《紐時》的文化,我認為他自己也清楚。就像電影《魔球》(Moneyball)中畢彼特的角色,擾亂了傳統挑選棒球選手的模式,西爾弗也擾亂了傳統媒體報道政治的模式。」

熱愛統計的西爾弗,則以統計數字回應克魯曼。他統計克魯曼在文中提及FiveThirtyEight.com或西爾弗的次數,截至2014年3月底,合共有33次,當中有6次的文章是否定網站或西爾弗的,而其中有4次都是在ESPN收購網站後才發表的文章;而當西爾弗仍與克魯曼同在《紐約時報》投稿時,克魯曼只寫過一篇否定網站的文章。他暗示克魯曼是因為自己不再為《紐約時報》效力而作出批評。

西爾弗熱愛棒球比賽,曾創作系統預估球賽及球員表現。(Getty Images)

錯估特朗普不能勝出初選

今年美國總統大選,西爾弗估計不到特朗普爆冷成為共和黨代表。不少一直批評他預測的人把握機會多加一腳,他表示:「理智上我會想,他媽的,我們已盡力;但情感上,讀到這些批評也不是樂事。」但仍高興出錯。

他事後撰文分析預測錯誤的原因,承認統計有不足之處,但為自己「讓數字說話」的取向護航。他指有不少媒體與FiveThirtyEight.com一樣,自我檢討出錯之處,他認為這是好的,因為數據新聞學就是講求將科學方式應用到新聞,即觀察世界,作出假設,並證實假設正確,出錯就檢討,並再做下個試驗。他認為,不是每次試驗都會得到答案,但可以從錯誤中學習。

變數太多影響預測結果

「不過除了反映了問題,我也會想數據新聞工作是否過分自責,特朗普在美國政治歷史上是令人驚訝的。」他指,沒太多人估計到特朗普的崛起。事實上,不少選民不喜歡兩黨候選人,增加了選舉結果的變動,第三黨候選人約翰遜(Gary Johnson)更一直保持雙位數支持率,這影響了西爾弗的統計模式。西爾弗也表示:「我直覺會有不少人票投第三或第四黨。」

反而是再後來,當他公布特朗普有19%成為總統,他表示有些擔心,不是擔心自己一錯再錯,而是擔心自己隨波逐流了,硬是認為自己的統計有哪裏出了問題。他的大選預測公布後,在社交網站上不少人都分享他的數據,也同意他的說法。「這令我有些擔心,沒有人說:『你錯了。』」

錯估特朗普不能勝出初選,雖然沒有打擊西爾弗對數字的信心,但他表示,事件令他變得謙卑,也變得聰明。「你發現在競選活動背後也只是人,很多聰明人想出來的。」今年,他也走進人群,扮成支持者出席數個特朗普的競選活動,看看這個改變他預測模式的男人。他認為特朗普只談及有利自己的民調,「特朗普的問題眾多,這不是最差一樣,但我懷疑他這種歪曲民調結果的能力,是否也能用於對他不利的事實上。」他曾預言特朗普不可能勝出今次大選,就且看這位統計學大神能否再發揮神準的預測能力。

你想看更多精彩的深度文章嗎?請購買今期《香港01》周報,或點擊此處:成為我們的訂戶