【英國大選】以5萬人推算保守黨倒輸 拆解民調機構的大膽統計學

撰文:陳奕謙
出版:更新:

民調到底可不可信?經過去年的英國脫歐及美國大選之後,愈來愈多人不屑一顧。
英國大選將在6月8日舉行,民調機構YouGov大膽預測,保守黨可能會倒輸20席,失去了下議院的控制權,呈現懸峙國會。箇中計法是否可靠?

《泰晤士報》以YouGov預測為頭版,報道保守黨可能倒輸20席。

《泰晤士報》星期二(5月30日)頭版報道,YouGov推算保守黨會失去20席,在國會議席不再過半。消息夠觸目,不少傳媒也引用,但同時亦有人表示質疑。畢竟工黨過去數年處於弱勢,掌握英國社會脈搏的人多會相信,工黨難有勝算。

  選民多元不一 民調未必作準

民調到底可不可信?一般來說,民調都會隨機抽樣,訪問選民的投票意向。只要樣本夠大,通常最少有1000人的話,都可以達到百分之95的置信水平,誤差有限。例如香港大學民意研究計劃在立法會選舉前,也會訪問1000人,然後參考全港人口的年齡、性別及教育程度分佈,以多重加權法調整數據,推算出香港人會如何投票。

不過,如果選舉牽涉到全國層面,人口成份多元不同的話,樣本能否反映母體就會成疑。以英國大選為例,他們全國分成650個選區,每區6、7萬人。倫敦市中心的選情跟愛丁堡郊區的可以完全不同,差異甚大。如果只向全英抽樣了解,只怕未能作準。

不可錯過:【英國大選】權威民調推算保守黨倒蝕20席 議席不過半呈懸峙國會

文翠珊星期三到了英格蘭西南的普利茅斯(Plymouth),了解漁業發展。(路透社)

  MRP統計法 找出投票因素

回看今次的YouGov預測,雖然他們訪問了多達5萬名選民,但如果除開650個選區來說,即每一區才得75人的意見。75人又如何反映出一個選區的最終結果?

提出大膽推算之後,負責的里弗斯教授(Douglas Rivers)撰文解釋,他是以統計學上的MRP得出這個結果。MRP全稱Multilevel Regression and Post-stratification,中文可叫多層次回歸後分層法。簡單來說,做法如下:

在民調中收集受訪者的多項資料,例如學歷水平和收入以多重回歸法(Multilevel Regression)找出影響投票意向的因素,例如收入多少的人會支持工黨?從政府部門中,取得英國各個選區的人口成份套用回歸分析的結果,推算各個選區的選民如何投票,此即為後分層(Post-stratification)整合650選區結果,推算保守黨可得311席

不可錯過:英國6大派圍攻保守黨 大選辯論獨缺文翠珊 丁父憂大臣淪箭靶

工黨黨魁郝爾彬星期三到了劍橋大學出席BBC辯論,批評文翠珊缺席。(路透社)

里弗斯訪問5萬人,不是要知道他們住在哪一區,以此來推算整區選情。他的野心更大,相信可以找到影響因素,然後套用到任何一個選區之上。舉個假例,只要選民是碩士學歷、月入5萬港元、未婚、男性、工作享長約,他就會投給保守黨。

為了緊貼最新選情,YouGov每天再訪問7000人,只用最近7天的數據,維持以大約5萬名受訪者為樣本,推算結果每天都會更新。當然,YouGov也不敢說一定準確,但他們近年用MRP的推算也相當貼近結果。YouGov亦都強調,近日其他民調也顯示出保守黨優勢漸退,工黨後來追上,與他們的MRP結果可謂方向一致。

深度專頁:【英國脫歐】談判路漫長 首相文翠珊提前大選 勢一箭雙鵰挫工黨