【逃犯條例】學術分析警察講「豬」定「自由」 研究時頻譜搵真相

撰文:熱評
出版:更新:

文:朱孝文 Lanston
2019年6月12日,香港警察以過度武力鎮壓抗議《逃犯條例》修訂的市民,令輿論嘩然。有不少警察濫權的證據廣為流傳,其中一段捕捉了警察爆粗挑釁躲在商場內的市民。原片如下︰

片中警員隔玻璃向示威者咆哮:「出來啦,__!」此片引起了一個稍為離題的討論:究竟警察當時說的是「自由西」,還是粵語髒話「豬西」?原片字幕顯示「自由西」,而網民紛紛表示如果邊看片段邊看字幕會聽到「自由西」,但如只聽聲音則會聽到「豬西」,十分神奇。萬料不到在最近的《逃犯條例》修訂爭議中,竟出了一個香港警隊版本的Yanny vs. Laurel羅生門。究竟當時警員說的是「自由西」還是「豬西」?

有爭議的字眼總長0.5秒。假設警員說的是「自由西」,三字分別在3.9至4.1秒﹑4.1至4.25秒、及4.25至4.4秒位置,長度分別為0.2秒、0.15秒和0.15秒,長度比例為4:3:3。假設警員說的是「豬西」,長度則為0.35秒和0.15秒,亦即7:3。

不同發音的時頻譜

我在中文大學的「粵語審音配詞字庫」提取了「自」、「由」、「豬」、「西」四字,並按4:3:3和7:3長度作切割然後合併成「自由西」與「豬西」兩段語音,並按原片語速各自調整成0.5秒總長度。最後將語音轉成時頻譜(Spectrogram)。時頻譜的X軸為時間,Y軸為語音頻率,顏色越深代表信號越強烈。合成時頻譜如下︰

作者使用中文大學粵語審音配詞字庫的數據,再以Mathematica製造出圖中讀出「自由西」時的時頻譜。(作者提供)
作者使用中文大學粵語審音配詞字庫的數據,再以Mathematica製造出圖中讀出「豬西」時的時頻譜。(作者提供)

「自由西」的時頻譜在中間區間(0.2秒至0.35秒的位置)的頻率傾向低頻,圖形深色部份看起來成「U」狀。這是由於「由」發音較為低沉。作為對比,「豬西」的頻率在0.2秒至0.35秒中間部份變化不大,與早段相同。再者,由於「豬」字一直拉長,圖形深色部份成「一」狀,直至「西」字出現,尾段頻率才出現較大變化。

現在我們可以分析原片的0.5秒音頻︰

作者另外製作出圖中當晚警方挑釁市民時,說話時的時頻譜。(作者提供)

圖中可見,時段中間部份頻率並無特別集中在低頻部份,基本上與早段相同,與「豬西」的時頻譜較吻合。從此可見警員較有可能說的是「豬西」而非「自由西」。這結果亦非常合乎常理,「自由西」實在太有創意,罵人者必須理解市民因爭取自由而行動才罵得出來。「自由西」表面粗鄙實質高雅,需要有一定文化修養才能在千鈞一髮之際出口成文。相反,「豬西」一詞是常見用語,情緒一來即可不問背景衝口而出,因此警員在片中講的是「豬西」比較合理。

為什麼我們有些時候會聽到「自由西」?

如上面所言,如果我們看着字幕,或心中想着「自由西」三字,就會傾向把「豬西」聽成「自由西」,為什麼會這樣?這是由於我們的大腦不會處理耳朵收到聲音信號的每個信息(否則大腦會因處理所有信號細節而過勞)。人腦中的神經元(Neuron)數量以千億計,神經元與神經元彼此相連,一個神經元可輸出至多個神經元,多個神經元亦可輸出至一個神經元,形成巨型神經網絡。大腦將耳朵收到的信息按大腦中的神經元逐層傳遞,部份神經元按照接收到的信息決定自身是否會被激活,如被激活就會傳遞信號到下一個神經元。

當某個代表「自由」粵音訊號的神經元被激活時,大腦就會告訴你你聽到了「自由」粵音訊號。而當某個代表「豬」粵音訊號的神經元被激活時,大腦就會告訴你你聽到了「豬」粵音訊號。所以,當你看着「自由西」字幕或心中想着「自由西」三字的時候,大腦除分析收到的聲音訊號外還會處理你看到或想着的信號,一起決定哪些神經元會被激活。而當音訊較為模棱兩可時,「自由」神經元就會在聽到「豬」一字時被激活,我們就會以為自己聽到「自由」了。

作者簡介:

美國威斯康辛大學研究生,研究興趣為人工智能(深度學習、機械學習以及電腦視覺)

作者網誌:https://lanstonchu.wordpress.com/

(文章標題由《香港01》編輯所擬。文章純屬作者意見,不代表《香港01》立場。)