【科技.未來】人臉辨識升級 情感辨識應用遍地開花

撰文:孔祥威
出版:更新:

當人臉辨識在全球各地相繼推出,令人擔心環形監獄時代來臨,更進一步的反烏托邦或許在等着我們。一些科技公司聲稱可以人工智能(AI)分析我們的表情,解讀出情感狀態,有助各行各業了解消費者喜好之外,更可被執法機關用來判斷你是否對公眾安全構成威脅。不過,當人類早已熟練笑裏藏刀,AI又是否真的有能力看穿我們的真正感受?

10月底,深圳舉行中國國際社會安全博覽會,逾1,500個參展商展出多種新科技監視器材。其中,新疆阿勒泰地區公安局治安支隊隊長李曉宇就向《金融時報》介紹:「利用影片錄像,情緒辨識科技可藉由分析精神狀態迅速分辨出疑犯,預防非法行為,包括恐怖主義和走私。我們已經開始使用。」他補充,這科技主要用於海關,分辨某人有否流露緊張的迹象、其壓力水平以及攻擊他人的潛在可能。

李曉宇還透露,正與不同業者合作,包括海康威視、宇視科技、大華科技和天地偉業等內地知名監控公司:「只有在AI方面強大的公司才可在這領域成功,當然,這領域內最大的兩家公司就是阿里巴巴和騰訊。」曠視科技一名不願具名的代表則說,情感辨識科技已在政府內廣泛開發和使用,尤其是公共安全機關。

十月底深圳安博會,多間科技公司展出監控保安技術,包括以情感辨識預監控潛在罪犯。(AP)

以機器解讀情感

據美國麻省理工媒體實驗室情感計算科學家Javier Hernandez解釋,情感AI是一種讓人類與機器更自然互動的工具:「想想你與其他人類互動的方式,你看他們的臉和身體,並相應改變互動。若機器不知道你的情感狀態、感受,對某種內容會有什麼反應,它能夠有效溝通嗎?」

現時,人類在閱讀情感上可能佔上風,但機器正逐漸進步。麻省理工史隆管理學院教授Erik Brynjolfsson說,這是因為機器十分擅長分析大量數據:「就像我們可理解語言而機器可用言語溝通,我們也可以用幽默和其他情感來理解和溝通。能夠說這種情感語言的機器,將與我們有更好、更有效的互動。很高興我們已有點進展,這在過去二十或三十年前根本不可能,現在卻擺在眼前。」

情感辨識牽涉兩種技術,其一為電腦視覺(computer vision),仔細辨識面部表情;另一為機器學習演算法,分析和解讀這些面部特徵的情感內容。後者需要經過監督學習(supervised learning),若你向演算法展示大量標籤為「開心」的開心面孔照片,當它看見一幅新的開心面孔照片就能辨識為「開心」。

Paul Ekman(左)認為,人即使試圖掩飾情感,但臉上仍會流露「微表情」。(Paul Ekman Group圖片)

現時絕大部份情感辨識技術,基本上都是想藉由把臉上的表情和位置如座標般記錄,從而反映出對應的內在情感。這種概念很大程度上來自於美國加州大學柏克萊分校(UC Berkeley)心理學家Paul Ekman,他在上世紀六十年代主張,愉快、傷心、厭惡、恐懼、憤怒和意外,這六種情感不論文化背景為何,都會以普同的方式展現,並可透過分析面部肌肉動作來偵測。為測試這種假設,Ekman向不同群體展示來自世界各地的面孔照片,叫他們分辨看到什麼情感。研究發現,即使存在重大文化背景差異,人類仍可配對出同樣的面部表情和情緒。

過去二十年,Ekman試圖將他的發現發展成辨識人類表情來判斷情感的方法。當某種潛在的情感在某人心中觸發了,相應的面部表情就會自動出現,甚至即使想掩飾這情感,真實、本能的反應仍然會洩露在臉上,即他所謂的「微表情」(micro expression),逃不過識途老馬的「法眼」。

情感辨識遍地開花

微軟聲稱,其演算法可辨識八種核心情感狀態。(Microsoft)

現時,一些科技巨頭已在提供這種服務。微軟(Microsoft)在2015年推出其情感辨識技術時,就聲稱其演算法可「辨識八種核心情感狀態:憤怒、鄙視、恐懼、厭惡、愉快、中性、失落和詫異」。亞馬遜(Amazon)在8月中宣布其人臉辨識服務Rekognition,可在本來已偵測的「快樂」、「傷心」、「憤怒」、「意外」、「厭惡」、「冷靜」和「困惑」之外,加入第八種情緒「恐懼」。網站上還建議了多種用途,例如商店可把顧客的實時影像輸入到這人臉分析工具,在不同零售地點追蹤他們的情感和族群。

Google雖然在內部倫理評估認為會侵犯私隱的壓力下,沒有像亞馬遜和微軟般出售人臉辨識服務,但其人工智能雲端服務仍會在照片中偵測和分析人類面孔,估算年齡、性別和四種情感:喜悅、憂傷、憤怒和意外。在Google照片應用程式中搜尋「喜悅」、「憤怒」等字眼,就會得出它判斷包涵這些表情在內的照片。

有情感辨識公司與影視媒體合作,分析觀眾對電影、廣告等觀感反應,以制定行銷策略。(Kairos)

辨識消費者或潛在顧客的反應,是情感辨識的一大商業用途。情感AI初創公司Realeyes,正是以Ekman的六種基本情感、眼球追蹤和面部表情來分析觀眾對廣告的反應。例如去年聖誕,英國高檔連鎖百貨約翰路易斯(John Lewis)播出了《男孩與鋼琴》的廣告,倒述殿堂級歌手Elton John的成長故事,從天王巨星回到兒時父母買給他作為禮物的鋼琴,配上他膾炙人口的《Your Song》。雖然廣告播出後整體反應不錯,但在Realeyes看來則沒那麼簡單。他們請來200名觀眾看這廣告,並且同意過程中以電腦或手機鏡頭錄下每分每秒的反應,然後,以人工智能分析每人的面部表情和身體語言,綜合注意力和情感後評分。

Realeyes發現這廣告的開頭就已錄到正反觀眾情感。行政總裁Mihkel Jäätma解釋:「英國觀眾其實對片中Elton John那部份不太興奮,負數上升,大家早已聽夠了對這名人的吹捧。」而到他的小孩版出現時,則出現較多正面的情感反應:「當談到家庭和小孩而不再是名人,好感度大增。所以,我們認為這廣告的焦點在於那小孩。幾乎沒有Elton John的話會好很多,或者至少應縮短。」廣告片長2分20秒,「實在太長,只能在電視上播,無人會在網上看。」一些大型食品商如可口可樂(Coca-Cola)、瑪氏(Mars)都是Realeyes的客戶,日本電信電話(NTT)亦有份投資。

類似的做法也見於電影。人臉辨識公司Kairos就與傳奇影業(Legendary Pictures)合作,以這種技術在電影試映時測量觀眾反應。傳奇影業會利用所得大量數據,決定電影中哪些劇情最適合用來製作廣告片,分辨「最有可能分享電影預告的群體」,確保它的電影「同時滿足主流觀眾和針對性的粉絲族群」。

很多其他界別也看中了情感辨識的潛力。初創公司Hirevue就聲稱,其程式可幫助僱主分析應徵者面試錄影,判斷其性格和表現,剔除不合格的應徵者,增加招聘效率。達美航空(Delta)、冬甩專門店Dunkin' Donuts、服飾及生活雜貨品牌Urban Outfitters、聯合利華(Unilever)等知名巨企都是其客戶。

另一情感AI業者Affectiva就推出了專用於汽車的情感辨識功能,聲稱可結合人臉和語言分析測度駕駛者的情緒,確保行車安全;也能辨識乘客的舒適度和睡意來調適車內環境如光線和暖氣,又或在辨識到乘客緊張或不適時,可改變汽車自動駕駛的風格。杭州第十一中學去年則設置了「智慧課堂行為管理系統」,聲稱可以鏡頭捕捉七種情緒,包括高興、難過、憤怒、反感、驚訝、害怕和中性,從而判斷學生上課是否專心,並在學生「雲遊」時知會老師。

使用這技術執法的當然不限於中國,拉脫維亞、匈牙利和希臘就測試過一套名為iBorderCtrl的出入境「測謊」系統,旅客要預先在其網站口頭回答虛擬關員的查問,系統透過鏡頭觀察他的微表情,再在入境時由職員核對指紋、容貌、護照等,得出一個以100為滿分的分數,讓關員參考旅客是否可信。

英國公司WeSee行政總裁David Fulton對《英國廣播公司》(BBC)聲稱:「即使使用低畫質的影像,我們的技術也有能力從一個人的面部表情、姿勢、動作,判斷他的精神狀態。在未來,地鐵月台的監視器可使用我們的科技來偵測可疑行為,並就潛在恐怖襲擊向當局發出警報。同樣也可用於多人聚集的活動如足球比賽或政治集會。」他並補充,「大約有60%至70%準確率。」

曼徹斯特都會大學研發的iBorderCtrl,以AI分析旅客微表情並給予分數,判斷是否說謊。(曼徹斯特都會大學)

而向美國聯邦調查局(FBI)銷售擷取手機數據軟件的Oxygen Forensics,本年7月在其產品中加入人臉及情緒辨識功能。營運總監Lee Reiber說,可幫助警方搜證時在成千上萬的照片中分類,可從中就特定容貌搜尋,也可過濾不同種族、年齡層,以及情緒如「喜悅」和「憤怒」。Reiber承認這工具並非完美,但可助探員加快工作,又強調調查過程中,線索需要以多種方式檢驗:「我希望盡可能取得最多碎片,再把他們重構成完整圖畫。」

繼續閱讀︰辨識人臉表情 等於讀懂「情感」?

相關文章︰

三藩市帶頭立法禁用 多地密切跟進監管人臉辨識

質疑警方執法受阻 多個組織反對禁用人臉辨識

學者力撐禁用 人臉辨識「對社會有毒」

人臉辨識成多國執法新潮 環形監獄時代來臨?

人臉辨識無法可依 是時候監管了?

人工智能測謊 將成執法新潮?

以人工智能測謊 重蹈偽科學歷史覆轍?

冠人工智能之名重臨 測謊機器為何陰魂不散?

上文節錄自第191期《香港01》周報(2019年12月2日)《人臉辨識升級 從表情讀懂情感?》。

更多周報文章︰【01周報專頁】

《香港01》周報,各大書報攤、OK便利店及Vango便利店有售。你亦可按此訂閱周報,閱讀更多深度報道。