【科技．未來】人工智能測謊　將成執法新潮？

面世近百年的測謊機（polygraph），測試結果不可靠已是不爭的事實。然而，背後的思路從未消失，近年更有科學家希望結合人工智能（AI），製造新一代甚至未來的測謊機器，有些更已於歐美國家邊境關口測試。到底這些新的工具會把測謊技術提升至另一層次，還是把測謊機那段黑暗歷史以AI之名重演一遍？

有科學家指出，說謊是人類每天生活的一部份。根據美國南加州大學心理學家Jerry Jellison的研究，我們平均每天可聽到高達200個大話，如何辨別謊言，便成為了一個重要問題。早有科學家認為，我們「口裏說謊，身體卻很誠實」，口窒、「鬼拍後尾枕」之餘，也可能心跳加快、滴汗或面部肌肉會有微表情（micro-expression）。難怪心理學大師佛洛伊德（Sigmund Freud）曾說：「沒有凡人可以保守秘密，若他不開口，他的指尖會說話，甚至身上每一個毛孔都會背叛他。」

儘管如此，不代表我們可輕易識破謊言。2006年一個大型分析回顧了206個科學研究，發現人類判斷謊言的成功率只有54%，僅比隨機好一點。美國警員John Larson在1921年發明的測謊機，問測試者問題時持續量度其血壓和呼吸速率，把結果描畫至紙卷上，出了名最不準確。原因很簡單，根本無從得知這些生理變化是由於恐怕被識穿大話，還是擔心會被錯誤指控，感到緊張、有壓力又或極力嘗試回憶時所致。而不同人對在解讀同一幅圖時也可得出不同結論，甚至因地域、種族和性別而有重大差異。一些人權組織主張，測謊機有違美國憲法對於「不自我入罪」的權利保障，現時，美國絕大部份法庭都不接納測謊機的結果。

有專家指自從9．11後，各國執法部門都積極尋找真正有用的測謊方法。（Getty Images）

「9．11（事件）後一切都改變了。」心理學家Paul Ekman在著作《Telling Lies》中寫道。在那場恐襲中，有數名劫機者是騙過邊境官員才得以進入美國境內，這令當局迫切追求新的測謊技術，希望在反恐和邊境檢查上都有真正有效的工具，於是大幅增加對測謊研究的資助。而近年難民危機及法國、比利時、西班牙、德國等地發生的連串恐襲，亦讓歐洲警察和相關保安部門面臨愈來愈大壓力。

Ekman是研發資助增加的得益者之一。他早於上世紀七十年代已將與精神病人面談過程錄影，其中一名多次自殺的42歲女病人Mary，為了取得周末離開醫院的許可，謊稱自己已感覺比較好。被騙的Ekman後來不斷翻看錄影，終於發現她在說謊前會有極短暫一瞬間流露出失落表情。

Paul Ekman（左）主張，人說謊時會流露微表情。（Paul Ekman Group圖片）

往後數十年，Ekman都在研究這些他稱為「微表情」的面部動作如何能揭示隱藏的真相， 2009年的大熱電視劇《Lie to Me》便是改編自其經歷。這項技術其後更被用作新反恐措施，於2006年在真實世界中首次測試，Ekman花了一星期教導美國入境官員如何在邊境檢查的過程中，透過觀察特定微表情來測謊。測試的成果卻相當有意思：往後六年間，至少有16名恐怖分子獲准入境美國。

但這不代表相關科研就此打住，近年甚至有愈來愈多科學家和國家執迷於這套想法，並希望結合AI技術開發邊境審查系統。

歐洲一些國家曾在邊境測試AVATAR，以AI擔任關員。（聖地牙哥大學）

機械人在邊境把關

在2014年，飛往羅馬尼亞首都布加勒斯特的旅客就被一個名為Avatar的虛擬關員檢查。除了電子護照掃描器及指紋讀取器外，Avatar還有一個紅外線眼動追蹤鏡頭和量度身體動作的感應器。它會問過關旅客一系列預先設定的問題，同時拍下他們的反應，再使用演算法把這些數據結合，分析表情、語調、回答內容等有否出現「騙子迹象」，例如因為想要說謊時的認知壓力而不自覺地出現的微表情。最後，它會對被查人士的真誠程度進行評級，分綠、黃或紅色等級，目標在45秒內把判決傳送給人類執法人員。綠色的可毋須再作檢查順利通關，其餘則要接受人類關員的問話。

負責提供這系統軟件的公司Discern Science聲稱，初步研究顯示Avatar的準確率為83%至85%，「遠高過人類平均只有54%」。Avatar似乎配合了保安和航空業界對行為分析愈來愈濃厚的興趣。在今年5月一個會議上，美國運輸安全管理局、倫敦吉域機場（Gatwick Airport）、以色列機場管理局等代表就在邊境管制上加入行為分析技術商討，希望加強旅客安全和降低風險。Discern Science策略總監David Mackstaller透露，正與列根華盛頓國家機場及一些他不願具名的官員洽談，在亞利桑那州美墨邊境進一步測試後永久安裝Avatar。

列根華盛頓國家機場正在洽談安裝AI關員Avatar，協助判斷旅客有否謊報資料。（Getty Images）

拉脫維亞、匈牙利和希臘則測試過另一套名為iBorderCtrl的系統。該系統使用英國曼徹斯特都會大學（MMU）在千禧年代開發的Silent Talker技術，以AI分析超過40種微表情。旅客到達機場前，先要登錄一個網站上載護照相片，網站會有一個虛擬關員問一些常見的海關檢查問題，旅客需要口頭回答，系統之後會給旅客一個二維碼（QR Code）。入境時，關員會以平板電腦掃描二維碼，採集指紋和核實容貌是否脗合上載照片。最後，電腦顯示一個以100為滿分的分數，令關員參考旅客的資料是否可信。這個項目已獲一個歐盟研究計劃注資450萬歐元，由來自多國的科研機構和保安科技公司共13個單位組成的聯盟管理。

Silent Talker指研究顯示其準確率達75％。但MMU計算機智能講座教授Keeley Crockett強調：「不只是由我們的產品提供風險分數，那是一個有人參與的系統……它不會自動決策，只會為每個獨立旅客打分。我們想為大眾創造更快更安全的邊境檢查。」

曼徹斯特都會大學研發的iBorderCtrl，以AI分析旅客微表情並給予分數，判斷是否說謊。（曼徹斯特都會大學）

另一測謊機製造商Converus聲稱，其EyeDetect是「現有最可靠的測謊機」，準確率有86%，比一些研究指測謊機只有65%至75%為高。在測試者回答問題的同時，EyeDetect會以紅外線鏡頭每秒拍下60張影像，觀察眼球活動和瞳孔大小的細微變化。這些數據會傳到Converus的伺服器，機器學習演算法會計算測試者是否說謊。這幾乎是科幻經典電影《2020》（Blade Runner）中，追捕複製人時進行的「孚卡測試」（Voight-Kampff Test）。

Jon Walters是Public Safety Testing創辦人，其公司在美國華盛頓州替警察、消防和救護進行職前測試。他說執法部門開始選用EyeDetect取代現有費時失事的測謊程序。相比起需時2至4小時的測謊機，EyeDetect只需30分鐘，而且幾乎全自動，可繞過測謊機的一大缺憾—通常在解讀結果時帶有偏見的人類考官。Walters說過程也比較舒服：「當我要接上測謊機的線，其實頗為嚇人。若用EyeDetect，只需坐下看着機器。」

聯邦快遞（FedEx）和Uber已分別在巴拿馬和墨西哥使用EyeDetect，以篩查出有犯罪記錄的司機；消費者信貸評級機構Experian亦用它來測試哥倫比亞分部的員工，確保沒有操控公司的數據庫來批核貸款予家屬；英國諾桑比亞的警察則用EyeDetect進行先導試驗，量度性罪犯的改造程度。其他使用者還有阿富汗政府、麥當勞及美國一些地方警察。

字裏行間看出謊言？

有科學家更相信，AI根本不需要觀察這些身體變化也可識穿謊言。英國卡迪夫大學（Cardiff University）和西班牙馬德里卡洛斯三世大學（UC3M）合力研發的VeriPol，去年起協助西班牙警察從報案的文字記錄識別是否報假案。設計者之一的Miguel Camacho Collados曾任警員，他說市民虛報搶劫，有些只想避免告訴家人或朋友他遺失了重要財物，有些則希望索償保險。

西班牙國家警察早前應用人工智能，聲稱可從報案人的文字口供識別是否報假案。（Europa Press）

研究人員以1,122宗已結案的搶劫案件訓練VeriPol，辨別一句陳述中的不同元素，例如形容詞、動詞、標點符號，然後找出假案的規律。據稱，假劫案報案一般較短，而且主要描述失竊物品而非劫案本身，有關案件和劫匪的詳情較少，也缺乏目擊者。然後，他們以659宗案件測試這演算法，結果VeriPol的準確率分別比兩名人類專家高15至20%。2017年6月在梅西亞（Murcia）和馬拉加（Málaga）的先導研究更發現，被VeriPol判斷為虛假的報案中，有83%在進一步盤問原訴人後就成功結案。而VeriPol在一周內總共偵測出69宗假案，馬拉加和梅西亞在過往一般每周只能分辨出12.14和3.33宗。

佛羅里達州立大學訊息學教授Shuyuan Ho希望，測謊不限於執法用途。在今年2月的《人類行為中的計算機》（Computers in Human Behavior）期刊中，她與史丹福大學的科學家提出了所謂的「線上測謊機系統」，聲稱只要觀察二人的打字交談內容和速度就可測謊。他們找來40人參與研究，2人1組用Google Hangout互相問答。參與者被隱藏了真實身份，在每個回合對話開始前才知道自己要扮演的是每句都是真話的「聖人」，還是每句都說謊的「罪人」。這些交談記錄包括了每句回應花了多少時間，研究人員把部份數據用來訓練一個機器學習模型，再用其餘數據測試它可否分辨誰是聖人、誰是罪人。

有科學家聲稱，可從網上交談對話測出是否說謊，可應用至交友平台、銀行等。（Getty Images）

研究中，機器學習模型辨別成功率為82.5%。Ho說，觀看同樣數據的人類表現只是好過瞎猜少許。這演算法憑一些線索找出罪人，例如回答速度比聖人快、溝通過程中也展現更多「負面情緒」和「焦慮」、使用的字數較多、也會用「經常」和「永不」表達肯定。相反，聖人會用較多表達因果關係的字眼，例如「因為」，也用更多表達不確定的字眼如「可能」、「我猜」。

Ho揚言，這技術可作為線上測謊系統的原型，例如可用在線上約會平台，又或成為反恐機構的測謊元素之一，銀行甚至可以用顧客與聊天機械人的記錄來評估他的誠信：「若銀行應用（相關技術），他們可以很快就更加了解更多與他們做生意的人。」

繼續閱讀︰以人工智能測謊　重蹈偽科學歷史覆轍？

上文節錄自第182期《香港01》周報（2019年9月30日）《AI測謊：重蹈偽科學歷史覆轍？》。

更多周報文章︰【01周報專頁】《香港01》周報，各大書報攤、OK便利店及Vango便利店有售。你亦可按此訂閱周報，閱讀更多深度報道。

【科技．未來】人工智能測謊 將成執法新潮？

【科技．未來】人工智能測謊　將成執法新潮？