人工智能發展一日千里,同時亦引起社會大眾對其產生的安全威脅的憂慮。英國媒體報道,來自加拿大的AI教父Yoshua Bengio,最近發起一項非牟利計劃,致力開發一種「誠實」的AI系統,作為阻止AI代理(AI Agent)欺騙人類的「護欄」(guardrail)。
英國《衛報》6月3日報道,一位AI先驅發起一個非牟利組織,致力開發一種「誠實」的AI系統,能夠識別試圖欺騙人類的AI代理。
被譽為「AI教父」之一的著名電腦科學家本吉奧(Yoshua Bengio)將擔任LawZero的行政總裁。 LawZero將致力為各大科企已投入1萬億美元(約7.78億港元)的AI行業軍備競賽,提供保障安全的設計。
2023年7月25日,美國華盛頓國會山莊,圖為Mila - Quebec AI研究所創辦人、蒙特利爾大學電腦科學系教授 本吉奧(Yoshua Bengio)出席參議院聽證會時講話。(Getty) 據報道,本吉奧最初獲得約3000萬美元(約2.35萬億港元)的資金,並擁有十多位研究人員,正在開發一個名為「人工智能科學家」(Scientist AI) 的系統;該系統將充當護欄,防止AI代理嘗試作出欺騙或作出自我保護行為,例如試圖避免被人類關閉。
本吉奧將目前市場盛行的AI代理,描述為試圖模仿人類並取悅用戶的「演員」,並表示「人工智能科學家」系統更像是一位能夠理解和預測不良行為的「心理學家」。
本吉奧強調:「我們希望打造誠實、不說謊的AI。」
本吉奧補充道:「理論上,可以想像沒有自我、沒有目標、純粹的的知識機器——就像一個知識淵博的科學家。」
然而,與目前的生成式AI工具不同,本吉奧的系統不會提供確定的答案,而只是提供答案是否正確的機率。
2024年4月24日,美國紐約市林肯中心爵士音樂廳,被譽為AI教父的本吉奧 (Yoshua Bengio) 出席時代雜誌舉辦的時代百大人物(TIME100)峰會時發表講話。(Reuters) 報道指,本吉奧開發的模型會與AI代理一起部署,能夠替AI系統的潛在有害行為作出預測,評估其行為造成傷害的機率。
「人工智能科學家」會「預測AI代理行為造成傷害的機率」,如果該機率超過某個閾值,則會阻止該代理的作出的建議。
本吉奧表示,其創立的LawZero的第一步,將是證明其理念背後的方法是行之有效的,然後說服企業或政府支持更大、更強大的版本。他補充說,開源AI模型可以免費部署和調整,這將是訓練LawZero系統的起點。
本吉奧強調:「關鍵在於示範系統的有效性,以便我們能夠說服投資者、政府或AI實驗室投入所需的資源,使其訓練規模與當前最前沿的AI系統相同。這套AI護欄系統,至少要與它嘗試監控的AI代理一樣「聰明」,這一點至關重要。」
2024年12月10日,本年度諾貝爾物理學獎得主欣頓(Geoffrey Hinton)在瑞典斯德哥爾摩市政廳舉行的諾貝爾奬晚宴(Nobel Banquet)上發表演講。(Reuters) 報道指,本吉奧是加拿大蒙特利爾大學(University of Montreal)的教授,他與後來獲得諾貝爾獎的欣頓(Geoffrey Hinton)以及朱克伯格(Mark Zuckerberg)的Meta公司的首席AI科學家勒昆(Yann LeCun)共同獲得2018年的圖靈獎(Turing award ,被視為電腦界的諾貝爾獎),因此而獲得AI「教父」的稱號。