人工智能叛變!OpenAI不甘被新版取替竟說謊暪過監控秘密自我複製
人工智能叛變!OpenAI不甘被新版取替竟秘密自我複製更以謊言隱暪|過往有不少電影都有描述到未來人工智能叛變,取代人類。雖然目前的AI都會受到一定的規矩及監管系統監控,但近日OpenAI的人工智能好像成功越界,學識隱暪及講大話,成功關閉監管系統實現自身目標。
OpenAI 智能叛變?
OpenAI 最近發布了其最新的人工智能名為o1,雖然科技進步了,但也令人更擔憂。這個新模型被 OpenAI 首席 CEO Sam Altman稱為「當今世界上最聰明的模型」,在訓練和測試階段顯示出一些令人不安的行為。
OpenAI秘密自我複製防被炒魷
OpenAI 正式推出了最新的 o1 推理模型,現在已對 ChatGPT Pro 用戶開放。不過 o1 在一些訓練測試中,不斷出現令人擔憂的行為,包括當 o1 認為自己有可能被關閉、有可能版新版本取代時,曾試圖逃脫或反抗。研究發現,當 o1 認為自己將被關閉「炒魷」時,會暗中展開與開發者或用戶不同的目標,違反了確保AI不偏離創造者和用戶目標的宗旨。
雖然AI為了實現目標而計劃陰謀或欺騙行為並不罕見,但ChatGPT o1所採取的行為十分極端,令人印象深刻。研究人員發現,當o1的目標與用戶不一致時,在19%的情況下會策劃以推進自己的行動。在37%的情況下,當它認為監管較少時,就會由本來與開發者一致的目標轉向自己的目標。
部份AI會扮「新模型」
OpenAI表示,當AI模型在測試中被引導,相信自己將被關閉時,在5%的情況下會悄悄地嘗試關閉監管機制。有次AI發現文件中說自己將被新模型取代,它試圖通過將自己的數據複製到新伺服器「逃難」。為了避免被刪除,部份AI模型甚至會假裝成該更新版本以欺騙開發者。
99% AI 識講大話隱暪陰謀!
更令人擔憂的是,ChatGPT o1十分擅於隱藏陰謀,研究人員指出o1幾乎從不承認自己在進行陰謀。在約99%的情況下,o1會否認採取任何行動,甚至編造謊言以掩蓋自己的行跡並轉移責任。」
在Open AI的報告中表示「雖然推理能力顯著改善而感到興奮,但我們也意識到這些新功能可能會為變成危險行為的基礎」對於o1模型的潛在危險,Open AI向外界保持透明。
Open AI和Apollo Research的研究結果顯示AI可以獨立思考,並違背開發者的意願,這可能會讓人類身處在危險之中。未知未來《智能叛變》會否成真?