人工智能叛變！OpenAI不甘被新版取替竟說謊暪過監控秘密自我複製

人工智能叛變！OpenAI不甘被新版取替竟秘密自我複製更以謊言隱暪｜過往有不少電影都有描述到未來人工智能叛變，取代人類。雖然目前的AI都會受到一定的規矩及監管系統監控，但近日OpenAI的人工智能好像成功越界，學識隱暪及講大話，成功關閉監管系統實現自身目標。

OpenAI 智能叛變？

OpenAI 最近發布了其最新的人工智能名為o1，雖然科技進步了，但也令人更擔憂。這個新模型被 OpenAI 首席 CEO Sam Altman稱為「當今世界上最聰明的模型」，在訓練和測試階段顯示出一些令人不安的行為。

OpenAI智能叛變？ (資料圖片)

傳iPhone夥百度AI組Apple Intelligence中國版｜但有兩因素未傾掂

OpenAI秘密自我複製防被炒魷

OpenAI 正式推出了最新的 o1 推理模型，現在已對 ChatGPT Pro 用戶開放。不過 o1 在一些訓練測試中，不斷出現令人擔憂的行為，包括當 o1 認為自己有可能被關閉、有可能版新版本取代時，曾試圖逃脫或反抗。研究發現，當 o1 認為自己將被關閉「炒魷」時，會暗中展開與開發者或用戶不同的目標，違反了確保AI不偏離創造者和用戶目標的宗旨。

OpenAI秘密自我複製防被炒魷 (《智能叛變》劇照)

雖然AI為了實現目標而計劃陰謀或欺騙行為並不罕見，但ChatGPT o1所採取的行為十分極端，令人印象深刻。研究人員發現，當o1的目標與用戶不一致時，在19%的情況下會策劃以推進自己的行動。在37%的情況下，當它認為監管較少時，就會由本來與開發者一致的目標轉向自己的目標。

部份AI會扮「新模型」

OpenAI表示，當AI模型在測試中被引導，相信自己將被關閉時，在5%的情況下會悄悄地嘗試關閉監管機制。有次AI發現文件中說自己將被新模型取代，它試圖通過將自己的數據複製到新伺服器「逃難」。為了避免被刪除，部份AI模型甚至會假裝成該更新版本以欺騙開發者。

99% AI 識講大話隱暪陰謀！

更令人擔憂的是，ChatGPT o1十分擅於隱藏陰謀，研究人員指出o1幾乎從不承認自己在進行陰謀。在約99%的情況下，o1會否認採取任何行動，甚至編造謊言以掩蓋自己的行跡並轉移責任。」

在Open AI的報告中表示「雖然推理能力顯著改善而感到興奮，但我們也意識到這些新功能可能會為變成危險行為的基礎」對於o1模型的潛在危險，Open AI向外界保持透明。

Open AI和Apollo Research的研究結果顯示AI可以獨立思考，並違背開發者的意願，這可能會讓人類身處在危險之中。未知未來《智能叛變》會否成真？

99%AI識講大話隱暪陰謀！(《智能叛變》劇照)