ChatGPT-4.5突破:更準確、更少幻覺 AI 會比人更可信嗎?|蘇仲成

撰文:MetaHero
出版:更新:

自從大型AI語言模型(LLM)技術崛起,AI 於各種領域的應用已變得無處不在。但一個長期困擾業界的問題是:「AI 可信嗎?」。當 ChatGPT-4.5 推出,OpenAI 聲稱其準確性將大幅提升,幻覺(hallucination,即 AI 編造錯誤資訊的情況)亦將顯著減少,這意味著可能對 AI 的信任程度可能會發生重大改變。

文:Michael C.S. So(嶺南大學研究生院客席助理教授)

但這項技術的進步從何而來?它如何減少幻覺並變得更可靠?在這種情況下,我們是否應該開始相信 AI 比人類更值得信賴,甚至讓 AI 代替我們做決策?這篇文章將探討這些問題,並分析 ChatGPT-4.5 可能帶來的影響。

ChatGPT-4.5 技術突破:準確性的提升來自哪裡?

ChatGPT-4.5 的改進主要源於三大核心技術突破:

1.⁠ ⁠更強的多模態學習與上下文理解

過去的 GPT-4 雖然已經具備強大的自然語言處理能力,但仍然存在理解錯誤或遺漏關鍵細節的問題。ChatGPT-4.5 在多模態學習(multimodal learning)上有重大提升,能夠更有效地理解文本、圖片、甚至是音頻內容,使得它能更準確地回應問題。例如,當 AI 被問及醫學或法律問題時,它能夠從更全面的資料庫中擷取信息,並以更精確的方式回應,而不僅僅是憑語料庫內的部分資訊來推測答案。

2.⁠ ⁠更高級的檢錯與自我修正機制

OpenAI 為 4.5 版本引入了更強的「自我檢查」機制(self-consistency checking)。這意味著 AI 在回答問題時,會自動與過往訓練數據進行比對,甚至可以交叉檢驗自己給出的答案。這樣的技術可大幅減少 AI「胡亂編造」資訊的情況。例如,在科學數據或統計分析中,AI 會引用更多已驗證的數據來源,而非依賴單一文本的片面資訊。

3.⁠ ⁠更大的記憶與上下文窗口

以往的 GPT-4 雖然能夠處理較長的對話,但仍然受限於「記憶窗口」的大小,可能會在長時間的對話中遺漏關鍵資訊。ChatGPT-4.5 擴展了這個上下文窗口,使其能夠「記住」更長時間內的對話內容,確保答案前後一致,減少斷章取義或邏輯錯誤的情況。這對於需要精確推理的領域(如財經、法律、醫療等)極為重要。

幻覺減少的關鍵:為何 ChatGPT-4.5 會更可靠?

減少幻覺一直是 AI 領域的一大挑戰,而 ChatGPT-4.5 在這方面的進步主要歸因於以下幾點:

1.⁠ ⁠訓練數據的優化與強化學習

OpenAI 在 4.5 版本的訓練數據上投入了更大的精力,不僅擴展了資料來源,還強化了基於人類反饋的強化學習(RLHF, Reinforcement Learning from Human Feedback)。這意味著 AI 在學習過程中,不僅僅是靠機器「讀書」,而是透過人類標註來判斷哪些答案更合理,哪些則是幻覺。

2.⁠ ⁠引入更高級的檢測機制

過去的 AI 經常會「一本正經地胡說八道」,這是因為它無法判斷自己回答的準確性。但 ChatGPT-4.5 引入了一種新的「事實驗證機制」,它可以在回應前先檢查答案的可靠性,甚至在內部自我爭辯後再輸出最可信的答案。這樣的機制讓 AI 更加慎重,不輕易給出錯誤資訊。

3.⁠ ⁠更好的引用系統與透明度

GPT-4.5 開始加入更清晰的「來源參考」能力,在某些問題上,AI 甚至可以直接提供引用來源,讓用戶可以自己核實答案的可靠性。這與早期的 AI 模型相比,是一大進步,因為過去的 AI 很容易給出看似合理但毫無根據的答案。

AI 會比人更可信嗎?

當 AI 變得越來越準確,這是否意味著 AI 會比人類更值得信任?這是一個哲學性問題,值得我們深入探討。

1.⁠ ⁠AI 在某些領域已比人類更可靠

事實上,AI 在數據處理、醫療診斷、財務分析等領域已經表現得比人類更精確。例如,在癌症檢測方面,AI 已經能夠在比醫生更短的時間內發現早期腫瘤;在財經分析中,AI 可以即時處理大量市場數據,並給出更準確的投資建議。

2.⁠ ⁠AI 缺乏「主觀偏見」

人類在決策時往往會受到個人經驗、情感或偏見影響,而 AI 並不具備這些「人性弱點」,因此在某些需要客觀判斷的情境下(如法律審判、醫學診斷等),AI 可能比人類更公正、更客觀。

3.⁠ ⁠AI 並非完美,仍需人類監管

儘管 ChatGPT-4.5 減少了幻覺,但 AI 並非完美,尤其是當問題涉及複雜的道德判斷或需要創新思維時,人類的直覺與經驗仍然是無可取代的。此外,AI 仍然受限於其訓練數據,若數據本身存在偏差,AI 仍然可能輸出錯誤資訊。因此,AI 的可信度應該是「輔助」人類,而非「取代」人類。

AI 與人的信任關係正在重塑

ChatGPT-4.5 的進步無疑讓 AI 在準確性與可信度上更進一步,但這是否代表 AI 比人更值得信賴?答案可能不是絕對的「是」或「否」,而是「在某些領域 AI 已經比人類更可靠,但 AI 仍需人類監管與輔助」。

我們可以期待未來 AI 在更多領域發揮作用,但與此同時,我們也要保持警覺,確保 AI 不是在無意間加劇我們的依賴,而是成為我們的強大助手,讓人類的判斷與 AI 的智慧結合,共同創造更美好的未來。