OpenAI 正式踏入 AI 發展的下一階段,突發推出最新功能-ChatGPT Agent。這不僅僅是一個聊天機器人,而是一款能夠主動執行複雜、多步驟任務的 AI 代理人。從使用者角度來看,這項技術帶來的影響可能比語言模型本身還要深遠,因為它讓 AI 首次真正具備了「代勞」的能力:你下指令,它執行整個電腦操作流程,幾乎可以代替你完成所有瑣碎的工作。
這個功能強大的新工具,能夠控制一部虛擬電腦,可以整合日曆、瀏覽網頁、打開終端機,甚至根據用戶資料來生成簡報、安排行程或完成網上購物。從 OpenAI 所釋出的展示內容來看,用戶可以要求 ChatGPT Agent 規劃約會之夜,AI 就會自動查閱 Google 日曆找出空檔時間,再連結 OpenTable 搜尋指定餐廳的訂位情況,甚至可以根據即時變更的偏好(例如增加餐廳類型)重新規劃,靈活度十足。
這樣的能力並非來自現成的 GPT 模型,而是 OpenAI 特別為此開發的新架構,並結合了過去「Operator」和「Deep Research」兩大工具的技術。Operator 擅長網路操作模擬,Deep Research 則主攻深度報告撰寫與邏輯推理,兩者合體形成一個多功能智能代理架構。OpenAI 還專門整併兩個團隊,建立一支 20 到 35 人的跨部門新團隊來推動 ChatGPT Agent 的開發與部署。
值得注意的是,這個 AI Agent 不只模擬點擊或文字輸入,而是實際運行在完整的虛擬電腦環境中。這讓它可以執行比傳統 AI 工具更複雜的工作,例如分析多個 Excel 表格、跨網站查找資訊、比對商品價格,甚至規劃採買清單並產出家庭早餐食譜的食材清單。這樣的功能極大拓展了 AI 的實用場景,從單純的文字輸入擴展到完整的任務處理。
由於ChatGPT Agent 需要執行連串操作,整個過程不一定像單句回應那樣即時。OpenAI 表示,ChatGPT Agent 可能需要數分鐘甚至半小時來完成任務。不過對於那些不急於馬上回饋的情境,例如生成報告或安排例行公事而言,這樣的延遲是完全可以接受的,甚至大幅提升整體效率。
目前,ChatGPT Agent 已開放給 ChatGPT Pro、Plus 和 Team 用戶使用,透過工具欄選擇「agent mode」或直接輸入指令「/agent」即可開啟功能。預計稍後會推廣至 ChatGPT Enterprise 與 Education 版本。