GPT-4o吉卜力風格只是開始 畫筆編輯創作與推理模型合併成熱議

這幾天,你要說 AI 圈最火的是哪個模型?OpenAI 的 GPT-4o 當仁不讓。
吉卜力風格的圖像和視頻在社交圈瘋傳,被玩出了花。機器之心用 GPT-4o 和可靈做出了吉卜力版《甄嬛傳》全網播放超 20w。


除了一些口型和神情還有出入,人物形象可謂是超絕還原。
X 平台上的網友利用 GPT-4o 和 Luma Ray 2,把《瘋狂的麥克斯(Mad Max)》動畫版也做出來了。
在網友探索 AI 動畫生成的同時,還有一個功能被刨了個底朝天。在 OpenAI 的發布介紹中壓根沒提,但非常有用的功能 —— 畫筆編輯。
沒錯,就是這麼一塗,你就能變身造物主,想怎麼改圖就怎麼改圖。
我們趕緊上手試了一下,發現效果真的很強!
把同事的照片轉換成吉卜力風格後,點擊生成的圖片,右上方有一個畫筆按鈕,輕點之後就能進入到畫板界面。
塗抹需要修改的部分,然後輸入相關的 prompt,例如這張圖裏,我們輸入了「移除外套只保留裏面那件短袖」。
於是,一張保留了大量原圖細節的脱去外套版圖片就生成了。
不過,原圖與新圖之間還有一定差別。後面背景中石頭和植被的佈置以及人物的表情都發生了變化。不過整體細節相對保留完整,GPT-4o 也能夠理解我們的指令。
還能換背景哦,下面這張圖就把背景換成了小溪。
換個同事的童年照片,給她加頂海盜帽也是非常好用。
不過,複雜一些的轉換看起來效果還不算完美。例如這個彌補了《大話西遊》中至尊寶和紫霞仙子遺憾結局的換位。猴子腦袋快被金箍勒爆了,身體也沒有被雲霧覆蓋。但是人物的細節和風格都保持住了。
延伸閲讀:Google推出免費AI圖像編輯器 文字指令即時修改照片:中英文都得(點擊連結看全文)
推理與非推理集於一身,GPT-5 要來了?
在刷爆圖像生成的同時,GPT-4o 還有了另一個重大發現:現在可以顯示推理時間與思維鏈過程了。
這不禁令人聯想,難道 OpenAI 開始合併推理與非推理模型了?正如奧特曼上個月提到的那樣,OpenAI 計劃統一 o 系列與 GPT 系列模型,構建可以自主判斷任務需求的智能系統,不用再每次選擇模型。
還有用戶曬出了自己 2024 年底的截圖,這可能意味着 OpenAI 並不是最近才開始測試,GPT-4o 的推理能力也持續很長時間了(6 個月以上)。
截圖如下:
對此,以上兩位用戶展開了討論,前一位表示現在的推理看起來比去年更長更好了。後一位稱,這只是反映了 OpenAI 如何輸出「推理」過程,可以看到過去是兩種方式,與 o1 相同。而最近 o1、o3 與 4o 的推理看起來不一樣了,非推理模型中開始出現推理了。
這並不是個例,越來越多人發現了 GPT-4o 的推理現象。
不過有人懷疑是不是 bug。即使是 bug,也許是非常有趣的 bug。
正如下面這位網友所說,看起來我們正在即時觀察 GPT-5 的啟動,模型版本之間的界限正在迅速模糊併合並。
延伸閲讀:Grok 3全面開放 免費體驗與ChatGPT同級智能服務 更有圖像功能(點擊連結看全文)
【本文轉自「機器之心」,微信公眾號:almosthuman2014】