吉卜力風已過時?GPT-4o打造動畫新境界 讓動態關鍵幀成為藝術

吉卜力風已過時?GPT-4o打造動畫新境界 讓動態關鍵幀成為藝術
撰文:機器之心
出版:更新:

這屆網友真是把 AI 玩出花!

繼谷歌Gemini 2.0 Flash 去水印騷操作後,Reddit 社區的老哥們又用 GPT-4o 解鎖動畫製作新姿勢——直接生成動畫關鍵幀。

只需簡單指令,模型直接吐出連貫動作序列幀,絲滑程度堪比動畫師原畫。

GPT-4o打造動畫新境界(機器之心提供)
GPT-4o打造動畫新境界(機器之心提供)

受此啟發,另位網友獻上進階玩法:

對提示詞稍加潤色,再將 GPT-4o 生成的一系列關鍵幀直接整成了 GIF 動圖。

推文一齣,立刻狂攬 20 萬+圍觀。

GPT-4o打造動畫新境界(機器之心提供)

提示詞模版:

創建一個詳細的像素藝術幀動畫,用於遊戲,其中最終圖像被分成多個子圖像,每個子圖像作為一個連續的動畫關鍵幀。設計序列以描繪[一個巫師施法:從複雜的手勢開始,然後展示巫師召喚一個鮮豔的火球,最後捕捉施放火球的瞬間。]確保關鍵幀之間平滑而連續地過渡,並儘可能包含多個幀,以實現高水平的流暢性和細節。

網友們也不閒着,陸續整活兒。

日出既視感。

+2

不斷變身的小動物和武術。

+3

話說這些活兒算不上好玩,我們決定親自整幾齣。

韓國大明星金秀賢深陷與未成年女星交往風波,近期記者招待會上精彩演出,被網友用 AI 整成了喜劇:

GPT-4o打造動畫新境界(機器之心提供)

我們配了個動圖,不忘 BGM: You are my destiny。

最驚訝的是做了個馬蒂斯風格的藝術動圖,這效果也太好了吧!

提示語:創建一個馬蒂斯風格的藝術動畫,最終圖像被分成多個子圖像,每個子圖都是連續動畫關鍵幀,請描繪一位貴婦被嚇得大吃一驚的過程:一位貴婦面對着鏡頭,然後臉上露出不安的表情,接着眼睛瞪大,嘴巴張開,捕捉最後目瞪口呆瞬間。請確保關鍵幀過渡流暢且連續,並包含儘可能多的幀,以實現動畫的高流暢度和細節。 人物應在每一幀中保持居中,所有幀大小相等,並完美排列在一個 nxn 的網格中,形成單張圖像 。

宮崎駿風格的小女孩 wink,隨手拈來!

+2

創建一個吉卜力風格藝術動畫,最終圖像被分成多個子圖像,每個子圖都是連續動畫關的鍵幀,請描繪一個女孩兒轉頭對着鏡頭wink的過程:女孩兒背對鏡頭,披肩長髮;然後轉過頭,對着鏡頭,微笑,最後捕捉對着鏡頭wink瞬間。請確保關鍵幀過渡流暢且連續,並包含儘可能多的幀,以實現動畫的高流暢度和細節。 人物應在每一幀中保持居中,所有幀大小相等,並完美排列在一個nxn的網格中,形成單張圖像 。

哪怕只有 4 張關鍵幀,效果也不錯!

GPT-4o打造動畫新境界(機器之心提供)

當然,幀圖越多,效果越細膩。

GPT-4o打造動畫新境界(機器之心提供)
+1

創建一個像素風格的藝術動畫,最終圖像被分成多個子圖像,每個子圖都是連續動畫關的鍵幀,描繪一個女孩兒尬舞的過程:面對鏡頭,開始扭動臀部, 左右扭動,手舞足蹈。請確保關鍵幀過渡流暢且連續,並包含儘可能多的幀,以實現動畫的高流暢度和細節。 人物應在每一幀中保持居中,所有幀大小相等,並完美排列在一個nxn的網格中,形成單張圖像。

兩隻皮克斯風格的加菲貓,一開始還挺友好,後來怒到毛都豎起來,想要互毆。

即使畫面出現兩個主體,有一定動作交互,也沒問題。

GPT-4o打造動畫新境界(機器之心提供)
+3

創建一個皮克斯風格藝術動畫,最終圖像被分成多個子圖像,每個子圖都是連續動畫關鍵幀,請描繪兩隻加菲貓敵視對方,要打架的過程:兩隻貓對視,接着露出兇狠表情,身上的毛豎起來、尾巴豎起來,最後捕捉要打架的瞬間。請確保關鍵幀過渡流暢且連續,並包含儘可能多的幀,以實現動畫的高流暢度和細節。 動物應在每一幀中保持居中,所有幀大小相等,並完美排列在一個n

xn的網格中,形成單張圖像。

話不多說,下面介紹整活方法。

最傻瓜的方式

最簡單的辦法就是全部在 GPT-4o 裏完成。

你問平替?木有的。

豆包、谷歌 Imagen 都試過,不僅很難生成有邏輯順序的系列幀,圖像一致性也夠嗆,更別說直接在對話中生成動圖。

以金秀賢的動圖為例。

輸入提示: 生成一張包含 9 個精靈幀的圖像網格,描述一個男演員在記者會上,一邊哭一邊吃漢堡喝水的樣子,吉卜力藝術風格 。

所謂精靈幀( Sprite Frame),是一個遊戲和動畫開發技術術語, 可以理解為一系列靜態圖像或幀,這些圖像快速地連續播放,會產生動畫效果。

不用抽卡,一次搞定:

GPT-4o打造動畫新境界(機器之心提供)

繼續輸入: 先檢測照片的大小,然後合理裁剪這張照片,最後完成初步對齊匹配之後,將這張照片生成一個 gif 動畫 。

立刻就有了結果。

(機器之心提供)

就是這樣:

+4

更精細的方法

如果你仔細觀察上面的九宮格,會發現兩個比較明顯的問題。

首先,第三張圖明顯不合理——一隻手捂着臉,還有兩隻手拿着漢堡。

其次,關鍵幀的邏輯順序需要再調整,比如吃漢堡的過程;水杯裏的水應該是從多變少。

所以,想要動圖效果更好,我們需要一些可以編輯這些圖片的工具。

介紹兩個簡單好用的:

一個是負責裁剪生圖的 Image Splitter :

https://miniwebtool.com/image-splitter/

一個是負責將切片組成動圖的 GIF Maker :

https://miniwebtool.com/gif-maker/

我們將 GPT-4o 生成的九宮圖上傳到 Image Splitter ,然後裁成九張圖片。

GPT-4o打造動畫新境界(機器之心提供)

導入  GIF Maker。

去掉有三隻手的生圖,並調整圖片的順序。

你還可以選擇合適的幀率(我一般選 500 左右,或者更低延遲),延遲越高,動圖越緩慢;反之,則越快。

還能調整畫質和尺寸。

GPT-4o打造動畫新境界(機器之心提供)

看看編輯後的動圖效果,是不是明顯更合理了?

再做個火柴人風格藝術動畫。

提示語:創建一個火柴人風格藝術動畫,最終圖像被分成多個子圖像,每個子圖都是連續動畫關鍵幀,請描繪一個人躺在地上默默流淚:一個男孩躺在地上,接着眼睛開始流出淚水;眼淚越來越多,逐漸在臉上流程兩條小河;最後捕捉到淚水留到地面的瞬間。請確保關鍵幀過渡流暢且連續,並包含儘可能多的幀,以實現動畫的高流暢度和細節。 人物應在每一幀中保持居中,所有幀大小相等,並完美排列在一個 nxn 的網格中,形成單張圖像 。

稍微解釋下,這個提示詞意味着,我們將究竟生成多少張幀圖才能實現畫面流暢的問題直接扔給了大模型。你對幀圖的邏輯內容描述越細緻,生成結果的可控性就會更好。

另外,考慮到後面自動剪裁的便利性,需要在提示詞中明確要求:

所有幀大小相等,並完美排列在一個 nxn 的網格中:

GPT-4o打造動畫新境界(機器之心提供)

剪裁完了,刪掉明顯影響效果的幀圖(但不要太多),再調整它們的位置,以求效果最好。

延伸閲讀:AI回覆竟有60%以上是錯誤?外媒實測8款搜尋工具 最常犯這三大錯(點擊連結看全文)

+6

我們想要一個描繪小船在梵高星月夜裏遊動的動畫,系統自動生成了 16 宮格。

GPT-4o打造動畫新境界(機器之心提供)

一個意外

在尋找平替的過程中,突然想到

谷歌 AI studio 裏有 Storyboard

,它本身就有圖文並茂的能力,能不能生成系列幀呢?

關鍵是免費,如果可以湊合用,也不錯啊。

提示詞:創建一個吉卜力風格的藝術動畫,最終圖像被分成多個子圖像,每個子圖像作連續的動畫關鍵幀,設計一個序列描繪公主施法的過程,先從公主的手部動作開始,然後展示公主變出一個充滿活力的火球,最後捕捉施放火球的瞬間。請確保關鍵幀過渡流暢且連續,並包含儘可能多的幀,以實現動畫的高流暢度和細節。

很意外,一共生成了九張圖,圖與圖之間邏輯還挺合理。

+2

將這些圖片依次導入 GIF Maker。

GPT-4o打造動畫新境界(機器之心提供)

看效果還不錯呢!

一個吉卜力風格的小女孩 wink 動圖,也還行,但明顯不如 GPT-4o:

一個是對吉卜力風格的理解;另一個是指令遵循差一截,女孩 wink 其實並不明顯。

GPT-4o打造動畫新境界(機器之心提供)

不過,測試幾次,谷歌 AI studio  Storyboard 就會失靈,出現嚴重不穩定狀態,畢竟它也不是用來幹這個的。

延伸閲讀:OpenAI開放Deep Research功能 非Pro付費用戶可使用但有這些限制(點擊連結看全文)

+13

【本文轉自「機器之心」,微信公眾號:almosthuman2014】

正在加載