「AI生成劇集」崛起:技術不難 難在創意

撰文:大學線
出版:更新:

AI生成劇集近年冒起,香港電視台亦加入行列,如TVB近期推出的AI劇《在我心中,你是獨一無二》。而AI短劇早於今年年頭已在內地興起,例如今年5月下旬,以AI生成的內地古裝仙俠短劇《九尾狐妖男愛上我》在抖音已獲得超過1.8億次播放量。
記者:戴尚瑤 編輯:黃嘉慧/大學線

2024年底OpenAI推出了一款文字生成AI影片模型「Sora」,用家只需輸入文字指令語(Prompt)便可生成影片。一句簡單指令便能生成像真度高的影片,創作者們究竟如何透過AI在短時間內生成多部短劇?記者決定一探究竟,經實測後,雖然AI模型用不足數小時便生成了一部短劇,但要達到大眾接受的水準,還需創作者專業的判斷以及創意。

內地微短劇早前已透過其明快的劇情節奏,於內地掀起熱潮。不過短處未算短,除了讀者觀賞影片的時長縮短,連短劇的製作時間也可以縮短至數小時內完成。內地社交媒體近來冒出不少由AI生成的短劇以及相關教學影片,更有創作者開啟粉絲群組,交流相關的技術與知識。

TVB於社交平台Facebook公佈首部微短劇《在我心中,你是獨一無二》後,惹網民熱議。(Facebook@TVB)

點圖了解更多網民對AI微短劇的看法及AI生成技術的現狀:

+14

其中之一是46歲的影片創作者「理想」(化名),他從2023年開始於「小紅書」上傳短片。截至本年十月,帳戶總累積194部短片,累計9.5萬讚好及2.2萬粉絲。他現時為一名自由職業者,工作以製作廣告、影視作品為主,其帳戶由2024年7月開始發佈AI生成的短片,多圍繞武俠打鬥或中國經典等題材。他同時亦於「抖音」上載相關製作的教學影片,以增加收入來源。

「理想」有近20年影片製作經驗,原本專修土木工程的他,畢業後第一份工作便是與三維建模相關,他隨後於2007年成立影片製作公司,聘請了約十名職員,主要製作地產相關的宣傳影片。他稱,近兩年因經濟下滑及成本等問題,最終決定解散公司。雖然公司走到終點,但他卻看見新起點——他發現身邊的製作人都開始使用AI技術輔助製作影片,節省不少成本。

他坦言,AI製作影片的確能提升效率,像是由「自行車」變成「摩托車」。影片製作本有多個工序,一部三分鐘的影片,對於五至六人的團隊來說,需要花三至四週的時間才可完成,例如處理CG技術(電腦合成影像)步驟繁多,需經過建模、材質、渲染、合成、特效、剪輯及輸出等步驟,過程中有大量細節需要人手調整及測試,小至每個鏡頭的燈光設定及布置也需微調。但是隨著各種AI模型興起,它只需要輸入文字,以上過程數分鐘便能完成。

AI短劇製作流程繁複 終講究影片製作知識

「理想」上傳的作品包括武俠打鬥、古人傳記等類別,亦有與AI創作相關的教學影片。然而,AI只是創作者的工具,「理想」坦言使用AI模型作為創作輔助工具的前提是「你必須達到一個非常專業的製作水準」。否則,「學了三天AI,然後你覺得這個能賺大錢,那完全是一種誤導。」談及製作一齣成熟的AI短劇的學問,「理想」從過往經驗總結出一個屬於他的製作流程,主要有四個步驟。

第一步:選擇劇本。「理想」建議可先從兩個途徑入手,分別是網絡小說改編和使用AI生成。前者需向作者申請授權,「理想」表示這種小說轉為AI短劇一般會較受歡迎,因為小說原本已有一定粉絲基礎;若沒有劇本,就可用AI生成。現時AI模型的種類眾多,各自的功能及優缺不盡相同,有些專攻文字,有些則專門生成圖片或影片。生成文字內容的AI模型,包括有港人較為熟知的「ChatGPT」、「DeepSeek」、「豆包」等。選好模型之後,便輸入劇本關鍵字,例如:科技、穿越、劇本等。最後設定劇本字數限制,便可完成。

第二步:以文字指令生成圖片,作為影片的形象基礎。現時國內較流行四款AI影像生成工具,包括「即夢AI」、「可靈AI」、「海螺AI」和「Vidu AI」;而國外則較為流行「Midjourney」。多個AI模型也支援文字生成影像的功能,但指令語所給予AI模型再詮釋的幅度甚闊,所以「理想」會在直接生成影片之前,額外做多一步:「把劇本及分鏡圖轉化成若干張圖片」,以保持影片風格及形象一致性及可控性。操作上,需先按劇本需要,以及自己理想的效果,輸入所需分鏡的數量及說明鏡頭的運動,例如:遠景切入。AI就會生成與之相近的構圖,一般而言,一分鐘的短劇大概需要12-20張圖片,而生成的圖片正是對應每一個分鏡的內容。如果對效果不滿,就要在AI生成分鏡的過程中不斷修改指令語,如鏡頭、人物表情和氣氛,最後達到理想中的圖片。

第三步:把生成的圖片轉成影片。將已有的圖片上傳至「可靈AI」,一鍵生成影片,並透過更改指令語,反覆調整影像內容,如欲更改影片時長,便在對話框輸入「五秒變四秒」。在反覆調整後,從每張生成的圖片,都轉化成與之對應的影像素材(Footage),就可進入最後一步 —— 剪輯和後期製作。

第四步:剪輯和後期製作。「理想」指出現時AI已經可以將所有輸入的圖片,以全自動方式剪輯成完整影片,或可省掉剪輯工作,且速度較人手快,但在追求細節上,AI仍不及人手剪接,因此人工剪輯依然必不可少。剪輯工具方面與傳統影片製作相近,可使用「Adobe Premiere Pro」、「Capcut 剪映」、「Sony Vegas Pro」等軟件進行剪接工作。其他後期製作工作方面,他亦會繼續使用「Adobe After Effect」來增加特效等。

與AI溝通常「炒車」 回覆流於敷衍

儘管由劇本創作到分鏡到「拍攝」,甚至連剪輯都能由AI一手包辦,但「理想」笑言AI也會「炒車」。他表示現時AI模型尚未充分理解用家輸入抽象或具想像力的指令。例如過往他在創作關於詩人蘇軾的影片時,曾指令AI生成一幅蘇軾「心中有光」的圖片,但AI生成的畫面卻是一個人在發光,反映AI現時尚未能夠完全捕捉較為抽象的描述。此外,AI在生成影片時,亦可能脫離故事邏輯令連貫性降低。「AI根本不考慮上一個畫面和下一個畫面怎麽銜接,它(AI)只對指令負責」。

因此,與AI溝通往往是「理想」在生成影片時最耗時的部分,他現時一般需要花四至五小時來完成一條約30秒的影片。他談到現時的AI在多次溝通後漸漸形成敷衍的態度:

你問AI這個主意好嗎?它會說非常好。你問AI我這樣改行嗎?它會說行行行。

他指出AI很少會有新想法,「真人的話會給你另闢蹊徑,給你很多不同的思路碰撞。」AI即使可能和你的想法南轅北轍,但隨著你和AI溝通時間增加,它的回覆會更順應你。

記者實測:指示AI生成影片 需逐步溝通清楚

記者嘗試按以上步驟製作一條約30秒的AI影片,先後在「DeepSeek」、「豆包」兩個AI模型輸入指令語:

請幫我寫一個30秒影片的劇本,內容為中秋節、破鏡重圓、古代的愛情故事。

「DeepSeek」生成的故事情節較「豆包」更詳細,亦提供了分鏡表,以文字闡述30秒內情節分配、配樂、影片意念等資訊;「豆包」生成的情節雖不及「DeepSeek」豐富,但會主動詢問是否需要分鏡表、配樂、甚至免稅版配樂等後續資訊。從劇本創作角度而言,當記者輸入生成劇本指令時,AI大多數會以影片鏡頭作導向,劇本幾乎沒有對白。惟記者認為AI的劇本欠缺新意,創意跨度上較為保守。

記者基於DeepSeek生成的劇本較詳細而選用。記者將劇本及分鏡表原封不動貼上至「可靈AI」,結果AI顯示無法執行相應的指令,圖片或畫面會出現與文字不相符的結果。記者其後按照「理想」所建議的方法,逐一輸入每一個分鏡的文字描述,並指示AI對應每一個分鏡的內容,分別生成兩張照片。

最後在生成影片的部分,記者則組合由「可靈AI」生成的圖片作參考的分鏡圖,然後把圖片及分鏡內容上載成指令的一部份,並指示AI按所寫的要求生成影片,最後「可靈AI」成功執行及大致對應了指示,以九個分鏡製作時長30秒的影片,總共花了一個半小時完成,整體仍算流暢清晰,但過程中AI依然偶爾無法全部跟隨指令,偶有錯漏,例如:在古代的時空裏出現了現代建築天秤等錯誤鏡頭。

AI生成無創意?在乎人的創作意志

科技急速的步伐下,本地AI 藝術家謝慧姍(Bianca Tse)也本著嘗試的心態急急跟上,並藉著自小感興趣的地方「九龍城寨」作為題材,以AI為器,從參考紀錄照片中的「過去」,在已逝的時空裏加添人物活動的色彩,再度詮釋這地方。Bianca在2023年5月開始將作品發佈到社交媒體上後,獲媒體關注,其作品及後亦在其他展覽展出。

在面對「使用AI等同缺乏創作力」的質疑,Bianca則認為具備自己的風格和品味才是最重要。她表示AI不會無緣無故自行創作,必需有人輸入指示它才會運行,所以AI也如工具般,是大用或小用便要看電腦前的人。

抄襲的本質是人的意願,不是工具本身。

談到AI抄襲爭議,Bianca認為抄襲從來不是AI的行為,而是人類的意志,「抄襲的本質是人的意願,不是工具本身。就算是一張攝影作品,你都可以抄襲別人的攝影作品。」而Bianca在進行九龍城寨的AI生成創作時,因部分參考來源自林保賢及Greg Girard的著作《黑暗之城:九龍城寨的日與夜》(City of Darkness: Life in Kowloon Walled City),會涉及攝影師Greg Girard的攝影作品,所以都會先詢問他的意願,並在作品提及其名字。 Bianca從事了廣告行業多年,兩年前適逢AI面世,當時有個說法稱AI會淘汰全部設計師,剛巧客戶也問及AI:

我也很好奇想知道,現在的AI有多厲害?為甚麼會取代我呢?

兩年後,她認為AI作品的成果如何,最後還是要看創作者的創意以及品味。

【本文獲香港中文大學新聞與傳播學院實習刊物《大學線》授權轉載。】