ChatGPT迎來勁敵?Google能否靠Gemini重拾AI霸主之位

撰文:歐敬洛
出版:更新:

Google在12月7日發布新人工智能(AI)模型Gemini,宣稱這是勝過OpenAI的GPT-4,是目前世界最強的AI模型。Gemini和GPT-4有什麼分別?Google何來如此自信?

Google多年來一直在開發自己的AI工具,隨著OpenAI發布ChatGPT,Google也順勢推出了類似的AI工具Bard。但Bard輸了給ChatGPT,讓ChatGPT成為今天最受歡迎的生成式AI。Google當然不甘示弱,經過半年的打造,在今天發布Gemini。

Gemini與ChatGPT分別?

Gemini在技術上是一個LLM(大型語言模型),這意味Gemini是一個機器學習框架,通過將大量人類內容輸入其中並協助其建立規則來理解內容。通過足夠訓練,LLM能夠處理語言數據並組成自己的句子,模仿特定風格。

圖為2019年5月,位於美國加州的Google總部大樓。(Reuters)

ChatGPT則是基於GPT-3.5、GPT-4架構的LLM訓練而成的生成式AI。因此把Gemini和ChatGPT比較不太妥當,Gemini應與ChatGPT背後的GPT-4比拼才是。

過去LLM大都專注於某幾個領域,例如語音或圖像。Google DeepMind著名的AlphaGo曾擊敗世上頂尖圍棋棋手,成為當時世上最強的AI。但AlphaGo除了圍棋外對其他領域一竅不通,GPT-4憑着打破這單一領域的界限而受到青睞。

Gemini同樣打破了單一領域的界限,Gemini從一開始就接受多項訓練,包括代碼、圖像(包括表情符號)、影像、音訊(包括語言)等各種內容,這似乎要比GPT-4還要多。根據Google的介紹,Gemini的「十項全能」包括:

向學生解釋物理問題。
處理原始音訊以尋找特定信號。
翻譯、摘要和對話等自然語言處理。
分析用戶意圖,為用戶創造配件和方案。
協助科學家發現他們可能錯過的研究中的關聯性。
在所有程式編寫競賽中獲勝。

Gemini將會推出的3個版本,Nano相信會被Google應用在多個領域中,且很可能免費。(Google)

可以應用在哪裏?

Gemini目前仍未上市,但Google已說明會為Gemini設計三個版本,分別是最強的Ultra版,實用的Pro版和輕量Nano版。根據不同用途和資源,開發者可使用不同版本打造自己的AI程式。

外界預料Gemini推出初期可能仍不足以與GPT-4比拼,因ChatGPT的用戶非常多,但長遠來看假若Gemini表現良好,Google可以逐漸扳回優勢。Google的用戶比ChatGPT還要多,除了PC外還有手機Pixel,接觸層面非常廣闊。且Google就是現時全球最主流的搜索引擎,掌握所有實時資訊提供學習,這是OpenAI無法媲美的。

據預測Google會把Gemini整合到Bard中,提升Bard能力,同時透過Google自身的搜尋引擎、Youtube及Pixel手機等展示Gemini,吸引開發者投入設計更貼切用戶需求的AI,讓另一個AI生態圈發展起來。