AI應用全面落地手機 OpenAI與Google比拼將步入小高潮|伽羅華

撰文:伽羅華
出版:更新:

OpenAI與Google最近在人工智能AI的競爭非常激烈,一周多前OpenAI推出GPT-4o,能夠整合文字、視象及音訊的AI模型,同日Google則發布最新版Gemini 1.5 Pro,兩者都是transformer架構,這場最尖端的技術比拼已經成為影響人類發展的重大變革。

自2022年11月30日OpenAI公布GPT首個版本,震撼整個AI市場,其後公司加快更新GPT版本,近月再推出由文本生成視象的SORA,開始有後來居上老大哥Google的勢頭,如果以AI市場份額而言,OpenAI市佔率為14.12%,擁有3,126家客戶,而Google AI的為3.21%,擁有711 家客戶,OpenAI在這AI類別中的客戶數量比Google AI多出2,415家。

OpenAI專注AI模型開發,當公司使用客戶的敏感數據進行訓練時,可能較業務多元化的Google更易取得客戶的信任,特別是這些客戶是以科技為本的企業,而OpenAI與最大金主微軟彼此建立一定區隔,微軟嚴格上未能控制OpenAI,亦有助公司爭取市場份額,故此,OpenAI以其更先進的AI架構、且沒有太多利益衝突之下,成功取得較Google更大市場佔有率。

OpenAI logo is seen near computer motherboard in this illustration taken January 8, 2024. REUTERS/Dado Ruvic/Illustration/File Photo

OpenAI市佔率跑贏Google

不過,這場沒有硝煙的戰爭即將迎來一個小高潮,有可能改變市場競爭勢態,就是AI應用將由網上擴展至手機,或更正確地說,是由企業為主的層面擴大至零售,市場深廣度亦因此帶來質的提升。

近日OpenAI與Google不約而同與蘋果公司商討在iPhone引入GPT和Gemini的功能,能夠成為全球14.6億部iPhone手機上的預設功能,對OpenAI今後發展非常重要,而Google亦不容有失。如果蘋果公司要二選一,無論從技術優勢或利益衝突上,GPT勝出的機會是高一些,但蘋果公司以往亦曾引入Google的搜尋引擎,所以OpenAI的談判籌碼並不如外界所想像般高。

由於人們對AI認知不同,其需要亦因人而異,但成本肯定是人們能夠承擔的水平,所以,就算OpenAI與蘋果公司達成這宗大刁,讓OpenAI的GPT手機版成為瀏覽器Safari的預設功能,亦需要設法為其AI算力尋找更多商機,就像Google提供免費搜尋,但同時開拓廣告收入來源。

Google在開發AI技術一直是老大哥,2017年其AI團隊在其知名的科學論文《Attention Is All You Need》提出,文本可被轉換為token的數字,並且為各個token建立與文字邏輯規則相對應的向量關係,這個開創性構想成為開發Transformer的理論基礎,Transformer是一個基於multi-head attention的深度學習架構,其中attention代表當人們讓機器學習時,希望它在哪方面投放更多關注度。

Transformer成為AI架構主流

隨着AI處理的資訊已由文本,跨界擴展至音訊和視象等領域,開始有新的AI架構出現,例如Google發表新架構Griffin,以及旗下DeepMind開發RecurrentGemma,都宣稱技術指標超過Transformer架構,但Transformer在很多方面,特別是自然語言處理(NLP)仍然發揮極大的優勢,所以GPT-4o與Gemini 1.5 Pro基本上都是Transformer架構,但在訓練及執行指令的模式有些分別。

面對OpenAI來勢洶洶的攻勢,Google首席執行官Sundar Pichai及其團隊推出了一系列有關AI功能的更新,公司是以Google I.O牌頭來抗衡GPT-4o,旗艦產品是Gemini 1.5 Pro,擁有多達200萬個token的上下文窗口(window context),這意味著它可以同時處理大量數據,例如兩小時的影片或一次完成6萬行程式代碼。為了更加高效處理這些數據,公司引入上下文快取。

與OpenAI單單公布單一產品GPT-4o的不同,Google透過大模型Gemini 1.5 Pro、以及兩項專注AI應用的處理器Trillium TPU和Axion CPU,實行軟硬兼施,Google早已視OpenAI為AI最大的競爭對手,不敢掉以輕心。

近日OpenAI與Google不約而同與蘋果公司商討在iPhone引入GPT和Gemini的功能。﹙資料圖片﹚

GPT系列有成業界標準趨勢

OpenAI發布會中沒有推出全新 GPT-5,正當大家以為Google I.O可能吸引大部分眼球,GPT-4o面世依然相當吸引,尤其是大幅提升了手機應用程式的功能後,明顯是為進入iPhone平台前一次實力宣示。從OpenAI開發GPT系列產品的套路可看出它有一套長遠技術規劃,如果說GPT希望為多模態大模型建立一套新標準,在這方面OpenAI是頗為成功。

GPT-4o比GPT4 Turbo速度更快,操作成本更低,並且將文本、視象和音訊無縫整合到單一系統上,它較Gemini 1.5 Pro較突出的地方,是能夠輕鬆切換語氣,能夠模仿美國加州女孩的口音,以至戲劇性地切換至諷刺,而且能因應對方語氣而作出即時調整,這令GPT-4o說話時更具人性化。

最後,用兩家科技企業的商戰來形容OpenAI與Google在AI技術的創新,可能已經低估這場技術變革對人類發展帶來的真正意義。隨着戰爭的AI應用愈益廣泛,對人類的安全問題亦倍受關注,但大家有否留意,已經有人倡議AI應用應該成為基本人權的一部分,例如向弱勢社群分配AI算力作為福利,否則因數碼隔閡所帶來的發展不均衡將會更為嚴重,而AI應用全面落地手機將是第一步。

【財經專欄】大盤漫談.伽羅華

資深財經傳媒人,多年來見證金融市場蛻變,在即食資訊年代,堅持深入調研和理性分析,現以自由人身份從事商業諮詢工作。

免責聲明︰以上內容僅代表作者的個人立場和觀點,不代表香港01的任何立場,香港01亦無法核實上述內容的真實性、準確性和原創性。

另外,以上純屬個人研究分享,並不代表任何第三方機構立場,亦非任何投資建議或勸誘。讀者務請運用個人獨立思考能力自行作出投資決定。