張美雄|黑天鵝Deepseek如何撼動全世界
來稿作者:張美雄、許仲倫
近日,中國新創公司深度求索 (後稱Deepseek)橫空出現,震撼了整個美國AI金融市場。令人驚訝的是,該公司運用低配芯片,竟能實現與最新OpenAI技術相媲美的效果,導致英偉達股價在開市後暴跌超過16%,市值一夜蒸發5890億美元。究竟Deepseek是何方神聖,竟能讓晶片巨頭英偉達遭遇如此重創?雖然筆者各方面政經議題也有涉獵,但實在並非AI專家。為了更深入了解,我特意請教了好朋友,來自科技界的許仲倫(後稱Warren)。他是魔度智能科技的創始人,曾擔任阿里人工智能實驗室的總監,與Deepseek創始人一樣,也是扎根於浙江省杭州市的科技人才。
Deepseek是何方神聖
Warren指出,Deepseek的母公司名為幻方量化,是一家規模超百億的私募量化基金。Deepseek跟大家耳熟能詳的ChatGPT也是一樣,是一個大語言模型(後稱為「大模型」),最近更推出了3.0版本。多個測試顯示,這個3.0版本的性能可以匹敵Open AI的ChatGPT,同時能跟其他主流的大語言模型像Claude還有Llama 3.1不相上下,這引發了包括美國政壇以及華爾街的高度關注,「矽谷教父」Marc Andreessen更在社媒形容「DeepSeek是我所見過最amazing和impressive的技術突破之一」,這都不能不說這個黑天鵝確實是震撼了全球的資訊科技界。
那麼Deepseek有什麼厲害之處?其實很簡單,就是它僅用了很短的訓練時間、很低的訓練成本,就達到了接近甚至部分可以匹配ChatGPT以及其他幾個大模型的程度。有多低成本?以GPT-4o的10億美金來算,Deepseek只用了558萬美元。在只能使用因美國的出口管制原因、較落後的H800芯片,他的大模型訓練效率還是比Llama高出約10倍。
Deepseek彰顯了中國開發的無私共享精神
另一個值得關注的方面是,Deepseek與許多美國的AI模型不同,它採取了開源策略,公開了其代碼和訓練方法,讓所有人都能夠訪問和使用。這種透明的運作模式展現了中國在開發過程中的無私共享精神,為其他開發者提供了寶貴的參考資源。這一舉措無疑與美國的保護主義形成鮮明對比,更推動了全球數字智能技術的突破。
本文目的從來不是為了推廣任何公司,上述引用的也是各大技術專案調查的實證,只希望讓大眾深入淺出地理解Deepseek的背景與發展。的而且確,當人們還未反應過來時,這一黑天鵝已經撼動了整個矽谷科技界,近期股票市場的波動便是證明。當然,筆者也明白,股票市場的波動從來不是由單一因素決定的,這可能只是催化劑,使華爾街找到合適的理由把估值過高的股票「甩鍋」,但與此同時,也讓世界看到了中國技術的潛力。
Deepseek VS ChatGPT ,親身體驗的效果
在請教了Warren之後,為了親自體驗Deepseek的威力,於是我將一個邏輯陷阱題目同時問了Deepseek和ChatGPT(iOS專用的Poe)。我的題目是:「八個人玩捉迷藏,已經有三個人被抓住,還剩下幾個人藏著?」結果,Poe答出了五個,而Deepseek則給出了四個。明顯地,Deepseek的回答經過了人性化的思辨,還結構化地展示了整個推理過程;而Poe的回答則陷入了思維的陷阱,只是單純的數學計算,沒有計算捉人者本身在內。這小小的例子可見,Deepseek的確潛力無限。
Deepseek的橫空出現,不僅震撼了美國科技界和華爾街市場,也促使了良性競爭,除了推動了英偉達在芯片核心模塊技術架構上的革新外,ChatGPT也迅速調整了商業策略,這些都是推動科技領域計算力發展的重要動力。
這不禁讓我想起,即使是高舉美國優先的特朗普,最近在第二次當選總統後也認清了現實:「中美可以解決世界上所有問題。」只有堅持合作共贏、追求共同發展,才能實現真正的多邊主義。國家主席習近平所倡導的「構建人類命運共同體」,正正是人類尋求共贏、謀求共同發展的理想藍圖。唯有不同國家和民族攜手共進,才能為全球人民的未來謀取更大的福祉。
作者張美雄是西貢區議員、大灣區青年企業家協會副會長,許仲倫是浙江省香港商會理事兼科技專委會主任、科技公司創始人。文章僅代表作者個人觀點,不代表香港01立場。
「01論壇」歡迎投稿,來函請電郵至01view@hk01.com。來稿請附上作者真實姓名及聯絡方法。若不適用,恕不通知。