張美雄｜黑天鵝Deepseek如何撼動全世界

來稿作者：張美雄、許仲倫

近日，中國新創公司深度求索（後稱Deepseek）橫空出現，震撼了整個美國AI金融市場。令人驚訝的是，該公司運用低配芯片，竟能實現與最新OpenAI技術相媲美的效果，導致英偉達股價在開市後暴跌超過16%，市值一夜蒸發5890億美元。究竟Deepseek是何方神聖，竟能讓晶片巨頭英偉達遭遇如此重創？雖然筆者各方面政經議題也有涉獵，但實在並非AI專家。為了更深入了解，我特意請教了好朋友，來自科技界的許仲倫（後稱Warren)。他是魔度智能科技的創始人，曾擔任阿里人工智能實驗室的總監，與Deepseek創始人一樣，也是扎根於浙江省杭州市的科技人才。

Deepseek是何方神聖

Warren指出，Deepseek的母公司名為幻方量化，是一家規模超百億的私募量化基金。Deepseek跟大家耳熟能詳的ChatGPT也是一樣，是一個大語言模型（後稱為「大模型」），最近更推出了3.0版本。多個測試顯示，這個3.0版本的性能可以匹敵Open AI的ChatGPT，同時能跟其他主流的大語言模型像Claude還有Llama 3.1不相上下，這引發了包括美國政壇以及華爾街的高度關注，「矽谷教父」Marc Andreessen更在社媒形容「DeepSeek是我所見過最amazing和impressive的技術突破之一」，這都不能不說這個黑天鵝確實是震撼了全球的資訊科技界。

那麼Deepseek有什麼厲害之處？其實很簡單，就是它僅用了很短的訓練時間、很低的訓練成本，就達到了接近甚至部分可以匹配ChatGPT以及其他幾個大模型的程度。有多低成本？以GPT-4o的10億美金來算，Deepseek只用了558萬美元。在只能使用因美國的出口管制原因、較落後的H800芯片，他的大模型訓練效率還是比Llama高出約10倍。

Deepseek彰顯了中國開發的無私共享精神

另一個值得關注的方面是，Deepseek與許多美國的AI模型不同，它採取了開源策略，公開了其代碼和訓練方法，讓所有人都能夠訪問和使用。這種透明的運作模式展現了中國在開發過程中的無私共享精神，為其他開發者提供了寶貴的參考資源。這一舉措無疑與美國的保護主義形成鮮明對比，更推動了全球數字智能技術的突破。

本文目的從來不是為了推廣任何公司，上述引用的也是各大技術專案調查的實證，只希望讓大眾深入淺出地理解Deepseek的背景與發展。的而且確，當人們還未反應過來時，這一黑天鵝已經撼動了整個矽谷科技界，近期股票市場的波動便是證明。當然，筆者也明白，股票市場的波動從來不是由單一因素決定的，這可能只是催化劑，使華爾街找到合適的理由把估值過高的股票「甩鍋」，但與此同時，也讓世界看到了中國技術的潛力。

Deepseek VS ChatGPT ，親身體驗的效果

在請教了Warren之後，為了親自體驗Deepseek的威力，於是我將一個邏輯陷阱題目同時問了Deepseek和ChatGPT（iOS專用的Poe）。我的題目是：「八個人玩捉迷藏，已經有三個人被抓住，還剩下幾個人藏著？」結果，Poe答出了五個，而Deepseek則給出了四個。明顯地，Deepseek的回答經過了人性化的思辨，還結構化地展示了整個推理過程；而Poe的回答則陷入了思維的陷阱，只是單純的數學計算，沒有計算捉人者本身在內。這小小的例子可見，Deepseek的確潛力無限。

Deepseek的橫空出現，不僅震撼了美國科技界和華爾街市場，也促使了良性競爭，除了推動了英偉達在芯片核心模塊技術架構上的革新外，ChatGPT也迅速調整了商業策略，這些都是推動科技領域計算力發展的重要動力。

這不禁讓我想起，即使是高舉美國優先的特朗普，最近在第二次當選總統後也認清了現實：「中美可以解決世界上所有問題。」只有堅持合作共贏、追求共同發展，才能實現真正的多邊主義。國家主席習近平所倡導的「構建人類命運共同體」，正正是人類尋求共贏、謀求共同發展的理想藍圖。唯有不同國家和民族攜手共進，才能為全球人民的未來謀取更大的福祉。

作者張美雄是西貢區議員、大灣區青年企業家協會副會長，許仲倫是浙江省香港商會理事兼科技專委會主任、科技公司創始人。文章僅代表作者個人觀點，不代表香港01立場。

「01論壇」歡迎投稿，來函請電郵至01view@hk01.com。來稿請附上作者真實姓名及聯絡方法。若不適用，恕不通知。

于品海｜DeepSeek憑什麼一鳴驚人？AI競賽的世紀，香港缺席抑或只是遲到？