當非洲農民也用中國DeepSeek 美國AI巨頭錯失了什麼?|專欄
想像一下,在東非烏干達的一片粟米田裏,一位農民正因作物歉收而愁眉不展。他打開手機,在WhatsApp上收到了一條由烏干達農業部發送的種植建議——而這條信息正是由中國大語言模型Qwen(通義千問)生成。
這個看似超現實的場景,正在成為這個東非國家土地上的常態。在擁有4800萬人口的烏干達,雖然英語是官方語言,但僅有約30%的受教育人口能熟練使用,其餘絕大多數人使用着40多種本土方言。
被矽谷遺忘的「低資源語言」
一家來自烏干達的非政府機構Sunbird AI自2024年起開始測試幾個開源大語言模型,包括Google的Gemma、Meta的Llama和阿里巴巴的Qwen(通義千問),Sunbird AI執行總裁Ernest Mwebaze發現,儘管美國大模型在英語方面表現優越,但在面對非洲本土那些(Low-resource languages)時,其優勢便蕩然無存。
由於小語種語料庫匱乏、商業回報率低,西方科技巨頭往往不願投入資源。相比之下,阿里的Qwen系列支持多達119種語言,覆蓋了印尼的爪哇語(Javanese)、菲律賓的宿霧語(Cebuano)、海地克里奧爾語(Haitian Creole)、斯瓦希里語(Swahili)等大量被主流模型邊緣化的地方語系。Sunbird AI基於Qwen打造的Sunflower模型,則將適用於當地的語言從6種一舉擴展到了31種。
極致性價比:10%成本背後的普惠誘惑
成本是使用中國模型的另一個決定性因素。
根據最新市場定價,DeepSeek V3系列模型調用API的成本極低:每百萬輸入Token(即用於處理輸入指令Token)約0.28美元,輸出token約0.42美元。相比之下,與之同級別的GPT-4o百萬輸入token成本則高達2.5美元左右,輸出則高達10美元,相當於DeepSeek V3的十到二十倍。
對於缺乏龐大資金支持的AI企業或組織而言,投入高昂成本使用西方模型根本是不現實的選擇。Mwebaze表示,中國的開源模型讓他們向烏干達民眾提供免費的AI服務,並在各個領域進行靈活部署。目前,Sunbird AI已與烏干達政府合作,協助各政府部門推動數碼減貧、進行人口普查,以及為使用不同語言的人口提供農業資訊、教育材料等,努力讓那70%曾被數碼經濟排除在外的人群重新參與進來。
在肯尼亞,一家從事AI研發、為非洲各國政府和企業提供AI政策建議和解決方案的Qhala同樣在使用中國的大語言模型。
Qhala的AI工程師Wenslous Egesa表示,儘管Open AI的頂級模型非常強大,但對一些企業來說,在選擇模型時最重要的還是成本考量,尤其是當企業只是需要使用模型來「快速瀏覽和檢查內部文件」,使用頂級模型就顯得沒有必要了。
誰更懂全球南方需求?
2025年7月的世界人工智能大會(WAIC)期間,中國提出最新版倡議性文件《人工智能全球治理行動計劃》,試圖為這個全球議題提出「中國方案」,當中就包括幫助全球南方國家真正接觸和應用人工智能」、支持這些國家發展AI技術和服務。
儘管西方輿論對中國模型的數據私隱與合規性充滿疑慮,但對於全球南方國家而言,實用主義勝過了一切。
全球開源社區風向標Hugging Face的最新報告顯示,中國模型已佔據Hugging Face月度模型下載總量的41%,首次超越美國模型。在2025年推出的新模型中,超過63%的熱門微調模型是基於中國開源底座(如DeepSeek-R1或Qwen系列)開發的。
全球最大AI模型API聚合平台OpenRouter3月發布的數據則顯示,自2026年2月起,中國AI模型在該平台的Token消耗量首次超過美國競爭對手,在3月16至22日這一周內,全球前10大熱門模型共消耗8.7兆token,當中中國模型佔比達到約61%(約5.3兆Token)。
不僅在非洲,在東南亞,馬來西亞研究機構利用DeepSeek微調出了全球首個符合伊斯蘭教法的AI模型「NurAI」。該模型不僅支持馬來語、印尼語,更確保輸出內容符合穆斯林市場的宗教與文化標準。在日本,當地企業開發的前10大模型中,有6個是基於DeepSeek和Qwen構建的。從印尼的數字身份系統到肯尼亞的斯瓦希里語醫療問答,中國技術正在滲透進這些國家的社會底層架構。
正如Mwebaze所言:「如果一位農民無法獲取資訊,而這個模型能提供她能理解的準確信息,我們就會認為這是非常好的......如果你來自一個根本沒有模型可用的地方,你首要的任務就是讓技術先運作起來。」