120萬億Token!中國AI正在「卷」死美國|財經拆局

撰文:格隆匯
出版:更新:

2026年4月2日,火山引擎在一場巡展上,扔出了一顆「核彈」:豆包大模型日均Token使用量,突破120萬億!3個月內翻倍,相比發布時增長了1000倍。

同一場發布會上,火山引擎總裁譚待還拋出了一個重要細節:累計Token使用量超一萬億的企業客戶,已從2025年底的約100家增至140家,短短3個月新增了40家,這標誌着——AI已經從「免費試用」階段正式進入「企業規模化付費」階段。

幾乎同一天,智譜AI發布上市後首份財報,給出了一個極具衝擊力的數字:2025年全年收入超7.24億元,按年增長132%;其MaaSAPI平台的年度經常性收入(ARR)已突破17億元(約2.5億美元),按年實現60倍增長。更關鍵的是,智譜的平台註冊用戶已突破400萬,覆蓋全球超過218個國家和地區。

而英偉達也沒閒着,3個月內狂砸60億美元,同時投了Marvell、Lumentum、Coherent三家,全押在硅光子和AI光互聯上。

這三件事放在一起,再次釋放一個無比強烈的信號:中國AI的超級紅利期,已經全面到來了。

01

120萬億Token,聽起來抽象。我們算筆賬:假如平均一次API調用消耗2000Token,120萬億÷2000=每天6000億次調用。

從個人助手到企業服務,從寫文案到生成視頻,AI已經從「嚐鮮工具」變成了水電煤一樣的基礎設施。

更關鍵的是——這不是免費的狂歡,而是真金白銀的付費。

數據顯示,累計Token使用量超萬億的企業客戶,3個月內從100家漲到140家;個人用戶的Token用量,近1個月暴增16倍。

而智譜在2026年一季度逆勢將核心模型API價格上調83%後,平台調用量反而增長了約400%,呈現出典型的「量價齊升」態勢。

這意味着客戶不再為低價付款,而是為「能不能完成任務」付費。

免費試用→高頻付費→漲價不減量,這個商業閉環,徹底跑通了。

為什麼Token漲得這麼瘋?

因為AI的使用方式,徹底變了。

第一,視頻生成,一口吃掉百萬Token。字節自研的Seedance2.0,被譚待稱為「中國第一個毫無爭議的全球SOTA視頻模型」。2026年春晚《賀花神》《馭風歌》的視覺特效就是用它生成的。但伴隨爆火的是長達7小時的排隊,高峰時段排隊人數長期保持在9萬人左右——需求遠遠超出了供給。

為什麼這麼火?因為視頻生成的Token消耗遠超文本:生成1分鐘720p視頻,需要超過100萬Token,是普通文本對話的100多倍。

但與傳統影視製作相比,Seedance2.0的性價比簡直是降維打擊——製作效率較傳統模式提升逾一倍,製作成本下降70%。

按業內測算,整體制作成本有望從過去的萬元級降至數千元。這才是豆包3個月Token翻倍的真實推手。

第二,智能體,讓AI從「問答」變「幹活」。升級後的ArkClaw(龍蝦智能體),不再是聊聊天那麼簡單。它能對接飛書、微信、釘釘、微博,聯動網盤,自主完成訊息檢索、數據處理、跨工具協作。

一次企業級任務,動輒幾十萬甚至上百萬Token。

中信證券測算,智能體執行任務時整體Token消耗可能提升十倍以上,對應的算力需求得漲百倍以上。這種「推理密度」的增加,讓單次任務的Token消耗呈指數級上升。

在OpenRouter平台上,超過70%的Token消耗來自網路大廠、中大型企業、專業程序員的生產環境。在100K到1MToken這個區間(智能體工作流最典型的消耗區間),中國模型的調用量遙遙領先。

應用爆發→Token增長→模型優化→更多應用。這個正向商業落地循環,真的已經轉起來了。

02

很多人問:中國大模型商業化能如此迅猛,憑什麼?

答案很簡單:成本,低到令人髮指的成本!大模型運營成本里,60%-80%是電費。中國西部(甘肅、內蒙古、貴州)綠電價格只要0.13-0.3元/度。在美國呢?0.8-1.2元/度。

光電力一項,中國就比美國便宜4-5倍。

如果假設一個大型推理集群年用電量為100GWh,僅電力一項,中國的年成本約1150萬美元,美國約1540萬美元——差出近400萬美元。

再加上MoE架構、極致量化、KV緩存……推理效率再比美國高3-10倍,雙重降維打擊下,中國模型的推理成本被壓縮至美國模型的1/6至1/10。

最終體現在API定價上(美元/百萬Token):

-MiniMaxM2.5:輸入0.3、輸出1.1;

-智譜GLM-5:輸入0.3、輸出2.55;

-通義Qwen3.5:輸入0.11、輸出0.44;

-對比ClaudeOpus4.6:輸入5、輸出25;

這意味着,中國模型成本只有美國巨頭的1/10到1/20,甚至更低。

形同天塹一樣的差距。

而性能呢?在文本生成、代碼、翻譯、日常推理等90%的高頻場景,中國頭部模型已經達到GPT-5、Gemini3的95%以上。

對絕大多數用戶來說,「夠用、好用、便宜」就是全部。中國模型完美踩中了這個點。

於是,全球開發者用腳投票:OpenRouter平台數據顯示,47.17%的用戶是美國本土開發者,中國開發者僅佔6.01%,但中國大模型在該平台的周Token調用量佔比已達61%,連續三周超越美國。

更震撼的是調用量排名:在全球前九大模型中,中國佔據五席,小米MiMo-V2-Pro、階躍星辰Step3.5Flash、MiniMaxM2.5、DeepSeekV3.2包攬前四,智譜GLM-5Turbo位列第六。

這樣的大模型,超級便宜又足夠能打,海外市場想要「脱鈎」?不存在的。「成本剛需」已經碾碎了所有壁壘。

不過,另一方面,中國Token的超級紅利,卻是OpenAI、Google、xAI的壓力挑戰。

來看幾個硬核數據:

OpenAI:ChatGPT在生成式AI網頁流量中的份額從2025年1月的86.7%暴跌至2026年1月的64.5%,一年跌了22.2個百分點。2月全球月活用戶約5.35億,按月下降6.5%。運營虧損預計將達到140億美元,幾乎是前一年的三倍。更諷刺的是,80%的用戶全年交互不足1000次——打開率還不如外賣軟件。

Google:儘管Gemini的份額從5.7%漲到了21.5%,但AIStudio開發者流失25%,被迫推出低價版GeminiFlash(3美元/百萬Token),但成本仍是中國模型的3倍。

xAI:Grok份額從不足1%漲到3.4%,但X平台使用率下滑40%,性能不及GPT-5,成本是中國模型的10倍,基本與性價比無緣。

未來幾年,我們或許會看到,全球AI市場正在形成清晰的分層格局:

一邊是美國模型守住全球20%高端用戶,主打國際市場專業推理、品牌溢價、企業安全,然後拿走80%收入;

另一邊是中國模型拿下全球80%大眾用戶,主打靠薄利多銷的普惠、性價比、規模化落地,拿下20%收入。

別看這20%的收入比例雖小,但放在全球市場,集中在國內少數幾家大模型巨頭公司上,依舊能讓它們吃得滿嘴流油。

03

豆包大模型日均Token使用量120萬億的背後,是算力需求的指數級暴漲的最好驗證信號。

傳統銅纜互聯,在萬卡集群中,70%的算力都浪費在數據傳輸上。根本扛不住視頻、智能體的高帶寬需求。於是硅光子技術,成為當前唯一的解。用光信號替代電信號,帶寬提升10-100倍,功耗降低70%,延遲減半。

最近,英偉達對硅光子技術的佈局堪稱教科書級別:

3月初:向Lumentum和Coherent各投20億美元,鎖定CW激光器、EML晶片等1.6T/CPO時代的核心原材料;

3月底:再向Marvell投20億美元,通過NVLinkFusion首次向第三方定製晶片開放互聯協議。

30天內豪擲60億美元,完成了對AI算力集群光互聯版圖的系統性合圍。

黃仁勳曾高調明確說過:「推理轉折點已經到來,Token生成需求激增,全球都在競相構建人工智能工廠。」

這意味着什麼?

光通信(光晶片、光模塊、光纖光纜)成為AI板塊最確定、彈性最大的增量賽道。

據悉,2026年全球EML光晶片需求約3.5億顆,產能僅約2億顆,缺口高達1.5億顆,產能已經排到了2028年。

於是我們看到了,從2025年至今,在美股、A股甚至港股,這些賽道里都誕生了大批量的1年數倍甚至超十倍的超級大牛股,即使如此,資金依舊瘋狂湧入繼續推高估值。

因為它們篤定,這裏的增量蛋糕,還足夠大,足以撐起未來更大的估值敘事。

有人擔心:這波紅利能持續多久?

我覺得,至少能維持3-5年。因為有三道牆,海外的大模型翻不過來:

第一,能源壁壘。「東數西算+西部綠電」是全球獨有的算電協同體系。美國受地理和能源結構限制,永遠復刻不了中國0.13-0.3元/度的綠電成本。

第二,規模壁壘。Token調用量越大,單位成本越低。規模→成本→更多規模,正向循環一旦形成,美國模型就被徹底擠出性價比市場。

第三,生態壁壘。中國開源大模型的全球下載量已躍居世界第一。阿里通義千問Qwen累計下載超7億次,全球第一;基於中國模型的衍生模型超18萬個,遠超Google、Meta總和。全球開發者已經形成了路徑依賴,遷移成本極高。

這意味着,至少到2028年,中國的大模型都能享受到這一超級巨大的結構性紅利。

04 結語

中國日均Token調用量從不到1000億到180萬億,調用量兩年增長超千倍,這樣的數據,足夠說明一個趨勢——「一套以Token計費為基礎的新型商業邏輯正在全球加速演進」。

Token,是AI時代的「數字石油」。而中國大模型,正在成為全球最廉價、最高效的「數字石油生產商」。

1/20的成本,95%的性能,120萬億的日均消耗。

三重優勢疊加,讓中國AI在全球市場勢不可擋。

未來2-3年,依舊是中國Token出海的黃金窗口期。

AI應用持續爆發,算力與光通信同步兑現業績,美國巨頭持續退守高端,中國大模型全面主導全球普惠AI市場。

當廉價高效的中國Token覆蓋全球每一個角落,AI的普惠時代,才真正到來。

而中國,將是這場革命的主導者,也是最大的受益者。(全文完)