科技巨頭Coinbase「棄美轉中」 為省成本改用中國AI

撰文:觀察者網
出版:更新:

美國科技企業正在悄然將中國開源AI模型納入生產基礎設施。隨著頂尖美國模型服務成本持續攀升,以美國加密貨幣交易所Coinbase為代表的企業開始以中國開源模型作為默認選項,以此在不壓制使用量的前提下大幅壓縮AI開支。

Coinbase首席執行官Brian Armstrong上週末在社交平台X發文披露,公司已通過內部LLM網關,將智譜的GLM 5.2和月之暗面的Kimi K2.7設為全體工程師的默認大模型。

Coinbase首席執行官Brian Armstrong發文稱,已通過內部LLM網關把GLM 5.2和Kimi K2.7設為全體工程師的默認模型。(X平台截圖)

儘管沒有披露具體數字,但是Armstrong表示,在Token使用量持續指數級增長的同時,通過換默認模型、智能路由、強化緩存,使得Coinbase的AI支出已被壓縮近一半,並強調任何公司都可以照搬實現降本增效。

他同時披露,公司91%的工程師從未觸及原有的用量上限,因此本次成本優化並沒有下調員工Token額度、而是把代碼審查、文檔總結等常規任務的默認模型,從Anthropic、OpenAI的前沿模型換成兩款來自中國的開源模型。

GLM 5.2是智譜6月12日公開、隨後以MIT協議開放權重的旗艦模型。在被廣泛引用的第三方評測Artificial Analysis上,它成為當前得分最高的開源權重模型,並躋身全球前列。

GLM 5.2在SWE-bench Pro等指標上超過OpenAI的GPT-5.5,在FrontierSWE等任務上接近Anthropic的旗艦模型Opus 4.8。作為能在大量高強度工程任務里與閉源前沿模型同桌競爭的開源模型,它的調用價格,只有Opus 4.8的幾分之一。

月之暗面的Kimi大模型也在近期持續在海外市場打出聲量。近期被馬斯克以600億美元收購的美國AI編程工具公司Cursor,在今年三月被爆出自研模型Composer 2「套殼」Kimi K2.5模型。

公司的年度經常性收入(ARR)從今年3月的約1億美元翻倍到4月的2億美元以上,海外API收入自去年11月以來漲了約四倍;資本市場隨之跟進,月之暗面的估值在半年內從43億美元飆升至200億美元。Coinbase默認調用的Kimi K2.7 Code,正是Kimi在6月12日發佈的最新代碼模型。

愈來愈多美國公司把負載轉向中國開源模型

Coinbase的案例並非孤例,在美國企業AI開支普遍失控的背景下,越來越多美國公司把負載轉向中國開源模型。

繼去年Airbnb將客服模型從GPT切換到千問(Qwen)後,近期美國AI公司Lindy把模型從Anthropic Claude遷到DeepSeek V4,此前其AI開支已超過員工工資總額;Snowflake的首席執行官測算後認為,GLM 5.2能以低得多的價格做到與Claude相當的性能。

美中經濟與安全審查委員會今年3月的一份報告估計,約80%的美國AI初創公司在使用中國開源模型;在OpenRouter上,中國模型的Token份額也已從一年前的不到2%,升至今年4月的四成以上。

阿里巴巴千問(Qwen)系列的累計下載量更在今年1月突破7億,並在Hugging Face累計下載量上超過Meta的Llama,成為全球下載量最高的開源模型家族之一。

而在展示AI大模型調用的平台OpenRouter上,來自中國的大模型長期佔據了榜單的第一梯隊。

OpenRouter文本模型調用榜單上,DeepSeek、小米MiMo、MiniMax、騰訊混元、智譜GLM等中國模型佔據第一梯隊。

值得額外關注的是,這一切發生在中美圍繞AI持續摩擦的背景下。智譜2025年1月就被美國商務部以「助力中國軍事現代化」為由列入實體清單,是首家上榜的中國大模型公司。

月之暗面則在今年2月被Anthropic公開點名,指其與DeepSeek、MiniMax一道通過虛假帳號「蒸餾」Claude,今年6月Anthropic又指控阿里巴巴的Qwen團隊發起規模更大的蒸餾。

針對數據安全和國家安全等潛在的合規問題,Coinbase稱已把開源權重下載到自有服務器自托管運行,代碼和提問不會流向位於中國的API接口。企業把工程負載默認交給中國開源模型,也正對西方前沿廠商的定價形成壓力。

Anthropic已於6月1日向美國證監會秘密遞交IPO招股書,其接近萬億的市場估值核心取決於企業付費金額的快速增長,而企業成規模地把日常負載遷向更便宜的中國開源模型,外界恐怕將視為其增長故事需要面對的核心風險。

高盛測算,全球Token消耗量到2030年還可能增至現在的24倍;在目前OpenAI、Anthropic等美國閉源廠商定價持續高企的背景下,若單Token成本不降,企業賬單壓力還會繼續放大,而GPT 5.6和Claude Fable 5的封禁風波也使得模型的可獲得性成為了企業需要考慮的核心問題。

當性能進入第一梯隊的國產模型,和更低的價格同時擺上桌,擺在企業面前的選擇就不再是意識形態問題,而是越來越具體的成本、性能和部署控制權問題。

本文獲《觀察者網》授權轉載。