AI「大躍進」時　打工人訓練模型只為取代自己？

在探索中美AI行業內卷的故事時，筆者試圖去了解兩國AI打工人在這股熱潮下的親身經歷，其中一位曾經參與豆包模型開發、後又轉進阿里的AI部門的打工人的故事，或許能夠成為其中的代表。她在大廠工作四年，進入AI行業三年，坐在國內科技圈AI熱潮的頭等席，看着企業瘋狂砸錢、砸人力，訓練模型和變現，氣勢恍如「大躍進」。

採訪前一天，她收到老闆發到群里的短訊：「號召大家9116」，每天9點到11點，每周6天——「其他的團隊已經『捲』起來了」。

與大多數人不同的是，她在大廠殘酷的優勝劣汰機制下留了下來，成為這一批打工人中的幸運兒。由於字節、阿里等國內大廠對員工有嚴格的保密規定，我們暫且稱她為「A小姐」以保護她的身分。

剛剛進入字節時，A小姐在「頭條新聞」工作，每天朝十晚六，很多時候即便在崗也無事可做。下班以後就去學打架子鼓。「那個時候我真的很喜歡打鼓，因為那個時候我也不是很忙，報名上課花了我1萬塊錢。」

A小姐交了一年的學費，但在這期間，她從原來的部門調到了大模型研發的崗位，也就是後來字節推出的「豆包」項目團隊，讓這1萬塊打了水漂。

2022年底ChatGPT3.5橫空出世，在此之前，國內科技圈只有百度或者一些好的創業公司有AI大模型方面的一些佈局：「其實國內大廠都沒有認真關心過這個事。但3.5出現後，讓大家看到原來真的能搞出來一個對話機械人，然後大家很興奮，就開始招兵買馬做。」

2023年4月至5月，字節跳動開始大規模投入大模型研發（豆包項目），內部進行了瘋狂擴招。A小姐通過「內部活水（轉崗）」機制加入了當時急需大量人力的豆包團隊。當時她與大多數人一樣，認為這是一個新興、有趣且極具前景的行業，都想投入其中。

「你不會特別想到加班會很嚴重或者什麼，而且當時豆包這個部門是強制大小週的，為了讓你更有積極性一點，他說我們是有加班費的。其實你在大廠的其他部門，這種日常加班一般是沒有加班費的，所以你雖然比較累，但是你錢賺多了。」

A小姐這時還有一種「創造新東西」的興奮感（Exciting），感覺自己在做一件有意義且處於前沿的事情。

但後來的發展，是出乎大多數人意料的。

2023年到2024年間，訓練模型的工作基本是「教AI說人話」，就像老師給學生改作文，需要人工手寫一個「標準答案」（比如寫一篇小說、回答今天是幾號），然後餵給AI，讓它模仿。這時模型的優化還沒有什麼技術難度，基本是靠投入大量的人力完成。

隨着DeepSeek等推理模型的出現，AI不再只是學說話，而是要「辦事」，成為具有工具調用能力的Agent（智能體），訓練過程不再是教它怎麼寫字，而是教它怎麼解決一個複雜的現實難題。

舉例而言，以前輸入「給我推薦一家餐廳」的指令，AI可能會編造一個餐廳的名字。但現在，AI必須像真人一樣思考和操作：先打開地圖APP，定位你在哪；打開OpenRice，搜尋附近的餐廳；對比評分高低；計算餐廳離你的距離；最後綜合推理，告訴你：「推薦去這家，因為它評分高且離你最近。」

這時，訓練模型需要的人力要求也變高了——不能只看文字通不通順，而是必須懂代碼、懂數據分析，檢查寫的Python代碼有沒有錯、它的推理邏輯（先查地圖再查評分）是否合理。

2024到2025年，各大廠的大模型訓練逐漸轉向自動評估——設計一套「評分規則」，讓AI進行「自動化評測」。這時，前期的大量人力失去了價值，企業立刻開始裁員。

在這期間，A小姐升職，開始帶領團隊，隨之而來的是更大的壓力，開始「向上管理」，要證明部門價值，也要執行裁員指標。有一段時間公司開始流行「降本增效」的極端口號，逼迫員工思考「怎麼拿更少的人做更多的事」，形成了一套不斷招、不斷裁的機制——優先裁掉前幾年擴張期招進來的、學歷相對普通（普通一本或二本）、績效不佳或成本較高的「老員工」，轉而招聘學歷背景更好（985高校、海外研究生）、更年輕、更聰明且工資相對較低的應屆生或實習生——「又便宜又好」。那些日以繼夜過着996生活、訓練和優化模型的打工人，終於被模型給取代。

「當時非常流行這句話，如何讓更少的人完成更多的事情。我每次聽到這些話都想吐。」

A小姐去年從字節跳到了阿里，感受到大廠內卷的極致——「阿里非常喜歡搞大躍進，並且喜歡講故事。他們通常想在兩個月內推出一個大產品，於是我就瘋狂地進行宣發，將這個產品推廣出來。」

在內部，阿里實行「賽馬機制」，兩三個團隊做同樣的事，輸者全員被裁，或被拆解輸送人才。甚至不同業務線也競爭激烈，一些部門甚至將內部其他事業部的產品視為直接競品（對標對象）。

由於人力成本高，在降本增效的方針下，裁員變成了管理層的「政績」，甚至層層加碼——老闆要求裁10%，中層就裁20%，不顧實際業務需求。

A小姐自述，以前自己是個「F人」（MBTI中的情感型），情感豐富，也容易感受到他人豐富的情感，但這兩年工作下來，A小姐逐漸變成了「T人」（MBTI中的理性型），遇到事情已經不會有太多情緒上的波動，團隊有女孩因工作做不完打電話崩潰大哭，她沒有安慰，只是開始思考解決問題、安排任務。

她坦言，這幾年能在高壓、決策混亂的大廠環境中生存下來，是因為能夠剝離個人情感、不追求價值認同、純粹以「打工賺錢」為目的，避免精神崩潰——「他們都說我是『天選打工人』」。

對於AI的迅速更新迭代，A小姐有一種「過一天算一天」的感覺：

「我認為現在模型發展速度比想像中快很多，尤其是我們23年看到的（模型）是那麼粗糙的形態，現在已經變得很好了。例如之前做產品經理，需要手畫交互界面到底是什麼樣子的，你可能需要畫好幾天，今天在畫前端時，我讓新版3.0pro畫，兩分鐘後我再告訴他如何修改，一分鐘就畫完了。他可能取代了好幾天的工作量。」

眼下，國內的AI產業還在擴張期，對人力的需求整體還在增加，但在許多真正做模型的人認為這個窗口期並不長：「實際上我們心裏都覺得，再過幾年就真的找不到工作了。」

DeepSeek因996成功？　矽谷「中國焦慮」論的虛實｜專欄國內整頓、國外興起　美國矽谷如何掀起「996」風潮？｜專欄

AI「大躍進」時　打工人訓練模型只為取代自己？｜專欄

AI「大躍進」時　打工人訓練模型只為取代自己？｜專欄

AI「大躍進」時 打工人訓練模型只為取代自己？｜專欄

AI「大躍進」時 打工人訓練模型只為取代自己？｜專欄

AI「大躍進」時　打工人訓練模型只為取代自己？｜專欄

AI「大躍進」時　打工人訓練模型只為取代自己？｜專欄