AI「大躍進」時 打工人訓練模型只為取代自己?|專欄
在探索中美AI行業內卷的故事時,筆者試圖去了解兩國AI打工人在這股熱潮下的親身經歷,其中一位曾經參與豆包模型開發、後又轉進阿里的AI部門的打工人的故事,或許能夠成為其中的代表。她在大廠工作四年,進入AI行業三年,坐在國內科技圈AI熱潮的頭等席,看着企業瘋狂砸錢、砸人力,訓練模型和變現,氣勢恍如「大躍進」。
採訪前一天,她收到老闆發到群里的短訊:「號召大家9116」,每天9點到11點,每周6天——「其他的團隊已經『捲』起來了」。
與大多數人不同的是,她在大廠殘酷的優勝劣汰機制下留了下來,成為這一批打工人中的幸運兒。由於字節、阿里等國內大廠對員工有嚴格的保密規定,我們暫且稱她為「A小姐」以保護她的身分。
剛剛進入字節時,A小姐在「頭條新聞」工作,每天朝十晚六,很多時候即便在崗也無事可做。下班以後就去學打架子鼓。「那個時候我真的很喜歡打鼓,因為那個時候我也不是很忙,報名上課花了我1萬塊錢。」
A小姐交了一年的學費,但在這期間,她從原來的部門調到了大模型研發的崗位,也就是後來字節推出的「豆包」項目團隊,讓這1萬塊打了水漂。
2022年底ChatGPT3.5橫空出世,在此之前,國內科技圈只有百度或者一些好的創業公司有AI大模型方面的一些佈局:「其實國內大廠都沒有認真關心過這個事。但3.5出現後,讓大家看到原來真的能搞出來一個對話機械人,然後大家很興奮,就開始招兵買馬做。」
2023年4月至5月,字節跳動開始大規模投入大模型研發(豆包項目),內部進行了瘋狂擴招。A小姐通過「內部活水(轉崗)」機制加入了當時急需大量人力的豆包團隊。當時她與大多數人一樣,認為這是一個新興、有趣且極具前景的行業,都想投入其中。
「你不會特別想到加班會很嚴重或者什麼,而且當時豆包這個部門是強制大小週的,為了讓你更有積極性一點,他說我們是有加班費的。其實你在大廠的其他部門,這種日常加班一般是沒有加班費的,所以你雖然比較累,但是你錢賺多了。」
A小姐這時還有一種「創造新東西」的興奮感(Exciting),感覺自己在做一件有意義且處於前沿的事情。
但後來的發展,是出乎大多數人意料的。
2023年到2024年間,訓練模型的工作基本是「教AI說人話」,就像老師給學生改作文,需要人工手寫一個「標準答案」(比如寫一篇小說、回答今天是幾號),然後餵給AI,讓它模仿。這時模型的優化還沒有什麼技術難度,基本是靠投入大量的人力完成。
隨着DeepSeek等推理模型的出現,AI不再只是學說話,而是要「辦事」,成為具有工具調用能力的Agent(智能體),訓練過程不再是教它怎麼寫字,而是教它怎麼解決一個複雜的現實難題。
舉例而言,以前輸入「給我推薦一家餐廳」的指令,AI可能會編造一個餐廳的名字。但現在,AI必須像真人一樣思考和操作:先打開地圖APP,定位你在哪;打開OpenRice,搜尋附近的餐廳;對比評分高低;計算餐廳離你的距離;最後綜合推理,告訴你:「推薦去這家,因為它評分高且離你最近。」
這時,訓練模型需要的人力要求也變高了——不能只看文字通不通順,而是必須懂代碼、懂數據分析,檢查寫的Python代碼有沒有錯、它的推理邏輯(先查地圖再查評分)是否合理。
2024到2025年,各大廠的大模型訓練逐漸轉向自動評估——設計一套「評分規則」,讓AI進行「自動化評測」。這時,前期的大量人力失去了價值,企業立刻開始裁員。
在這期間,A小姐升職,開始帶領團隊,隨之而來的是更大的壓力,開始「向上管理」,要證明部門價值,也要執行裁員指標。有一段時間公司開始流行「降本增效」的極端口號,逼迫員工思考「怎麼拿更少的人做更多的事」,形成了一套不斷招、不斷裁的機制——優先裁掉前幾年擴張期招進來的、學歷相對普通(普通一本或二本)、績效不佳或成本較高的「老員工」,轉而招聘學歷背景更好(985高校、海外研究生)、更年輕、更聰明且工資相對較低的應屆生或實習生——「又便宜又好」。那些日以繼夜過着996生活、訓練和優化模型的打工人,終於被模型給取代。
「當時非常流行這句話,如何讓更少的人完成更多的事情。我每次聽到這些話都想吐。」
A小姐去年從字節跳到了阿里,感受到大廠內卷的極致——「阿里非常喜歡搞大躍進,並且喜歡講故事。他們通常想在兩個月內推出一個大產品,於是我就瘋狂地進行宣發,將這個產品推廣出來。」
在內部,阿里實行「賽馬機制」,兩三個團隊做同樣的事,輸者全員被裁,或被拆解輸送人才。甚至不同業務線也競爭激烈,一些部門甚至將內部其他事業部的產品視為直接競品(對標對象)。
由於人力成本高,在降本增效的方針下,裁員變成了管理層的「政績」,甚至層層加碼——老闆要求裁10%,中層就裁20%,不顧實際業務需求。
A小姐自述,以前自己是個「F人」(MBTI中的情感型),情感豐富,也容易感受到他人豐富的情感,但這兩年工作下來,A小姐逐漸變成了「T人」(MBTI中的理性型),遇到事情已經不會有太多情緒上的波動,團隊有女孩因工作做不完打電話崩潰大哭,她沒有安慰,只是開始思考解決問題、安排任務。
她坦言,這幾年能在高壓、決策混亂的大廠環境中生存下來,是因為能夠剝離個人情感、不追求價值認同、純粹以「打工賺錢」為目的,避免精神崩潰——「他們都說我是『天選打工人』」。
對於AI的迅速更新迭代,A小姐有一種「過一天算一天」的感覺:
「我認為現在模型發展速度比想像中快很多,尤其是我們23年看到的(模型)是那麼粗糙的形態,現在已經變得很好了。例如之前做產品經理,需要手畫交互界面到底是什麼樣子的,你可能需要畫好幾天,今天在畫前端時,我讓新版3.0pro畫,兩分鐘後我再告訴他如何修改,一分鐘就畫完了。他可能取代了好幾天的工作量。」
眼下,國內的AI產業還在擴張期,對人力的需求整體還在增加,但在許多真正做模型的人認為這個窗口期並不長:「實際上我們心裏都覺得,再過幾年就真的找不到工作了。」