DeepSeek創辧人是誰?標準科技狂迷、請人見「有8年資歷」即pass

撰文:今周刊
出版:更新:

「我們不是故意要成為一條鯰魚,只是,不小心成了一條鯰魚⋯⋯。」這是中國AI新創公司深度求索(DeepSeek)創辦人梁文鋒,在2024年中接受中國媒體採訪時的一段談話。

今年1月20日,國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議,梁文鋒在會上發言。

DeepSeek與梁文鋒的故事,得先從廣東西南部的小城——湛江說起。

梁文鋒在1985年出生於廣東湛江吳川巿的一個小村落 —— 米歷嶺村。據家鄉人的說法,梁文鋒自小就精通數理,初中時期就學完了高中數學,甚至開始自學大學的微積分等課程。

最後一排右邊第6個是梁文鋒。(南方日報)

約當同時,梁文鋒開始大量囤積來自輝達的顯卡。在梁文峰參與的一篇技術論文裡寫道,幻方於2021年耗資10億元推出的改良版「螢火二號」,部署了多達1萬張的輝達A100顯卡。據中國業內人士估算,幻方的螢火超算平台,算力至少是同業平均的10倍以上。

2023年5月,38歲的梁文鋒宣布進軍AGI;2024年底發表的DeepSeek-V3,該模型的效能不僅足以對標OpenAI最先進模型GPT-4o,訓練成本更僅約557.6萬美元,用了僅約20分之1的算力資源,就達到了相同的效能。今年1月,DeepSeek-R1模型的發佈,更宛如在AI界投下一枚深水炸彈。

相關文章:生成式AI席捲職場!這「15種技能」越見重要 及早掌握保持競爭力

+18

這家成立僅一年多的AI新創公司,為何能如此讓全球科技巨擘都為之震顫?或可從梁文鋒獨特的管理與用人哲學,窺探出一絲端倪。

我們的核心技術職位,基本上以應屆和畢業1、2年的人為主。

梁文鋒曾表示,在招募人員上, 他首重的是能力,至於經驗,反而是「扣分項」。

根據公開數據,DeepSeek目前約140位的工程師團隊,幾乎清一色都是應屆畢業生或博士在讀生,「工作經驗在3到5年,已經是最多了,工作超過8年的,基本就pass了。」一名親近Deepseek的獵頭如此觀察。

不僅如此,招募新人時,DeepSeek還非常看重他們在國際知名程式設計競賽的表現,「基本是『金獎』以下就不要了。」一名協力廠商指出。

梁文鋒除了提供比中國一線科技大廠更優渥的薪資待遇,他授權、無為的管理方式,更是留才關鍵。

「每個人都有自己獨特的成長經歷,都是自帶想法的,不需要push他⋯⋯,當一個idea顯示出潛力,我們也會自上而下地去調配資源。」梁文鋒曾在訪談中如此形容他的「不干預」哲學。

相關文章:ChatGPT|AI科技威脅打工仔飯碗?6種應用方法 反可提升工作效率

+23

談及梁文鋒,不少員工對他的形容是,與其說他像個老闆,不如說他更像個「極客」(geek)。梁文鋒的日常,就是看論文、寫代碼、參與小組討論,是少有具備一線研究員能力的公司掌舵者。

梁文鋒曾感嘆,中國AI和美國的真正差距,是來自「原創和模仿」的差距。「如果這不改變,中國永遠只能是追隨者。」

如今,DeepSeek火爆全球,微軟、英偉達、亞馬遜等一線美國科技大廠,乃至中國的百度、阿里巴巴等,紛紛高調宣告擁抱DeepSeek R1的服務之際,梁文鋒孜孜矻矻追求的「硬派創新」夢想,或許,已在實現的道路上。

延伸閱讀:ChatGPT|一文認識OpenAI CEO奧特曼 8歲寫程式、曾與馬斯克創業

+24

延伸閱讀:小心跟錯老細!哈佛教授稱5種性格領導者易失敗 朱克伯格竟中3項

+8

延伸閱讀:

半導體廠全球裁員1800人!汽車晶片一堆賣不掉才動刀…員工能去哪?公司竟回「應該不會失業太久」

中國、香港包裹美國恢復接收!不到一天政策為何急轉彎?海關、郵政正悄悄對中實施「收集機制」

【本文獲「今周刊」授權轉載。】