Manus從神壇跌落?還是能成就下一個DeepSeek時刻?
一家神秘的中國初創公司憑藉一款顛覆性的人工智能(AI)應用,正在全球科技圈掀起巨浪。這裡說的並非今年1月震懾四方的深度求索(DeepSeek)AI大模型R1,而是一款多功能AI代理Manus。
Manus聯合創始人季逸超3月5日在演示影片中介紹,Manus的功能不限於提供解決方案,還能自主完成用戶下達的複雜指令,如生成報告、分析財經數據等。
季逸超宣稱,作為全球首款通用AI代理,Manus的性能優於美國OpenAI新發佈的代理應用DeepResearch和Operator,並在GAIA基準測試的比分高於DeepResearch。
GAIA是一個用於評估通用AI助手解決問題能力的基準測試。
目前大多數AI代理仍需一定程度的人工干預和監督,但季逸超說,Manus「是一個完全自主的代理,彌合了構思與執行之間的鴻溝,是人機協作的下一個範例」。
不用睡覺的隨身秘書
為了展現Manus的性能,影片還演示了三個案例:求職簡歷篩選、房產研究和股票分析。
以簡歷篩選為例,Manus能自主理解用戶的要求解壓文件包,並為文件包中的10份簡歷進行重點內容標注和候選人排序推薦;在房產研究的案例中,Manus還能結合家庭收入和孩子上學要求,在紐約篩選出安全、犯罪率低的社區,並推薦符合標準、適合購買的房產。
根據官網,Manus甚至能製作電子遊戲,以及構思「日本七天旅行並求婚」的攻略。
有網民形容,Manus就像一名萬能的隨身秘書,能替你安排好所有事情,而且完全不需要睡覺。
AI媒體《The Rundown AI》創始人Rowan Cheung 3月8日在社交媒體X發文說,Manus基本能完美地創建一個關於他個人傳記的網站,且內容100%準確。
Rowan還測試Manus進行長時間研究的能力,要求它設計一門關於AI培訓的課程。花費近兩小時,Manus就設計出一門涵蓋八個章節的課程,包含如何使用AI工具、應用場景及提示詞等。
他形容Manus是實實在在的產品,甚至宣稱「中國第二個DeepSeek時刻來了」。
美國AI企業Hugging Face產品負責人維特則利用Manus的代碼生成功能,編寫出一款飛機小遊戲。他形容,這是他用過「最令人印象深刻的AI工具」。
還有網民在實測後發現,Manus可同時管理50多個社交媒體賬號,並能實時創建一系列互動內容。
有評論認為,除了性能卓越,Manus的爆火,或多或少也沾了DeepSeek崛起的光芒。
今年1月中旬發佈的AI模型DeepSeek-R1,憑藉低成本和高性能重創美國科技股,還顛覆了外界對中美科技實力差距的想像,即美國AI霸主的地位不再是中國無法企及的。
因此,當Manus被視為DeepSeek崛起後的又一個後起之秀,自然引來中國媒體和網民集體為它起立歡呼。
有網民稱:「一夜之間,Manus讓矽谷無眠,讓ChatGPT沉默,讓DeepSeek流淚。」還有自媒體情緒激動地寫道:「這是DeepSeek之後的又一個王炸」「超越DeepSeek」「炸醒了整個AI圈」「中國團隊造,宇宙為我們閃爍」等。
還有不少券商急著開會評估Manus的影響,其中華泰證券更將Manus形容為AI代理的ChatGPT時刻。
此外,由於Manus母公司北京紅色蝴蝶科技公司的聯合創始人肖弘和季逸超,都是90後創業家,且都沒有在海外留學的經驗,不少中國自媒體就將上述兩人與背景相似的80後DeepSeek創始人梁文峰作對照。
不過,Manus雖在DeepSeek的光環下獲得潑天的流量,但這場流量的狂歡僅持續24小時,就迎來鋪天蓋地的質疑和爭議。
從神壇跌落
首先,Manus並不完全是從零打造出來的「顛覆性產品」。有網民在測試時發現,Manus的基礎結構使用的是美國企業Anthropic的Claude及阿里巴巴的通義千問等現有模型。
甚至有團隊僅用五個人三個小時,就通過拼接GPT等不同技術開發出Manus「山寨版」。搜狐科技認為,這意味著Manus的技術門檻並不高,本質仍是工具鏈的拼接,並非底層技術的突破。
季逸超星期一(3月10日)發影片承認,Manus調用了Claude和微調後的通義千問模型。
此外,與DeepSeek發佈後立即開源不同,Manus每天只限量發放500個邀請碼供外界測試。儘管Manus官方解釋這是因為他們「完全低估大家的熱情」、設計服務器容量有限,但不少網民質疑這是在刻意營造「饑餓營銷」。
據報道,由於Manus邀請碼的稀缺性,該邀請碼一度在中國的二手交易平台「閑魚」被炒至高達10萬元人民幣。
更為關鍵的是,Manus似乎並不如宣傳般的那麼好用,指令無法執行、執行時間長、信息不準確等吐嘈聲不曾間斷。
例如,科技博主TechCrunch記者讓Manus到附近餐館訂一份炸雞三明治和訂購飛往日本的機票,但均以系統崩潰告終,甚至無法給出有效的訂購和付款鏈接。
測試失敗後,該記者還讓Manus製作一款以《火影忍者》為靈感的格鬥遊戲,但半小時後,系統再次報錯。
還有用戶發現,Manus輸出的結果並不可靠。如Manus在進行遊戲機市場分析時,竟遺漏了日本遊戲巨頭任天堂的遊戲機,這是一個顯而易見的錯誤。
在X上還有一個戲劇性事件,知名AI網紅Barsee在3月8日上傳一段影片,聲稱Manus能同時執行50個任務,且比DeepSeek更準確,能同時處理金融交易、研究、採購等任務。
但這則推文發出僅一天,季逸超就出面闢謠「這個視頻絕對不是Manus的」。他說:「Manus是一個基於網絡的AI代理,類似於OpenAI Operator/DeepResearch,而不是智能手機的VNC(虛擬網絡控制台)。」
TechCrunch總結,諸如此類的自媒體錯誤炒作,以及邀請碼稀缺造成的排他性,或許就是造就Manus獲得不尋常關注的原因。從實測表現來看,Manus並沒有兌現技術承諾,「似乎是一個炒作領先於技術創新的案例」。
對於市場的批評,Manus合夥人張濤曾兩度發文道歉,並稱目前Manus仍處於初期階段,很多功能尚未完善。
DeepSeek突破式進展所激起的AI熱情及民族主義情緒,已讓市場和民間對中國科技產業的預期不斷膨脹。或許,正是在這股情緒下,Manus又不斷地抬高社會預期,加上產品本身的低透明度,才催生出這股有點像「狼來了」的轟動效應。
本文獲《聯合早報》授權轉載。