百度AI程式「文心一言」將完成內測 中國版ChatGPT指日可待?

撰文:聯合早報
出版:更新:

在Google 公布對話機器人Bard 後沒多久,百度亦針對當下最熱的 ChatGPT 推出新產品「文心一言」(ERNIE Bot),基於他們的文心(ERNIE)語意理解平台。
ChatGPT 是由OpenAI開發的一個人工智慧聊天機器人程式,於2022年11月推出。該程式使用基於GPT-3.5架構的大型語言模型並透過強化學習進行訓練。

微軟投資的人工智能公司OpenAI推出聊天機器人ChatGPT兩個月後,搜索引擎巨頭們坐不住了。

谷歌首席執行官皮查伊(Sundar Pichai)星期一(2月6日)親自下場發布公開信,推出名為Bard的AI(人工智能)聊天機器人服務,迎戰老對手微軟。Bard在谷歌有多麼受重視呢?它被列為「紅色警報」(code red)最高優先級項目,連處於半退休狀態的兩個創始人都被召回,牽頭舉行關於AI和搜索兩個領域如何整合的閉門研討會。

在中國,澎湃新聞等多家媒體星期二(7日)從百度內部人士處獲悉,全球最大的中文搜索引擎百度也要下場了。百度類似於ChatGPT的項目名字確定為「文心一言」,英文名ERNIE Bot,將在三月份完成內測,面向公眾開放。即使這個消息還在傳言階段,資本仍然直接給百度股價來了一波13%的大漲,創造了近一年來的新高。

ChatGPT何以全球爆火?

2022年末,ChatGPT橫空出世,掀起了與人工智能對話的熱潮。

它其實就是一款聊天機器人。聊天機器人對於很多人來說並不陌生,但ChatGPT能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣來聊天交流。在ChatGPT推出之前,關於自然語言的研究都缺乏本質突破。甚至有些學者認為,認知和對語言的理解是人的特殊天賦,機器怎麼學都是照貓畫虎,缺乏真正的理解。

ChatGPT卻技驚四座,出色地回答了人類提出的各種問題,其強大的理解自然語言的能力,使得特斯拉創始人馬斯克不禁感慨:「ChatGPT好到嚇人,我們離強大到危險的AI不遠了。」

馬斯克發推特讚揚ChatGPT的強大功能。(網絡圖片)

很多技術社區、技術愛好者,也都在不斷摸索ChatGPT無窮無盡的可能性。比如,有網友結合了自己的三個愛好:寫作、懸疑小說和爵士樂,要求ChatGPT為一部懸疑小說寫一段情節,情節中,一名失魂落魄的兇殺案偵探追捕一名高智商連環殺手,後者專門獵殺彈奏爵士樂的音樂家。

ChatGPT完美地理解了這名網友的要求,回复說:「偵探詹姆斯湯普森是兇殺案部門經驗豐富的老手,但最近他一直感到筋疲力盡和沮喪。 他最近的案件是關於一名年輕的爵士鋼琴家被謀殺案。鋼琴家被發現在家中被殘忍殺害,這加深了湯普森的絕望感。」

還有商家用戶想到請ChatGPT代替她回复餐廳消費者的評論。當消費者評價:「食物一般,風景不錯,僅此而已」時,ChatGPT回复說:「感謝您的評論。 如果您的用餐體驗沒有達到您的期望,我們深表歉意。 我們努力為所有客戶提供最優質的食品和服務,我們會在不斷改進的同時考慮您的反饋。 感謝您讓我們知道您的體驗。」

還有網友讓ChatGPT參加了完整的SAT(Scholastic Assessment Test)考試,考試總分為1600分,ChatGPT拿到了1020分。根據美國大學委員會的數據,1020這個分數段大概排在前52%的位置。

ChatGPT參加了完整的SAT考試,獲取了1020分的成績。(網絡圖片)

令人驚奇的是,當用戶命令ChatGPT找出一段程序的Bug時,它不僅可以清晰地描述Bug及原因,還能自動修復,寫出一段正確的程序。一名11歲的男孩子就在ChatGPT的協助下開發了一款遊戲,已經得到上千用戶遊玩。

此外,ChatGPT還可以用於翻譯、電子郵件回复、文檔生成、數據分析、圖片創作、客戶服務、代碼生成和調試等,因此引發了ChatGPT代替程序員、文字工作者甚至藝術創作者的討論。

針對ChatGPT的調戲、探討、詢問、閒聊貼刷屏社交媒體,沒有及時跟踪ChatGPT新聞的《紐約時報》甚至受到了馬斯克等技術大佬的嘲笑。

TED總裁安德森(Chris Anderson)發推文說:「我感到震驚的是,到目前為止,《紐約時報》對ChatGPT的報導幾乎為零,這無疑是今年最大的科技創新。」特斯拉創始人馬斯卡回復安德森說:「這是因為ChatGPT不是極左的運動(far left cause),《紐約時報》應該改名叫《社會正義時報》(The Social Justice Times)。」

搜索引擎巨頭的強勁對手

ChatGPT如此強大,推出後立馬讓搜索引擎巨頭們坐如針氈,谷歌、百度、搜狗、360等是率先被沖擊的對象。ChatGPT如果能夠為用戶提供足夠精準的內容,搜索引擎自然就會被用戶放棄。

目前,搜索引擎的廣告越來越多,向用戶推送的結果也越來越不精確。以往廣告只會出現在頭部和尾部,現在不僅增加了頭部和尾部的廣告數量,而且還在中間內容頁出現廣告。以百度為例,有些關鍵詞的搜索結果中,非廣告內容沒幾條,甚至要翻好幾頁才能找到想要的結果。百度2022年第三季度財報顯示,總營收為325億元(人民幣),網絡營銷營收就高達187億元,可見網絡營銷和廣告收入帶來的豐厚利潤。

有分析認為,比起百度等搜索引擎,ChatGPT能根據既有的內容進行分析和學習,從而給出答案,比只知道展示內容頁的搜索引擎要更加有效,而且免去了廣告給用戶帶來的痛苦,未來可能成為搜索引擎的強勁對手。

在2022年11月30日上線後五天,ChatGPT就吸引了超過100萬的用戶,推出兩個月後活躍用戶預計達到1億,成為史上增長最快的消費者應用。相比之下,達到1億月活躍用戶數,TikTok花了大約九個月的時間,Instagram花了兩年半。雖然ChatGPT到真正取代搜索引擎還有很多門檻要克服,但其用戶增長速度之快和功能之強大,都給科技巨頭們帶來實實在在的壓力。

「中國版ChatGPT」指日可待?

ChatGPT技術背後是自然語言處理大模型技術。經濟觀察網文章寫到,這些技術目前百度已經具備。百度具備跨模態、跨語言的深度語義理解與生成能力。

在研發資金上,百度創始人李彥宏多次在公開發言裡提到:「十年累計投入超過1000億,其中核心研發的投入佔比,連續多個季度超過了20%。」他在2017年左右就說過:「百度雖然收入不是第一,但研發佔比絕對第一。」

反復引用的研發投入額,似乎已經成了百度對外標榜具有技術基因、並引以為傲的證詞。不過,中國科技企業能否直追OpenAI的技術,有些網友持質疑的態度。在知乎帖子「國內那麼多AI專業,為什麼國內沒有ChatGPT」下,網友們給出了各種各樣的原因,比如技術路線的選擇不同,OpenAI一直堅持的是「生成式的自回歸語言模型」,而中國是沿著Bert+fine tuning的路線,這種不同技術路線也導致了後面差距越來越大。其他的原因還包括資金支持、審查、人力資源和商業文化等。

值得一提的是,有網友直接向ChatGPT提問:「為什麼ChatGPT率先出現在了美國,而不是中國?」

ChatGPT給出了三方面原因。第一,美國在人工智能領域的基礎性技術更先進,如神經網絡和深度學習,這些技術可用於構建大規模的語言模型,如ChatGPT。中國的人工智能研究集中在應用型技術,如計算機視覺和語音識別,難以開發出類似於ChatGPT的語言模型。

第二,美國的人工智能研究人員和機構之間的合作關係較為鬆散,研究人員可以自由地探索不同的研究方向,導致了更多的創新。中國的人工智能研究人員和機構之間的合作關係較為密切,研究人員需要遵循國家人工智能實驗室的方向,難以開發出類似於ChatGPT的語言模型。

第三,美國的學術氛圍在人工智能領域更為創新和重合作,研究人員可以自由地探索不同的研究方向,並與其他機構或公司合作開發新的技術。中國的學術氛圍在人工智能領域更為嚴謹和競爭,研究人員需要取得一定的科研成果才能在競爭中脫穎而出,難以獲得足夠的資金支持和技術支持來開發類似於ChatGPT的語言模型。

在去年的AI熱營銷峰會上,百度重點介紹自家的AIGC(AI生產內容)內容工具,並說:「未來,AIGC將顛覆現有內容生產模式,可以實現以十分之一的成本,以百倍千倍的生產速度,創造出有獨特價值和獨立視角的內容。」

在不少投資者眼中,ChatGPT已經成為了顛覆搜索等領域的新跳板和新機會。老一代科技公司能否再次揚帆起航,中國科技公司能否推出同樣出色的產品,大家都在和時間賽跑,爭著最先交出答卷。

【本文獲新加坡聯合早報授權轉載】

百度推出的新項目「文心一言」是什麼?

百度的新項目「文心一言」類似於ChatGPT,英文名ERNIE Bot,將在三月份完成內測,面向公眾開放。即使這個消息還在傳言階段,資本仍然直接給百度股價來了一波13%的大漲,創造了近一年來的新高。

ChatGPT是什麼?

ChatGPT 是由OpenAI開發的一個人工智慧聊天機器人程式,於2022年11月推出。該程式使用基於GPT-3.5架構的大型語言模型並透過強化學習進行訓練。