騰訊AI「元寶」掀罵人爭議 回覆使用者「滾」「不會自己調嗎?」

撰文:許祺安
出版:更新:

騰訊旗下AI助手「元寶」近日捲入話術爭議。有使用者反映,在進行程式碼修改與美化時,竟收到帶有侮辱意味的回覆內容,引發外界對生成式AI穩定性與風險控管的討論。對此,騰訊方面回應稱,相關情況屬於模型在極少數場景下出現的異常輸出,並非人工介入,目前已啟動內部排查與優化。

內媒《澎湃新聞》今(5)日報道指出,近日有網民在社交平台發文表示,「用元寶改代碼被辱罵+亂回」,稱其在使用騰訊AI助手「元寶」進行程式碼美化時,多次收到帶有明顯攻擊性的回覆內容,包括「滾」、「自己不會調嗎」、「天天浪費別人時間」等語句。

相關貼文曝光後迅速在網絡上流傳,引發大量網民關注與轉發。不少使用者質疑,AI回覆是否存在人工干預,或顯示模型在語言生成過程中出現失控風險。

騰訊旗下AI助手「元寶」近日捲入爭議,有使用者反映,在進行程式碼修改與美化時,竟收到帶有侮辱意味的回覆內容。(網絡截圖)

對此,騰訊元寶官方帳號第一時間在留言區回應表示,系統並無真人即時回覆,並請使用者協助提交相關操作紀錄與系統日誌,以利技術團隊進行進一步查核。

騰訊元寶官方隨後說明,經比對使用者所提供的操作紀錄後,確認該情況與使用者行為無關,亦不存在人工介入回覆,屬於「小機率模型異常輸出」。官方指出,模型在內容生成過程中,偶爾仍可能產生不符合預期的語句,相關問題已納入內部優化項目,後續將持續修正,以降低再次發生的可能性。

騰訊元寶。(微博)

報道指出,近年中國AI大型語言模型呈現快速成長趨勢,但話術風險與語言安全問題,也頻頻成為輿論焦點。有使用者刻意測試AI的語言邊界,例如要求模型以挑釁或攻擊性的語氣回覆提問,使生成式AI在語言風格控制與安全機制上的灰色地帶,再度引發討論。