AI大模型術語「Token」譯名惹爭論 內地官方正式定名:詞元

撰文:鄭寧
出版:更新:

AI中文為人工智能,AI工具又被稱為「大模型」;大模型中的術語Token該如何翻譯,爭論已久。3月24日,中國政府網轉發人民日報援引自國家數據局的文章顯示,「我們日均詞元調用量突破140萬億」,正式將Token的中文名譯為「詞元」。

3月24日,中國政府網轉發人民日報援引自國家數據局的文章顯示,「我們日均詞元調用量突破140萬億」,正式將Token的中文名譯為「詞元」。

國家數據局發布的數據,人民日報發布,中國政府網轉發,官方政府機構與官方媒體雙重發布,其中都統一將Token稱為「詞元」。

Token該如何命名?爭論已久。此前騰訊研究院發表的文章中,學者楊斌提出的「模元」譯名。他認為,把token翻譯為模元。其中,「模」意為大模型、多模態,錨定AI場景的核心屬性;「元」代表最小基本單元,承續「字節」這類中文經典度量單位的命名邏輯,簡潔直白、通俗易懂。

清華大學可持續社會價值研究院發文《楊斌丨模元(token):AI時代的新度量衡》。清華大學教授楊斌建議,將「模元」這個詞作為「token」的中文譯法。

楊斌的這一建議,立刻引發各路AI界人士在社交平台和行業群組中紛紛給出自己的答案。除了「模元」外,「智元」這個名字浮出水面,並迅速獲得廣泛認同。

新加坡國立大學校長青年教授、潞晨科技創始人尤洋表示,「Token中文叫做『智元』,不知道『新智元』創始人是不是時空穿梭回來的。」

自由學者、原清華大學科學史系副教授胡翌霖提出,「真不如『智元』。計算機的單元是字節,Token是人類智識的計算單元。Token不是通用計算的概念,是『通用智能』的概念,『智』比『通』更切中要害。」

百川智能創始人王小川表示,「叫做『智元』挺好的。」資深開源人士陳緒也稱,「這幾天提出了各種x元,就覺得『智元』能打動我,符合信達雅的要求。」

最終,官方給出定論,正式譯名為「詞元」。據人民網的解釋,「詞元」是AI理解人類語言的最小單位,Token切分出的單位有時是字,有時是詞,而詞更能覆蓋這種範圍。

Token中文譯名為詞元。(鞭牛士)