AI大模型術語「Token」譯名惹爭論 內地官方正式定名:詞元
撰文:鄭寧
出版:更新:
AI中文為人工智能,AI工具又被稱為「大模型」;大模型中的術語Token該如何翻譯,爭論已久。3月24日,中國政府網轉發人民日報援引自國家數據局的文章顯示,「我們日均詞元調用量突破140萬億」,正式將Token的中文名譯為「詞元」。
國家數據局發布的數據,人民日報發布,中國政府網轉發,官方政府機構與官方媒體雙重發布,其中都統一將Token稱為「詞元」。
Token該如何命名?爭論已久。此前騰訊研究院發表的文章中,學者楊斌提出的「模元」譯名。他認為,把token翻譯為模元。其中,「模」意為大模型、多模態,錨定AI場景的核心屬性;「元」代表最小基本單元,承續「字節」這類中文經典度量單位的命名邏輯,簡潔直白、通俗易懂。
楊斌的這一建議,立刻引發各路AI界人士在社交平台和行業群組中紛紛給出自己的答案。除了「模元」外,「智元」這個名字浮出水面,並迅速獲得廣泛認同。
新加坡國立大學校長青年教授、潞晨科技創始人尤洋表示,「Token中文叫做『智元』,不知道『新智元』創始人是不是時空穿梭回來的。」
自由學者、原清華大學科學史系副教授胡翌霖提出,「真不如『智元』。計算機的單元是字節,Token是人類智識的計算單元。Token不是通用計算的概念,是『通用智能』的概念,『智』比『通』更切中要害。」
百川智能創始人王小川表示,「叫做『智元』挺好的。」資深開源人士陳緒也稱,「這幾天提出了各種x元,就覺得『智元』能打動我,符合信達雅的要求。」
最終,官方給出定論,正式譯名為「詞元」。據人民網的解釋,「詞元」是AI理解人類語言的最小單位,Token切分出的單位有時是字,有時是詞,而詞更能覆蓋這種範圍。
中國AI調用量環比增57% 連續3周超美國 8成美企使用中國大模型AI催生中國變壓器訂單暴漲 產能佔全球6成 電力算力成超美關鍵一半中國男性活不過70?自媒體引AI炮製短命論 專家指應如此計算假擺拍和AI片呃流量 中央網信辦整治亂象 要求影片要做内容標注黃仁勳罕見談台海:美國對華應克制 籲科技領袖勿散播AI威脅論