官方「漢字全息字典」上線 可檢索漢字字形歷史演變過程

撰文:崔德興
出版:更新:

日前,國家語言文字工作委員會基礎資源建設項目「通用漢字全息數據庫建設」的標誌性成果「漢字全息資源應用系統」正式啟動上線。負責人介紹,透過該系統,用戶可搜索漢字字意、字音,甚至歷代辭書對該字的釋義,及其在一些常用古籍文獻中被使用的情況。

系統顯示漢字字形歷史演變過程。(網上圖片)

項目由北京師範大學中國文字整理與規範研究中心、漢字研究與現代應用實驗室負責實施。據介紹,該項目旨在運用現代中文信息處理技術,構建一個具有多維關聯關係、科學系統、高效實用的漢字全息數據庫。項目主持人、北京師範大學教授王立軍表示,從中小學基礎教育領域到漢字研究的專業人士,系統可以滿足不同人士的需要。

本期上線的系統涵蓋字符集4種,其中常用字集3500字,通用規範字8105字,古籍印刷字16490字,全字符集81722字;還有辭書20種,古籍文獻60種,歷代字形圖415675個。其中包括大量的圖形信息資源和文本信息資源,分別來自古文字拓片、文字編、規範字表、編碼字符集、歷代辭書、經典文獻、中小學語文教材等,涵蓋了古今各個時期文字的形、音、義、用、碼五大方面的重要信息。

顯示常用古籍文獻中的句子

此外,系統選取歷代具有代表性的辭書,並選擇最優的版本作為搭建框架的基礎素材,包括《爾雅》、《說文》、《康熙字典》、《新華字典》、《通用規範漢字字典》等,搜索時會顯示歷代辭書的釋義。而在每個字的「用例」一欄,系統選取具有代表性的傳世文獻作為古籍用例的來源,包括「十三經」、「二十五史」、「二十二子」等三大典籍系統,提取漢字在這些文獻中的使用例句,供研究者參考使用。