ASAP智庫｜中小學數字教育下一步怎麼走？

亞太政策倡議研究所（ASAP）專欄｜張博宇、張芷萱

隨着教育局《中小學數字教育發展藍圖》（下稱《藍圖》）的正式公布，香港特區政府在推動人工智能教育方面踏出了重要一步。《藍圖》為中小學課程融入人工智能素養訂立了清晰的方向與目標，反映特區政府就裝備新一代迎接人工智能時代所作的部署。在此基礎上，下一個問題自然是如何建立一個定期評估政策成效的機制，並據此作出合適的政策調整。這需要一套可信、可靠、科學化的測量工具，將抽象的「素養」概念轉化為可供客觀評估的具體指標。

學術界已出現AI素養評估工具

建立此類工具其實毋須從零開始，因為國際及本地學術界已有多套經嚴謹驗證的人工智能素養評估工具，並已發表於具高度公信力的學術期刊。這些期刊的影響因子（Impact Factor）均位列相關領域前25%。

要了解評估工具可信度的一個較直接方法，是查閱該工具是否已發表於具高度公信力的學術期刊。一般而言，在高公信力期刊刊載的評估工具，其信度（Reliability）與效度（Validity）均已通過嚴謹的學術驗證。衡量一本期刊是否具有公信力，學術界有一套客觀的標準，其中最常用的指標是「影響因子」（Impact Factor）。簡單來說，影響因子反映的是一本期刊的文章平均被其他學者引用多少次。數字越高，代表這本期刊在學界越受重視，發表於其中的研究越具有參考價值。期刊還會根據影響因子被劃分為 Q1 至 Q4 四個等級，Q1代表該學科領域中影響力最高的前25%期刊。能夠登上 Q1 期刊，意味着文章經過該領域頂尖專家的嚴格審查，內容站得腳，結論可供其他研究者引用和借鑒。

因此，在選取 AI 素養評估工具時，問卷背後的期刊等級是一個不可忽視的參考。近年，在高公信力期刊中已有多個AI 素養評估工具發表、且被多次引用，本文章會介紹當中的三個評估工具（問卷）。這三份問卷的縮寫分別為AILQ、SNAIL 和 MAILS，各有側重點，共同勾勒出當前環球AI 素養評估方法的大方向。

AILQ：香港「土生土長」的評估工具

在三份問卷中，最貼近香港實況的，是 AILQ（人工智能素養問卷，Artificial Intelligence Literacy Questionnaire）。這份問卷由香港學者開發，以363名香港本地中學生作為測試樣本，受訪者年齡介乎12至17歲。可以說，它是「土生土長」、為香港學生量身打造的評估工具。

AILQ 並非僅停留於測試學生對 AI 的基本認識，而是進一步衡量學生能否評估並應用 AI，以解決不同情境下的問題。問卷亦設有倫理相關題目，例如詢問學生是否認同 AI 系統應經過嚴格測試以確保其正常運作，以及用戶是否有責任了解 AI 系統的目的、運作方式和局限性，從而了解學生有否思考使用 AI 時的社會責任。

AILQ 另一個關鍵的特點在於其充分考慮了中學課程的知識框架與中學生的日常使用語境，題目按中學生的理解水平作出調整。更重要的是，它的信效度驗證是在香港學生身上完成的，意味着它所量出的結果，對比起其他國際問卷，更能反映香港學生的AI素養。

SNAIL：為「非專家」而設的通用工具

SNAIL（Scale for the Assessment of Non-experts’ AI Literacy）則是專為「非專家」群體而設計，即那些沒有接受過正式 AI 或電腦科學教育、主要作為 AI 使用者而非開發者的人群。值得注意的是，SNAIL刻意將程式設計技能排除在「AI 素養」的定義之外，因為研究者認為程式設計屬於另一套獨立能力，並非每個人都需要具備。SNAIL 的適用範圍相當廣泛，可以在各類教育場景（高中及以上）與職場環境中使用，目標是覆蓋盡可能多元的非專家群體。

對於AI素養，SNAIL確立了三個維度進行評估，即「技術理解」、「批判評估」與「實際應用」。這意味着對於一個人是否具備AI素養，不僅是需要知道其是否瞭解AI的基礎知識，更關鍵的是要懂得判斷AI 應用局限性及倫理問題。而「實際應用」的部分側重在理解受訪者是否能夠在日常生活和工作場景中辨識哪些技術由 AI 提供支持，以及判斷某個問題是否適合用 AI解決。

MAILS：把心理層面納入素養框架

而問卷 MAILS（Meta AI Literacy Scale）不僅涵蓋傳統意義上的 AI 素養維度，更將心理層面的因素正式納入測量框架，構成與其他問卷最根本的差異所在。具體而言，MAILS 特別關注兩個心理維度，一是學生在使用 AI 時的情緒狀態，尤其是管控焦慮與沮喪的能力；二是學生對自己使用 AI 能力的自我效能感，即「我相不相信自己能夠有效地使用 AI」。這些看似「軟性」的測量項目，實則是判斷學生 AI 素養能否真正轉化為行動的關鍵指標。問卷中的題目會直接探問學生在面對不熟悉的 AI 工具時是否感到不安、在使用 AI 解決問題時是否對自己的判斷有信心，甚至在發現 AI 給出錯誤答案時，是否具備足夠的心理素質去質疑和糾正。

這種設計為AI素養問卷的現實意義引入了一個新的反思，就是知識與行動之間，往往隔着一道心理的門檻。MAILS通過把這道門檻納入測量，能夠更立體地還原學生的真實素養狀態，不只告訴我們學生「能做什麼」，更告訴我們他們「為什麼願意或不願意去做」。

讓「AI素養」變得可測量

AI素養如今是一個人人都念茲在茲的關鍵詞，但具體如何量度？若缺乏嚴謹的測量工具，學生的AI素養有否上升便無從稽考。學術界已經提供了工具，核心期刊亦已經為這些工具的科學性背書。

現在缺失的拼圖，是政策決策者和教育界人士把問卷從期刊頁面帶進課室，把數據從研究報告帶進政策討論，把「懂不懂 AI」從一個模糊的感覺、一個重要的關鍵詞，變成一可以客觀回答的問題、可以量化及長期追蹤的指標。我們作為智庫，樂意與教育業界和政策制定者共同探討和落實具體工作，貢獻下一代的數字教育和AI素養。

作者張博宇為亞太政策倡議研究所ASAP研究總監；作者張芷萱為亞太政策倡議研究所ASAP研究員。

亞太政策倡議研究所（Asia-Pacific Society for Advocacy and Policy, ASAP）結合嚴謹精闢的公共政策研究及積極倡議策略，將實證研究轉化為政策推動力。

文章僅屬作者意見，不代表香港01立場。

01專欄精選不同範疇專家，豐富公共輿論場域，鼓勵更多維度思考。