律政思|Deepseek之後:當我們在香港談論法律AI,是在談論什麼?

撰文:01論壇
出版:更新:

來稿作者:鄧凱

這是一篇構思許久但卻遲遲未有動筆的文章。去年底,我一度認為AI的進化創新不如過往迅猛,當各行各業終於對技術發展抱持掌控感時,就能慢下來喘口氣。然而,來不及從容,Deepseek在新年期間的橫空出世再次讓人陡增焦慮。一方面,Deepseek深度駕馭中文的語言能力驚人,它不僅能合理地拆解問題並清晰地展示思考過程,更在文字生成結果上有著極好的表達精准與風格適配,甚至帶來思想延展和情感共鳴。毫不誇張地講,這種「語言天賦」對於靠思想表達為生、擅長「講故事」的傳統知識精英而言,屬實是危機降臨。另一方面,Deepseek通過將統計規律與人文認知進行創造性融合的這一突破,會否對法律業的工作實踐帶來新的變化是值得檢討的。

筆者曾對人類實踐者難以被法律AI所替代這一立場持謹慎樂觀的態度,但必須承認,一些變化正在快速發生。誠然,後Deepseek時代的法律AI的確有能力改變既有的法律業格局,並重新定義何謂法律人核心競爭力的標準。順延於此,本文將首先簡要拆解Deepseek的技術突破性,並在此基礎上關聯其法律應用潛力;以及試圖闡明其如何能豐富香港普通法法治內涵。

Deepseek破圈的技術創新性

德意志銀行將Deepseek現象稱之為中國版的普特尼克時刻(Sputnik moment)。如同當年因前蘇聯搶先美國發射斯普特尼克1號人造衛星而令西方世界震驚一樣,Deepseek的出現也令全球結舌瞠目,它破圈的技術創新性主要體現在以下幾個方面:首先,它是在現有大模型演算法架構上做出的極致工程創新。依然遵循於經典的Transformer路線,Deepseek通過引入稀疏混合專家架構MoE、混合精度訓練,潛在注意力機制MLA、多步預測MTP等多處局部調優,不僅帶來訓練和推理效率的大幅度提升以及成本的顯著降低,也實現了更好的軟硬件協同。

其次,Deepseek的模型推理能力之所以達到前沿水準,源自其採用特色的強化學習訓練方案,也即它選擇在預訓練模型基礎上直接強化學習,並在此過程中發現了模型自行習得反思能力的「頓悟時刻」(Aha Moment)以及持續提升的後訓練規模定律,再經由重新設計的精調,最終成為OpenAI等美國主流廠商的挑戰者。

第三,開源是Deepseek扭轉行業格局的關鍵舉措。Deepseek以開放路線共用訓練和研究成果,既打破了海外巨頭的大模型技術壟斷,也給上游的基礎研究與下游千行百業的垂直應用注入新活力,這顯然對行業的信心提升和產業的生態促進有極大的幫助。

最後是關於備受爭議的模型蒸餾問題。在技術原理上,DeepSeek的蒸餾術是將大參數「教師模型」的知識遷移到小參數「學生模型」,就好比經驗豐富的老師傅將畢生絕學手把手地教授給年輕學徒。這種AI技術的「師徒傳承制」既代表把模型做小做精的業界趨勢,也通過核心推理能力的濃縮與傳遞大幅降低通用大模型的成本損耗。

總體來說,雖難言Deepseek是顛覆性技術突破,也未實質改變AI行業的發展方向,但它的上述創新卻已然使各行各業接受「AI改造」的進程大大提前。包括其思維模式更接近人類大腦決策,以專業專家和通用專家分工帶動生成內容更精准,免費開源和知識蒸餾所推動的智能平權和AI普惠等能力,都是我們重新審視傳統業態變革的堅實理由。

Deepseek之後,打開法律AI的正確「姿勢」

法律作為古老精英行當,同時又是高度以文本數據為基礎的實踐領域,顯然適合Deepseek這類推理模型的施展適用。當來到挑戰與決策的十字路口,法律從業者們與其患得患失,不如坦然擁抱變化,努力在這場事關職業形態的效率革命與認知躍遷中迅速進化。本文無意編制一份詳盡的「法律人Deepseek使用指南」,僅從現時技術的創新邏輯出發,框架性、類型化地展示法律AI(暫且不嚴謹區分通用與垂直大模型)的應用潛力與前景,僅供商榷。

第一類適合應用法律AI的場域是那些高頻且易於標準化的法律實務環節。典型如法律檢索與查明、合同審查、文書起草、法律翻譯、法律諮詢(法律分析及合規意見出具)、法律盡調等常規法律任務。一無例外,這些步驟都具有知識密集型、重複性高、流程化強以及可數據表徵化等特徵,而大模型恰恰最不缺的就是知識儲備且極其擅長處理各種結構化的數據,這意味著二者的適配度很高。上述低複雜度的法律工種也被視為人工智慧正在吞噬的範疇,包括麥肯錫、高盛、波士頓等多家諮詢機構均分析指出法律服務業的可自動化率甚高,儘管研究角度不同,數據比例也有差異,但大量初級法律工作必然會遭遇法律科技高度替代這一結論卻難有爭議。

在第二個維度上,法律AI將指向那些低決策度與低風險性的法律界面。鑒於法律大語言模型底層的預測式表達與真正的人類決策存有本質差異,將AI工具儘量限制在一些低決策度且更容易被驗真的法律任務上幾近業界共識。典型例子如澳大利亞新南威爾士州州法律協會等三家法律專業監管機構於去年底聯合發文,強調法律專業人士在使用AI時須遵守「獨立、誠實、稱職、勤奮地提供法律服務」之原則,據此禁止AI用於高風險且需由律師獨立執行決策的場景。再如,基於降低試錯成本的風險考量,新加坡法院與著名的法律科技公司Harvey於2023年開展關於開發法律AI的合作探索也務實地聚焦在小額索賠法庭這一初階司法層級,從而維持法律AI可行性驗證與司法公信力保障之間的價值平衡。

公共法律服務是法律AI的天然試驗場。公共法律服務需求通常集中在向普通民眾就與生活密切相關且有法可循的日常法律議題提供相對合理可靠的諮詢建議。此過程中,複雜的法條規範需要被轉化為通俗易懂的口語解答,而這恰恰是自然語言處理、法律知識圖譜等法律AI技術最為擅長的部分。更重要的是,大模型飽受詬病的可靠性問題(如「幻覺」)是能夠被公共法律服務的公益屬性所吸納的。或言,如果公益性法律服務「約等於」公眾希望便捷得到免費的法律答案,當中暗含某種甚為樸素的價值代償邏輯:如若低成本(零收費諮詢)和高便利(全天候服務)在公共法律服務供給中始終是優先順序考慮,那麼讓渡一部分服務品質和答案精準度就並非不能容忍。免費獲取的心理或補貼模式可能使公眾放棄追求法律答案的「唯一正確性」。

法律AI的第四類應用方向將是那些高度依賴預測的實務決策,如立法和ADR,這是由大語言模型的概率和預測機制所決定的。之於前者,基於海量司法先例、行政執法規律以及即時的社會回饋信息,法律AI可以更好的測量新立法在真實世界中的運行效果。特別是在社會行為預測方面,結合運用機器學習的不同方法,概率模型可通過模擬不同經濟社會條件下的法律適用,判明立法對社會行為的引導與激勵,從而輔助立法者更好地平衡各方利益。同理,依託特定的證據事實,法律AI對於司法裁判結果做出準確的參考性預測,也為訴訟調解、和解談判等替代性爭端解決提供新的可能。當事人能夠基於法律AI的預測結果鞏固合理的維權預期,抑或調整非理性的訴訟策略,這種信號傳遞機制著實與傳統的訴前和解有異曲同工之妙:不論是在普通法系還是大陸法系,大量案件達成庭前和解的關鍵都是在於通過證據開示、交換形成明確預期,從而更容易接受調解或和解方案並達至案結事了。

言出法隨:AI大模型如何塑造香港普通法內涵?

語言是萬物之始,正如權利、法律等概念並非生物學上的事實,而是源自語言敘事的創造,這就是所謂的「言出法隨」。一直以來,包括法律、宗教、政治、哲學等上層建築的本質都是人類在用語言講故事。那麼,當AI大模型侵入了人類語言領域已成既定事實,會否改變這些上層建築的敘事邏輯?又或,如果存在決定規範,法律的規範世界會否受技術的客觀存在而發生變遷?以及,這種技術變遷對於香港這個有著深厚普通法法治傳統的社會而言,或許意味著什麼?竊以為,有以下幾個宏觀視角或有啟發,可進行簡要的法理關聯:

第一是關於法院中心主義下的司法智慧傳遞。香港的普通法體系是以法院為中心的判例制度,通過「遵循先例」的鏈接,普通法法官在判案時闡釋舊規則,建立新規則,以此提高法律的可預期性和司法之公信力。但必須承認,判例不論是作為法官與法官之間的類案裁判指引,還是作為面向社會大眾的行為指引,都存在較為嚴重的法律知識傳遞困難。該困境的發生與判例本身承載知識和資訊的特徵密切相關:判例需要受眾自行學習、總結、抽象、歸納與吸收,難度高、效率低;也源於案例的援引要經歷「具體-抽象-具體」的「涵攝」過程而導致各類細節、內隱資訊的損耗或丟失。對此,有論者指出,工業時代的法院始終無法解決法官個體知識向法官群體知識傳遞、法院群體知識代際傳承這兩大難題。但進入到AI時代,香港的普通法法治優勢反而有機會得到強化。在人工智慧構建的司法數字共同體中,每位法官的辦案不再是單純為自己積累知識經驗,而是通過演算法嵌入司法業務流來參與提煉裁判規則,並為整個司法群體知識圖譜的共用共建——包括判例關係、裁量邊界、敘事邏輯等顯隱性知識的傳承傳遞——不斷貢獻個體智慧。至少在迎合司法智慧傳遞需求的維度上,Deepseek所引入的模型蒸餾以及MoE混合專家架構等技術創新無疑是值得合理期待的。

第二是進一步鞏固「調解為先」的ADR文化。如前述,大語言模型的技術底層是概率統計,具備較好的裁判結果預測功能。基於當事人彼此的維權預期和一個參考性的訴訟勝率結論,雙方或傾向於理性選擇在訴諸法庭前達成和解,這是法律AI可廣泛運用於各類糾紛解決場景的核心理據。普通法項下的香港正是這樣一個面向糾紛救濟但又主張「調解為先」的法治環境。2024年《施政報告》重點論及深化調解文化,闡明促進ADR發展是長期政策,強調調解可以讓糾紛的當事各方以互相接納且便捷的方式解決爭端。預測性演算法於其中則是可以賦能的,例如,AI對新型案件的裁判模擬,不僅有助於緩解普通法因缺乏先例導致的司法判斷遲疑,更構成了調解結案的發端。此外,法律AI深化香港「調解為先」爭訟文化的路徑還將涵蓋:AI分析優化風險評估,線上ADR,以及技術分流司法積案等,最終實現「科技促法治,調解止紛爭」的秩序目標。

第三是對普通法心智做出必要的技術改造。普通法社會裏往往期存在一種因實踐法律和遵守法律所形成的社會群體心理,其典型特徵包含強調專業分工且自我規訓,易於就事論事而行動審慎,過分重視程式而怠於接受變革等。過度依賴經驗主義的普通法文化也因此被視為一套相對封閉、保守的知識體系。但作為「突然闖入」的外來資源,法律AI則給法律專業人士和普通守法公民帶來了超越傳統經驗範疇的新思維架構,由此讓普通法的文化基調更多元,也使其普遍適用的效力和範圍更寬泛。例如,當法律大語言模型通過自然語言處理的方式將複雜的法律分析轉化為通俗表達,公眾理解法律的門檻無疑會大幅降低,由此間接推動傳統法律共同體對外界意見的開放與吸納。這也側面反映出新技術自帶的成本倒逼作用機制,即法律服務成本降低所形成的公眾壓力將迫使法律職業群體主動擁抱產業變革以維持競爭力。另一個推演視角在於,深度學習演算法可解釋裁判文書中未有明示的決策邏輯。這種使隱性規則顯性化的技術改造已在美國某些法院展開:通過AI識別法官潛在偏見,不但有助於普通法傳統中「技藝理性」(artifixcial reason)的升級,更能啟動技術靈活性注入法律教義、法律程式的可能,進一步製造出普通法「普遍適用性」的效果增強。

最後是探索與「一國兩制」獨特價值的結合。香港普通法制度以「一國兩制」憲制秩序為根基,普通法法治傳統也在「一國兩制」下得以保持長期不變。就在本文撰寫過程中,香港生成式人工智慧研發中心於2月25日發佈生成式人工智慧大模型HKGAI V1,它是全國首個基於Deepseek全參數微調,並持續訓練產生的大模型。根據相關披露,該模型以香港最大的大模型本地知識庫為支撐,可識別粵語、英語、普通話,並覆蓋包括「港法通」在內的多個應用場景。更重要的是,V1模型因為接受了人為清洗好、標注好的語料投喂而被譽為學習過「香港價值觀」的「港式AI」。毋庸置疑,正確的「香港價值觀」勢必應包含對「一國兩制」作為基本方針的準確理解,這是讓AI須對齊外部社會價值,遵循現實政治倫理的必然要求,而「一國兩制」這一憲制規範也罕見地有了「數字化」的呈現形式。在價值抽象之外,V1大模型的誕生本身也證明了「一國兩制」的優越性所在:受益於融入國家發展大局的戰略路徑,以Deepseek為典型代表的內地科技紅利第一時間就惠及到了本港,並創造性地「安頓」了技術升級、產業革新和制度理性之間的複雜關係,再度彰顯出「一國兩制」的獨特價值與不朽生命力。

作者鄧凱是香港城市大學法律學院公法與人權論壇研究員法學博士。文章僅屬作者意見,不代表香港01立場。

「01論壇」歡迎投稿,來函請電郵01view@hk01.com。來稿請附上作者真實姓名及聯絡方法。若不適用,恕不另行通知。