律政思|具身智能時代之二:香港有責任成為全球數據中樞
律政思專欄|鄧凱博士
2026年4月12日,創新科技及工業局局長孫東代表特區政府與國家互聯網信息辦公室簽署《關於創新科技發展的合作備忘錄》。備忘錄將雙方合作的重點標的明確鎖定於人工智能、數據跨境、區塊鏈三項。政策體系已有國家與特區政府共同搭建,剩下的問題也關乎法律方案是否跟上。如果說本系列文的第一篇關注的是機器人的「身體」硬件,那麼這份備忘錄所圈定的,恰恰是發展具身智能所需的軟體版圖。更重要的是,它或許預示着一個極具想像力的產業未來,也即:香港很有可能成為全球少數可以同時調度內地海量場景數據、國際開源資源與國際化合規框架的具身智能軟件層樞紐。
具身智能發展遇法律瓶頸
機器人在軟件層面的挑戰,較一般意義上的「數據合規」而言更為複雜,這是由現時的技術和產業特質所決定的。它同時涉及數據採集與流通的合規邊界,數據法律評價以及開源生態的責任切割等。每一重問題都有賴於嚴謹且富有探索性的法律推敲,也正是在種種未有定論的留白之處,香港的制度優勢得以體現。
從技術角度講,與大語言模型主要依賴文本語料不同,具身智能的訓練數據具有顯著的「物理性」,機器人要學會在真實的物理世界裏執行任務,需要的是包括力回饋、觸覺感知、空間導航、動態避障等高度場景化的多模態數據,而這些信息是極其稀缺、匱乏的。這也是制約具身智能從實驗室走向規模化商用的關鍵掣肘之一,也由此誕發出產業界破解「數據荒」的兩大核心技術流派,即主張建立物理訓練場大規模採集「真機數據」的真機派,以及主張在虛擬仿真環境中低成本生成海量「合成數據」的仿真派。然而也必須承認,不論是走哪種技術路線,都不可避免遭遇法律瓶頸。
例如,真機派在真實物理世界中大規模採集多模態數據,關涉「人—機—場景」的視頻、聲音、動作與空間資訊,至少在中國內地難免觸及個人資訊、敏感資訊、重要數據、測繪數據等法律邊界,並受到「知情同意」、「正當必要與最小化收集」以及數據跨境等現行規範的約束。再如仿真派的方案也遠非一勞永逸案。儘管經演算法生成的合成數據一定程度上規避了隱私與版權爭議(通常被認為是降低了個人可識別性風險的重要技術路徑),但「匿名化」標準如何界定,數據權屬份額和關係可否釐清(是否構成「衍生數據」等),以及反向工程破解風險等問題,仍然缺乏法律定論。
上述數據合規壁壘的背後則是多重產業痛點,複雜的跨境監管現實當然也催生出某種合理期待。一方面,內地具身智能企業需要獲取更多的國際開源數據和模型資源以提升自身技術能力;另一方面,能否合法利用內地全球罕見、高密度的製造業場景數據顯然也是海外產業方所急盼的。這二者共同結合,塑造了以具身智能為代表的AI創新在體系間規模化以及鏈接世界的戰略想像力。香港正適合扮演這樣一個可信賴的制度中間站。
打造具身智能數據自由港
義大利經濟學家、中歐數字協會主席魯乙己(Luigi Gambardella)近日撰文指出:技術競爭越激烈,信任就越稀缺,而可信賴的通道價值就愈發凸顯,也由此,香港的獨特價值在於讓中國創新更加全球化、更具投資魅力、更可信以及更能跨境規模化。該論斷在具身智能語境下亦是切中肯綮,香港有條件也有責任肩負起聯通內地與國際的數據中樞職能,進而打造具身智能離岸數據港或稱「具身智能全球數據自由港」。
首先,在中央政府和香港特區政府的持續努力下,內地城市與香港之間的數據跨境流動逐步放開且日趨規範。國家網信辦與特區政府創新科技及工業局於2023年6月簽署的《促進粵港澳大灣區數據跨境流動的合作備忘錄》,以及同年12月發佈大灣區標準合同實施指引,拉開了數據從內地出境進入香港的帷幕。依託自貿區及大灣區重大合作平台(如河套)的創新實踐,內地的數據出境香港則進一步豁免安全評估、訂立標準合同以及第三方認證等嚴格法定要求,這顯然為機器人產業發展所需的內地場景數據得以經由合法的簡化規則通道輸入香港提供極大助益。
在離岸一端,《香港個人資料(私隱)條例》(以下簡稱《私隱條例》)第33條以擱置生效的取巧方式保證香港與海外數據流動相對通暢,從而形成了「入向有簡化通道、離岸無法定限制」的獨特數據法架構。這使得香港能在全球數據本地化浪潮中逆勢而行,成為罕見的雙向自由流動節點。而就具身智能而言,其產業發展所需的高質量、可泛化、可持續的高質量數據供給,天然具有跨國界需求——多語種語音、跨文化行為、多樣化場景的採集與標注須在全球範圍完成。香港恰恰提供了內地數據合法出海、國際數據合規彙聚的制度通道,此即「具身智能全球數據自由港」的法理基礎。
讓《私隱條例》成為通行證
僅有自由流動尚不足以成就數據港,國際數據流通的另一端是信任,也即數據輸出方須確信其數據在接收地獲得與其本國實質相當的保護水準。《私隱條例》恰在此處發揮制度信用的擔保角色。《私隱條例》於1996年生效,是亞洲最早的綜合數據保護立法之一,其六項保障資料原則以OECD隱私指引為藍本,與APEC隱私框架實質對齊,在全球主要經濟體中具有廣泛的法律互認基礎。
而相關司法實踐也強化了《私隱條例》的可信價值,如在EC Healthcare案中,香港的法律裁判者嚴格詮釋目的限定原則,向國際社會充分證明《私隱條例》絕非「紙面規則」而是實實在在具有約束力的司法規範。故此,數據的自由流動與可信保護在香港構成了數據秩序近乎完美的一體兩面:《私隱條例》無疑是數據自由港的「通行證」而非「小院高牆」,它使香港既不同於內地嚴控數據安全的剛性管制,也區別於完全缺乏數據保護立法的離岸避風港,而是在保護水準國際認可的前提下實現數據的高效流轉,更是離岸「可信賴數據樞紐」在法制層面的具象化。
為跨境數據提供法律容器
基於上述制度優勢,筆者建議香港在以下方向作出前瞻性的政策與法律部署。其一是創設「具身智能跨境數據特區」。借助河套深港科技創新合作區或北部都會區相關創科平台,建立專門面向具身智能數據的「離岸數據沙盒」,允許內地企業在合規框架下利用國際開源數據進行模型訓練,亦認可國際企業在安全、受控環境中處理來自內地的場景數據。技術層面,可依託隱私計算、聯邦學習、區塊鏈可信驗證等手段實現「數據可用而不可見」,相信這也是本文開篇論及香港與內地雙方率先從人工智能、數據跨境以及區塊鏈領域推進創科發展的應有之義。
二是探索建立「具身智能數據信託」(Embodied AI Data Trust)制度。信託是普通法體系下獨有的法律工具,香港擁有全球最成熟的信託法律服務生態。將信託法理引入機器人數據治理領域,意味着可以設立一種法定的數據受託人機制:由獨立的第三方信託機構代為持有和管理具身智能訓練數據,按照預先約定的信託契約向數據提供者和數據使用者分別履行信義義務(fiduciary duty)。這種安排為跨境訓練數據共用提供了一個各方可信賴的「法律容器」,既保障數據提供者的權益不被濫用,也給予數據使用者以清晰的合規預期。
確立「責任避風港」規則
三是關於確立面向具身智能開源生態的「責任避風港」規則。開源是具身智能技術進步的重要推動力,從模型架構到仿真數據集,開源共用極大地降低了研發門檻,包括騰訊TAIROS具身智能開放平台(以模組化方式提供具身大模型開發工具和數據服務)以及智元機器人作為全棧部署具身智能生態技術體系的先行者開源其自研機器人操作系統等主流實踐,均印證開源開放範式乃大勢所趨。然而也必須承認,開源人工智能的法律責任體系至今並無完全厘定,這一懸而未決的法律風險或許也在抑制全球開源社區的參與熱情。香港對此能怎麼做?
立足開源範式(不論是模型、系統抑或是數據)的公共(非盈利)屬性,人工智能透明度增益以及下游控制力受限等樸素考量,香港或可在其知識產權與侵權法框架下確立清晰的開源開發者免責或限責條款,明確在符合一定條件下(如已盡合理披露義務、未參與商業部署決策),開源貢獻者不對下游用戶的具體應用後果承擔侵權責任的新型規則。這種制度供給將有力吸引全球頂尖的具身智能開源專案在港設立社區節點或法律實體。
作者鄧凱是香港城市大學法律學院公法與人權論壇高級研究員、法學博士。
「律政思」是由法律專業人士主筆的法律評論專欄,旨在以專業視角,剖析國際、中國內地和香港的法律發展、法治建設及相關社會議題,深化公眾的理解。
文章僅屬作者意見,不代表香港01立場。
01專欄精選不同範疇專家,豐富公共輿論場域,鼓勵更多維度思考。