【開放數據】政府做得差? 政府資訊科技總監:網站優化無止境

撰文:蕭輝浩 林炳坤
出版:更新:

《香港01》分析政府「資料一線通」網站近6,800條資料,發現當中有多達三分二資料屬「水份」。
政府資訊科技總監楊德斌接受專訪時承認,政府開放數據質量有進步空間,「現階段未做好件事」,長遠目標之一是統一所有開放數據格式。他又指,「資料一線通」開放的數據由各部門提供,未必能將所有數據公開,特別是部分數據涉及私隱問題,「並非簡單刪走人名就可以解決」。

政府將於年中更新「資料一線通」,政府資訊科技總監楊德斌望未來做得更好。(江智騫攝)

政府資訊科技總監楊德斌接受《香港01》專訪時承認,政府開放數據的質量有進步空間「網站優化無止境」,「現階段未做好件事」。長遠目標之一是統一所有開放數據格式,今年網站已增加API數目至500條,另新增歷史性數據。他又指,「資料一線通」開放的數據主要由各部門提供,未必能將所有數據公開,特別是部分數據涉及私隱問題,「並非簡單刪走人名就可以解決」。

楊德斌說,現時資科辦有4人專責管理資料一線通,而資科辦在開放數據的角色是作為業界和政府各部門之間的溝通橋樑,希望將網站數據「由無變有,由有變優」。今年目標包括在今年中將現有的500個API增加至1000個;以及在今年下半年更新網站,為數據加入地理標籤,方便用家查找分區的資料。

目前資料一線通最為人詬病的,是網站內的數據格式不一,部分數據更以JPEG、PDF等用家難以使用的格式儲存數據。楊德斌承認,數據格式有優化空間,長遠終極目標是做到將各種資料格式統一,但短時間內未必能做到。他續稱,目前開放給市民的數據由各部門持有並提供給資科辦向外開放,部門會按需要選擇儲存數據的格式。

楊德斌認為,開放數據除了要重視數據量和質外,還要考慮市數據是否對市民和公司有用。(江智騫攝)

另一方面,業界經常質疑政府以私隱為由,拒絕開放數據。楊德斌說,政府數據「並非簡單刪去名字就可開放,因為單憑數據外界也有可能辨認到有關市民」。他同時指出,不能單以開放數據的量來衡量開放數據的情況,關鍵在於向公眾和商界提供有用的免費數據。

至於近年社會要求政府強制公營機構,例如3間巴士公司開放數據,供市民或商界使用。楊德斌回應稱,私人公司是否開放數據屬商業決定,未來應提供誘因令商業機構自行分享數據,例如令公司明白開放數據有助發展新商業模式、尋找更多商機,「總好過逼佢」。

莫乃光:所謂私隱問題只是「偽命題」

政府指拒絕公開資料部分數據涉及私隱問題,故難以開放。立法會資訊科技界議員莫乃光強調,現時要求的公開資料,如交通、天氣、流感分區數字等,根本不牽涉個人私隱。「全世界講OPENDATA唔係講呢啲(私人野)嘛,就算你俾哂我全港所有巴士資料,我會唔會知道你幾點搭班車?」

此外,莫乃光亦建議「資料一線通」的資源參考「public domain」(不保留任何權利),或不少國家都採用的「creative commons」(共享創意),以保障用者和政府的權益。(莫乃光訪問及回應詳見此處