大數據充斥 各行各業搶人才 數據科學家成「不滅」工種?

撰文:鄧穎琳
出版:更新:
鄧文禮指,未來數據分析將愈來愈重要。(鄭子峰攝)

上世紀九十年代,科技在多個領域迅速發展,科網概念投資熾熱,吸引大量資金,市場幾乎一面倒看好科技股,股價高飛,估值漸「離地」,最終形成投資泡沫。2000年3月10日美國納斯達克指數創下即市及收市新高後,一路尋底,科網股泡沫爆破。之後不少人在投資前都會引以為鑑,甚至刻意避開科網投資。

時至今日,互聯網成為香港人生活的一部份,日常購物、工作及學習都離不開互聯網。在搜尋及瀏覽資訊的背後,用家累積了大量數據,不論是銀行、保險、醫療等行業,均愈來愈重視數據分析及應用,除了能針對客戶需要,提供個人化產品及服務外,亦透過分析數據調整及制訂發展方案,令企業營運更有效率,尋找新的機遇及商機。香港政府亦於2017年《施政報告》提出,會循八大方向加強創科發展,包括開放政府數據;《香港智慧城市藍圖》亦談及推廣以數碼方式,開放更多公私營機構數據,作為建構「智慧政府」措施之一。在各方面都開放及發展數據的情況下,需要大量數據分析和應用數據的專業人才。

觀察行業發展趨勢 工作內容貼地

香港恒生大學於2014年開辦「數據科學及商業智能學(榮譽)理學士」課程,屬全港首個融合「數據科學」及「商業智能學」的學士課程。恒大決策科學學院副院長、數學及統計學系系主任鄧文禮說,以往設計及試用分析工具需時,成本高、所需人手多,為方便統計,多會忽略缺失或不完整的數據,惟現今科技發達,數據收集及分析較以往容易,「現在新、快、平,每個行業、不同類型工種,只要有數據,數據科學都有發展空間。」

不少人以為「數據分析」是困難的學問,沒基礎只能避之則吉,但鄧文禮認為,數據無處不在,適當的分析更可觀察到不同行業的發展模式,既不沉悶亦不離地,只要對數字不抗拒,數據分析亦是有趣的事。他引用國際商業權威刊物《哈佛商業評論》的說法,稱數據科學家為「二十一世紀最性感的工作」。

從事數據分析相關工作的黃浩嵐,早於中學時已對數據科學感興趣,經考慮後入恒大就讀「數據科學及商業智能學(榮譽)理學士」課程,他認為,「機器學習(Machine Learning)配合大數據可以對世界有很大影響,可以作很多決策、取代人力的工作。」他憶述,大學三年級到大型連鎖藥妝店實習時,其中一個課題便是憑貨品銷量及顧客整體消費習慣,推測何時會開始流感高峰,他形容工作內容貼地,對數據科學更感興趣,有意繼續發展。

基礎概念和技巧難被淘汰

其實,數據科學除了預測,亦可解決現有問題。鄧文禮說,數據科學主要分三部份,包括調查敏感數據(如逃稅公司比例、某政治人物的支持度)、回歸分析(如以性別、學歷及職業估算薪金平均值),以及處理缺失或填補不完整的數據,如受訪者拒絕提供敏感資料,又或其他難以預知的情況。

鄧文禮舉例指,在新藥物研發過程中,試藥的人不多,故每一個案都屬珍貴資料,惟未必每個試用者都能完成療程,傳統工具會自動忽略不完整的資料,但現今電子工具發達,只要能設計出合適的分析工具,仍可保留有用資料及準確分析,協助對比新舊藥物成效,研發出新藥物。他形容,研究結果能應用在現實世界,推動他繼續努力進行研究。

日常生活中少不免會上網搜尋資訊,鄧文禮指,懂分析數據者可將搜尋器(如google搜尋)的關鍵字詞出現次數及頻密程度等資料轉化成數據,進行預測及分析,估計大眾關注的事件,如近期的反修例風波中,不少政治人物的名字等字眼多次出現。

互聯網世界變幻莫測、科技日新月異,學到的東西能趕上發展嗎?鄧文禮笑言,他年輕時互聯網並未普及,他在1988年畢業於香港中文大學數學系,一年後在中大升讀統計學哲學碩士,時至今日,在學時所用的工具多已被淘汰,惟學到的概念及技巧卻仍然有效。

人才需求日增

鄧文禮形容,隨着科技進步及愈來愈多人使用智能手機,將有更多數據提供,故數據科學是「長做長有」,不用擔心會被取代,而人工智能(AI)雖是新趨勢,但AI亦需要「被教導」,數據科學的分析工具及統計方法,是「老師」之一。他補充稱,此行業須與時並進,故需適時進修學習。

大數據方便,卻有洩漏個人私隱的隱憂。鄧文禮強調,數據科學也講求道德,課程中會涉獵有關部份,包括收集數據時要獲得相關企業或人士的許可,亦要清晰告知資料被收集後的用途;除了數據不能出錯,保護及管理數據的責任亦屬課程必修內容。

安俊人力資源顧問董事總經理周綺萍。(資料圖片)

安俊人力資源顧問董事總經理周綺萍指出,香港社會對能研究及分析大數據人才的需求日增,由於此行業的人才不多,即使香港市道轉差,整體消費意欲下降,公司多節省開支及人手,但此行業人才仍供不應求,加上目前社會情況下,願意來港的海外或國內人才更少,令人手更短缺。

黃浩嵐亦透露,行內缺人,即使經濟情況欠佳,平均每周仍有獵頭公司「挖角」,考慮到行業發展快,當初在恒大所學的較為基礎,而分析不同行業的數據亦會有差異,故須不停學習及鑽研,他目前正就讀與行業有關的碩士課程,為將來工作鋪路。他提醒,數據科學家市場未見相當成熟,未有明確職業階梯,但已比他就讀大學一、二年級時的機會多,「當時網上招聘平台有關的應屆學位畢業生工作機會可以說完全無」,幸好自己在「黑客松」比賽中獲獎,亦有老師推薦他到大型連鎖藥妝店實習,最終在畢業後獲實習公司聘為全職員工。

周綺萍表示,不少公司招聘時以相關學位為最低要求,若要處理繁複數據,僱主對應徵者的最低要求多是碩士學位。若同時具備IT及商業機構知識者,起薪點介乎1.3至.1.8萬元,若任職大企業、跨國企業或政府部門者更可高達2萬至2.5萬元。至於有相關實習經驗者叫價隨時更高。

但周綺萍提醒,多間大專院校均有開辦商業課程,而分析及研究大數據的人才,不如精算師般專業及不可取代,有IT及數據分析經驗者可轉移工作技能任職,故「值錢」的地方在於分析及解讀數據的能力,她提醒學生選報課程前要留意課程內容,招聘時須留意數據分析師及數據科學家的工作要求有別,一般而言,科學家需懂得整合分析程序及設計出統計的工具,而分析師要求較低。

香港恒生大學於2014年起開辦「數據科學及商業智能學(榮譽)理學士」課程,培訓數據科學家,首批畢業生於去年投身職場。鄧文禮指,未來數據分析將愈來愈重要。