【雲端X影像】讓人工智能學習歷史 拼湊出人類的「時光地圖」

撰文:伍振中
出版:更新:

《紐約時報》與Google合作,報社記者可以藉由Google雲端技術團隊協助建設的數碼圖庫搜索圖片。Google工程人員亦向《紐時》提供機器學習工具如Vision API等高階資訊整合技術,讓《紐時》可以綜合實體新聞圖片的各種資訊,包括辨別手寫文字、圖中物件等。這項將歷經年的計劃,他們稱之為「Google Morgue」。(此為《雲端上的圖片》系列報道之二)

Vision API:Google向公眾提供的一種人工智能和機器學習技術,具有物體辨識功能。它可以快速將圖片歸類至數千種類別之一、偵測圖片內的個別物件和臉部,以及讀取圖片中的印刷文字,並能持續引進新概念,提高偵測準確度。

無論是企業,或是個人用戶,很多人都用上了Google提供的雲端服務。(Getty Images)

系列相關文章:

【01專訪】從《紐時》地庫「停屍間」 看一場百年舊照的重生之旅

【雲端X影像】科企掌握我們的「記憶」 數碼遺產誰來繼承?

【01專訪】Instagram取代實體相簿 細訴兩種攝影的意義

【雲端X影像】尋找「古早味」老照片 探索香港影像的數碼化進程

「Google方面給予我們很多技術支援,確保我們能夠妥善運用它提供的技術,並建議我們如何完善內部的內容整合系統……此外,我們也會反饋一些服務方面的意見。」 協助Google Morgue統籌工作的《紐約時報》編輯Veronica Chambers向記者表示。

Google雲端服務的技術總監Brian Stevens則提到,與《紐時》的合作將惠及下一代,繼續承傳歷史使命。

Stevens稱,「Google希望自己研發的雲端技術,可以用作保存這些無價的歷史片段,而且能夠讓新聞從業員以嶄新的方法,在芸芸數百萬張歷史圖片中,進行搜索和分析,並賦予『新生命』……從倉庫轉移至雲端平台,記者可以將圖片故事昇華至全新的高度。」

《紐時》通過Google Morgue,與Google工程人員不斷探索雲端技術和API人工智能技術,運用於未來新聞業發展。不過,Chambers向記者強調,Google只向《紐時》提供技術上的支援,Google方面沒有權限取得《紐時》內部數據庫的資訊內容。

《紐時》地下圖庫的歷史新聞圖片,將會逐一數碼化,放上雲端永久儲存。(Earl Wilson for The New York Times)

方便搜索分析 重構歷史現場

由於「停屍間」的新聞老照片庫藏極多,因此《紐時》與Google工程人員仍需繼續跟進圖像數碼化工作,以擴充雲端圖庫,更新庫藏資訊。

他們更艱巨的工作在於對歷史新聞故事的資訊整合,「我們透過Google的技術,從歷史新聞圖片中辨識出足夠的資訊,包括文字說明、分類卡片說明、圖片背面有關事件背景的簡介等,將當時的歷史事實重新呈現出來。」 Chambers向記者表示,這是整個計劃的終極目標。

紐約市賓夕法尼亞車站(Penn Station)的往昔時光。(The New York Times)

Google Morgue載入新聞照片的相關資訊,故可以將同一宗事件或有關連的事件匯集起來,從而將某宗歷史事件的來龍去脈和前因後果,像蒐集一塊塊拼圖般,拼湊成一幅較完整的圖畫。藉着Google Morgue,歷史事件按照其演進過程重新建構起來,並向讀者呈現最合乎基本事實的故事全貌。

部分歷史照片背後記載重要訊息,「停屍間」圖庫收藏的賓夕法尼亞車站照片(上圖),背面附上新聞剪報。(The New York Times)

若沒有這些技術,單靠人手及筆錄整合數百萬張圖片資訊,基本上是一項「不可能的任務」。

根據《紐時》攝影記者Stephen Hiltner的說法,除了「停屍間」數以百萬計的新聞老照片外,報社還有大約一千萬張新聞相片的底片,存放在編輯室及其他圖書館。那麼,已經數碼化並放上雲端的照片,實質佔多少比例?連Chambers都說不清楚。

「我只能說,數碼化的照片只佔很少部分。這個計劃將會歷時多年……每一次走進『停屍間』,仔細考究每一張圖片,我們對於現時身處的這個社會便會多一份認知。」 Chambers說道。

「我們希望通過數碼化歷史新聞照片,讓年輕一代的讀者了解過往發生的事情。驟眼看下去,『舊照片』、『新世代讀者』,兩者似乎相當矛盾。」 Chambers表示,「不過,現時新聞媒體作為『解釋者』(explainer)的概念十分流行。現在的讀者都希望媒體可以就着新聞事件,解釋一個人、一宗故事,或者一套思想……」

「解釋性新聞」(Explanatory Journalism)是互聯網社交媒體時代興起的新型新聞敘述方式。由於互聯網資訊繁雜,質素參差,愈來愈多新聞讀者,希望可以得到有關新聞背後的詳細背景資料,且須真實可靠,而非純粹得悉新聞事件。故有新創媒體以「解釋性新聞」為主打內容,就着單一新聞事件,重塑事件背後的脈絡、歷史遠因等。創立於2005年的美國新創網絡媒體公司Vox Media正是其中一例。

互聯網資訊繁雜,質素參差,愈來愈多新聞讀者,希望可以得到有關新聞背後的詳細背景資料,且須真實可靠,而非純粹得悉新聞事件。(Getty Images)

「停屍間」存放的都是活生生、關於這個世界的集體記憶。這些珍藏的歷史圖片,正正就是一個極佳的論證資源,讓新聞媒體向讀者解釋:「我們是誰?」「我們是怎樣走到現在?」

記述歷史、認識歷史,正正存在這種難以抗拒的魔力。

上文節錄自第149期《香港01》周報(2019年2月11日)《把記憶託付雲端 褪色老照片獲新生》。

更多周報文章︰【01周報專頁】《香港01》周報於各大書報攤、OK便利店及Vango便利店有售。你亦可按此訂閱周報,閱讀更多深度報道。