【Google IO】Android超強AI Live Caption!拍片錄音實時出字幕

撰文:黃正軒
出版:更新:

Google I/O 2019公開Android Q最引人入勝的即時字幕功能「Live Caption」。當Android Q手機用家在裝置上播放任何影片或錄音時,Live Caption會即時為內容轉譯出字幕。實時字幕更覆蓋任何應用程式上,包括YouTube、Instagram及Pocket Casts等,就連即時通訊App也支援。

Google I/O 2019發表Android Q,最令人印象深刻的功能之一必數即時字幕功能「Live Caption」。啟用後,用家會見到手機上播放的任何影片式或錄音都有實時字幕轉錄,而且非常準確。實時字幕會覆蓋於正在使用的任何應用程式介面上,不論是YouTube、Instagram、Pocket Casts還是其他任何App。Live Caption​還支援視像通訊App如Skye和Google的Duo,甚至可以跟用家親自錄製的影片或錄音配合使用,如果其靈敏度真如示範般快捷,就實在是影響人類生活的一大功能。

Android Q即時AI字幕功能Live Caption於,手機拍片和錄音實時出字幕。

Google於官方Blog表示,字幕對於世界各地約4.66億位耳聾或聽力障礙人士而言不只是便利,更使到媒體內容更易接收;Google跟聾人社區密切合作,開發出可以改善聽障者接觸數碼媒體的功能。Google行政總裁Sundar Pichai​也於I/O台上響應此宣言,指出「為每個人建設」之概念意味着確保人人都可以接觸Google的產品,他相信技術能使人更為包容接納,AI人工智能正在提供新工具,顯著改善殘疾人士的體驗。

Live Caption的即時字幕,是透過Android裝置上的「機器學習」(Machine Learning)來創建,換言之屬AI人工智能系統,可以離線工作,不需要將相關活動數據發送至雲端。該AI系統轉譯之字幕會出現於一個黑框內,用家可以在手機螢幕上自由移動黑框至最方便觀看的地方。即使影片音量大幅調低或靜音,Live Caption仍然有效運作,自行分析源音頻。但是系統轉譯之字幕是不留底的,無法保存下來日後查看。當內容播放完結後,字幕便告消失。

Live Caption​能切合不同情況使用,Pichai舉例,要是用家在會議或地鐵上觀看任何影片,Live Caption​能在保持靜音的情況下提供字幕,不會打擾到周圍的人。

Live Caption​​如何啟用?用家須以手機音量按鈕開啟即時字幕。當介面彈出音量UI時,Live Caption會以軟件Icon形式顯示。Android Q的Default Setting是關閉了Live Caption的​,用家必須在「輔助功能設定」中啟用,方能顯示其Icon。

即睇Google I/O 2019現場Live Caption​​示範影片: