【科技.未來】預測蛋白質結構神準 AI AlphaFold有何重大意義?

撰文:孔祥威
出版:更新:

德國馬克斯普朗克發育生物學研究所總監Andrei Lupas的團隊過去近十年都在試圖找出一種古菌(Archaeon)中的蛋白質結構。這種蛋白質跨越存在於細胞膜—部份在細胞內,部份在細胞外,令研究團隊難以在實驗室中確定其形狀。在本年Lupas擔任評審的第14屆「蛋白質結構預測關鍵評估」(CASP)比賽中,他把這難題設為參賽題目,編號為427的DeepMind團隊的AI僅花半小時就給出答案:一個分為三部份的蛋白質詳細圖像,中間有兩條長長的螺旋臂。這個預測結構與Lupas團隊的實驗數據相匹配。

在預測蛋白質結構上,DeepMind的AI AlphaFold不但準確度可媲比現有實驗室鑒別技術,還快很多。圖為CASP14中其中兩道題目。(DeepMind)

準確預測蛋白質結構

這比賽在1994年創辦,兩年一度,主辦方會挑選約100種蛋白質的氨基酸序列,這些蛋白質的形狀和結構均已在實驗室中鑑定但未曾公開,然後由來自世界各地的參賽者設法運算軟件來預測它們的正確立體結構,並以「全局距離測試」(GDT)來評分,分數從0到100,藉以反映參賽隊伍預測的結構與實驗室中識別出的蛋白質實際形狀之間的接近程度,若高於90分,表示其準確度可與實驗方法匹敵。本屆比賽結果於上月底公布。AlphaFold有三分之二GDT高於90,平均得分高達92.4。CASP共同創辦人、馬里蘭大學計算生物學家John Moult指蛋白質摺疊是過去五十年困擾科學界的難題,讚賞AlphaFold的表現是重大突破:「某程度上,問題已經解決了。」

從圍棋到「砌拼圖」

AlphaFold使用了某種「注意」(attention)神經網絡,亦即讓深度學習系統注意特定的輸入並增加相關權重。Jumper形容這種做法就像「砌拼圖」:「有些圖塊你可以十分肯定地拼合,然後你會得出不同的局部圖形,最後想辦法接合它們。」他說AlphaFold的神經網絡學會推理蛋白質結構的幾何形狀、空間,以及如何接合那些它根據DNA序列分析下認為會靠在一起的氨基酸對。它還可評估自己猜測的結構有多準確可靠。利用公開的蛋白質數據庫Protein Data Bank內17萬種已知的蛋白質結構,加上相當於一、兩百個圖形處理器(GPU)的運算力,他們最終花數星期訓練出最新的AlphaFold。

AlphaFold預測蛋白質結構的最新成果,標誌着AI不再只是遊戲高手,而可以解決對人類有意義的實際問題。(視覺中國)

AlphaFold的表現對DeepMind、甚至AI整體發展有重大意義。DeepMind幾乎是靠遊戲而在近年聞名,它最初建立起的AI能以超越人類的水平玩經典的Atari「街機」遊戲;之後轉戰棋盤,AI AlphaGo在2016年擊敗韓國圍棋九段棋手李世乭。但就如Hassabis指出:「遊戲只是一個訓練場……為了創造新知識的訓練場。」AlphaFold預測蛋白質摺疊的能力,標誌着DeepMind、甚至AI已從玩遊戲進展至足以真正解決具現實意義的科學問題。

從根本上改變醫學科研

這之所以重要,是因為解決「蛋白質問題」將從根本上改變醫療和生物科研。在醫療上,正如Moult指出:「了解疾病和尋找新療法的最有效方法之一,就是研究所涉及的蛋白質。」DeepMind只需幾日就可從一段DNA序列中找出所要的蛋白質結構,比現有技術快得多。此外,很多藥物都是透過模擬分子立體結構、觀察某些分子與目標蛋白質的相互作用而設計出來。所以,藥物研發將會加快,且更為精準。DeepMind正計劃研究利什曼原蟲症(leishmaniasis)、昏睡病、瘧疾等由寄生蟲引起的熱帶疾病,因為它們與許多未知的蛋白質結構有關。

若能以AI預測蛋白質結構,將對醫學、藥物研發、應對未來瘟疫、基礎科研等,構成廣泛而革命性變化。(AP)

更重要的是,這可加強我們應對瘟疫的能力:一方面,可加速了解病源,例如AlphaFold在今年3月已預測了幾種與新冠肺炎病毒相關、過去未知的蛋白質結構,其中兩款稱為ORF3a和ORF8的結構均與實驗確認結果極之相似;另一方面,有望加速老藥新用或全新疫苗的研發過程。

AI更可能會改變科研方法,並帶來更多新知識,包括科學家現時仍所知甚少的蛋白質相關知識。蛋白質數據庫UniProt現有1.8億個蛋白質的序列;但囿於一直以來進行的實驗確認過程,Protein Data Bank只有約17萬種已知的蛋白質結構。AlphaFold所顯示的潛力或令生物學家更好地利用AI作為科研工具。本年生物學界有逾21,000篇涉及使用AI的論文,年增長率近50%。

上文節錄自第245期《香港01》周報(2020年12月21日)《華語網絡文學二十年 從消閒讀物到文化輸出》。如欲閱讀全文請按此試閱周報電子刊,瀏覽更多深度報道。

245期《香港01》周報精選內容:

【封面報道】美歐中不約而同反壟斷 遲來的科企監管革新

「有形之手」出手 馬雲們顫抖了嗎?

全球掀起反壟斷風潮 何時輪到香港?

康健中心成效未如預期 基層醫療緣何停滯不前

華語網絡文學二十年 從消閒讀物到文化輸出

當機械人炒得一手好菜 職場自動化 員工出路何在?

攻克半世紀難題 AI或掀醫學科研革命

2020年電影業回顧 票房暴瀉 改變放映模式