【科技.未來】新藥研發低迷 AI可如何顛覆生態

撰文:孔祥威
出版:更新:

眾所周知,研發新藥的路途極之艱難,耗費極多資金和時間,而最終能通過臨床試驗和監管核准而面世的藥少之又少。不過,製造了Deepfake和AlphaGo的人工智能(AI)技術,竟已幫助科學家在製藥方面取得一些初步成果。AI可如何帶領製藥業走出研發困局?

現時要推出新藥到市場成本甚高,也極花時間。根據塔夫茨大學藥物開發研究中心(Tufts Center for the Study of Drug Development)研究,大部份潛在新藥都在測試階段失敗,成功推出一種新藥或需要多達十年和26億美元。

但是,在本月初刊於《自然:生物科技》(Nature Biotechnology)的研究論文中,AI初創公司Insilico Medicine與多倫多大學研究人員合作,僅花21天就創造出30,000個針對纖維化(fibrosis)蛋白的分子結構。他們在實驗室中合成了其中六個化合物,四個化合物在生化檢測中顯示活性,兩個在細胞測試中得到驗證,當中在老鼠身上最為有效。研究人員總結,這分子對抗該蛋白甚為有效,並展現出「類似藥物」的特質。整個過程僅花了46天。

他們使用了兩種常見的AI技術:生成對抗網絡(generative adversarial networks,GANs)和強化學習(reinforcement learning)。Insilico的系統審視過往對於該藥靶有效的分子的研究和專利,而得出的新結構中,把可於實驗中合成的列為更優先級別。過程類似化學家尋找新療法,但速度更快。

Insilico利用AI,僅46天就找出具有「類似藥物」特質的分子。(Insilico Medicine)

沒有參與研究的加州大學三藩市分校(UCSF)生化學家Adam Renslo如此點評:「看到AI被訓練為有點像藥物化學家般思考,很酷。」傳統上,以電腦開發藥物都只是以蠻力方式,從數以百萬計的潛在結構中尋找,而成效有限。「這演算法涉及創造過程,不只是數據挖掘。」Renslo說。

AI預測準過人類

或許AI已經能夠像化學家那樣思考,甚至已有點超越之勢。DeepMind的AlphaGo早已在圍棋盤上,證明它比李世乭、柯潔等圍棋大師優勢。去年12月,DeepMind首次介紹了AlphaFold,是一個設計為預測蛋白質摺疊(protein folding)的演算法。在墨西哥舉行的第13屆蛋白質結構預測檢定(CASP13)中,AlphaFold在預測蛋白質形狀上,擊敗了一眾經驗老到的生物學家。

比賽如此進行:參賽隊伍會收到90個蛋白質的氨基酸線性序列,這些蛋白質的立體形狀已知但未曾公開,參賽隊伍要計算推測這些序列會如何摺疊,猜中最接近答案的次數最多者勝。過往未曾參賽的DeepMind,其AlphaFold平均表現比其餘97隊參賽者更準確。比賽創辦人及美國馬里蘭大學計算生物學家John Moult指,尤其是在最困難的43個測試中,AlphaFold平均比其他隊伍準15%。這90個蛋白質之中,有43個沒有提供其他資訊可輔助推測形狀,AlphaFold對其中25個的推測都是最準確的,而排第二的隊伍僅有3次最為接近。

蛋白質的功能與其立體結構相關,科學家認為,理解和預測蛋白質結構將有助了解疾病成因及研發新藥。(Wikimedia Commons)

蛋白質由氨基酸串連而成,其序列會決定蛋白質的形狀,而形狀又決定功能。例如抗體的Y字形結構,讓它能偵測和標示致病微生物,讓免疫系統將之阻礙或消滅。能預測蛋白質形狀對科學家之所以重要,在於可對它們在人體中的作用有基本理解,也有助診斷和治療一些相信是蛋白質摺疊錯誤引起的疾病,例如阿茲海默症、柏金遜症、亨廷頓舞蹈症(Huntington's Disease)、囊狀纖維化(cystic fibrosis)等。

但單憑遺傳序列來找出蛋白質的立體結構,是科學家數十年來面對極之複雜的挑戰。困難在於氨基酸殘基(residues)會形成長鏈,而DNA只含有氨基酸殘基序列的訊息,所謂「蛋白質摺疊問題」,就是預測這些長鏈會如何摺疊成蛋白質立體結構。蛋白質愈大,結構可能性愈多。美國分子生物學家利文索爾(Cyrus Levinthal)就曾在1969年說過,要知道蛋白質摺疊結構的每個可能性,需時或比宇宙的年齡更長。

過去五十年,科學家可以在實驗室中利用諸如低溫電子顯微鏡(cryo-electron microscopy)、核磁共振光譜法(NMR)、X射線結晶學(X-ray crystallography)等技術,判斷蛋白質的形狀,但這些方法都牽涉大量反覆試驗,找出每個結構的過程費時而昂貴。「若我們可認識蛋白質,就可學習自行製造。」在DeepMind專門研究蛋白質摺疊的科學家John Jumper說。

DeepMind的AlphaFold如何推測蛋白質摺疊結構(DeepMind Blog)

當然,這個題目本身也很適合DeepMind。自2006年起,DNA採集、儲存、分析等數據都有爆發性增長。正如哈佛大學系統藥理學實驗室研究員Mohammed AlQuraishi解釋:「一間像DeepMind般的公司可以取得一點成果,我認為蛋白質摺疊是一個很好的起點,因為它是一個定義很清楚的問題,也有可用的數據,幾乎可以當它單純是一個電腦科學問題來看待。」更不要忘記有Google母公司Alphabet的龐大演算力和財力支持。

華盛頓大學蛋白質設計研究所總監David Baker也是CASP的搞手和參賽者。他解釋,DeepMind科學家利用前人的努力,建立了兩套演算法策略。首先,透過比較大量其他蛋白質的基因組數據,AlphaFold能夠更好地破解,哪些氨基酸配對在已摺疊的蛋白中最可能繞在一起;其次,相關比較也有助他們推測,相鄰氨基酸結合時最可能的距離和角度。有相關評估證明,這兩種進路都是愈多數據表現就會愈好,故非常適用於AlphaFold這樣擅長從分析大量數據解決問題的機器學習演算。

而在7月,澳洲福林德斯大學(Flinders University)醫學院教授Nikolai Petrovsky更聲稱,其開發的人工智能程式SAM,研發出新流感疫苗,開創全球先河。一般每年接種的季節性流感疫苗都是對抗四株流感病毒,而具體挑選哪4株,則會由世界衞生組織(WHO)對南北半球的流感數據進行分析,從而預測下一輪流感季節流行的病毒株來建議疫苗配方。

有澳洲科學家早前以AI研發了流感疫苗。(資料圖片/Getty Images)

Petrovsky解釋:「我們要以一組已知可激發人體免疫系統的化合物,以及另一組無效的來教導AI程式,它的工作是要學懂自行分辨哪些藥物有效,哪些沒有。接着,我們開發了另一個程式,可產生數以兆計不同化合物,再把它們全部交給SAM分析,判斷哪些可能是有用的人類免疫藥物。」然後團隊就會挑SAM所辨認的頭幾個,在實驗室中合成。「我們已從動物測試知道,那疫苗對於流感極之有效,比現有疫苗更好。現在,我們只需要在人體上確認。」這研究得到美國國家過敏和傳染病研究所(NIAID)資助,會在美國展開為期12個月臨床測試。

押注AI走出困局

這些以AI製藥的初步成果,或許是製藥業將面臨重大變革的早期迹象。AI製藥公司twoXAR行政總裁Andrew Radin指,現時光是由初步意念到展開動物測試階段,一般就已經要花四至六年。也有些研究估計,每十個能夠成功進入到人體臨床試驗的療法,只有一個最終能成為藥物推出市面。

英國最大藥廠葛蘭素史克(GSK)副主席Tony Wood坦言:「在哪一個行業你可以接受這10%成功率?若我們能翻一倍至20%也將會非同小可。」美國製藥初創公司Recursion Pharmaceuticals共同創辦人及行政總裁Chris Gibson則對《彭博》說:「若我們想了解人體生物學其餘那97%,就需要承認這對於人類來說實在太過複雜。」

Hassabis指出,傳統方式研發新藥日走下坡,同時令藥廠更加不敢承擔研發成本,只求從現有藥物搾取更多。(Getty Images)

據創新基金Nesta在2018年報告,儘管公私營投資明顯增加,生物醫學科研的生產力在過去五十年持續下跌,開發新藥成本愈來愈高。報告指,「以指數上升的開發新藥成本,直接反映於所花費投資的低回報率。一個近期估算指出,全球最大藥廠們的回報率是3.2%,遠遠低於他們的資金成本。」四大會計師行之一的德勤(Deloitte)也發現,新藥研發的投資回報率是九年來最低,由2010年10.1%跌至2018年1.9%。

DeepMind行政總裁Demis Hassabis認為,這些不斷上升的失敗成本會令製藥業愈來愈保守:「若你看看絕大部份藥廠的行政總裁,他們都不是科學家,而是來自財務或銷售部門。這反映了什麼呢?這意味着他們所做的是,嘗試從已經被發明的東西中榨取更多,削減成本或改善銷售,而不是研發新事物。因為這樣風險更大,也無法輕易把它放到報表之中。這根本不容許天馬行空的創意……不是能夠讓你嘗試把火箭着陸月球的行事方式。」

所以,AI就似乎成了研發新藥的未來。世界經濟論壇去年也把AI製藥的應用,列為年度十大新興科技之一:「AI正開始增加分子設計和合成的效率,令過程更快、更容易和更便宜,同時減少化學物浪費。」根據《彭博》在7月引述PitchBook數據,風險投資去年就對研製藥物的AI初創公司投入了10億美元,遠比2016年2.37億為多;而本年至今已投入了6.99億。

多個研究顯示,新藥研發效率愈趨低迷。部分大藥廠近來開始與一些使用AI的初創合作,希望走出困局。(法新社)

AlQuraishi則提醒,DeepMind「基本上大比數打敗了所有人」,若藥廠不認真看待的話,或許會被迅速拋離。一些大藥廠也開始意識到這危機。美國藥廠默沙東(MSD)的計算化學副主席Juan Alvarez說,機器學習方法對於研發藥物「將會很關鍵」。默沙東現正開發AI工具,協助其化學家加快製造化學物質阻擋異常蛋白的過程。瑞士藥廠諾華(Novartis)生化及治療數據科學主管Jeremy Jenkins就說:「人人都在這領域中趕上潮流,就像是一隻大船改變方向,而我認為這些方法的規模最終會擴大至我們整個公司。」

因此,他們也開始與一些初創公司合作。前史丹福大學機器學習專家Daphne Koller創立的Insitro,本年4月就與美國生物製藥大廠吉利德(Gilead)簽訂可達10億美元的合同,合力研發治療非酒精性脂肪肝(NASH)的藥物。同月,英國藥物研發初創公司Exscientia宣布已製成一種或可治療慢性阻塞性肺病(COPD)的分子,將與葛蘭素史克進行臨床測試;美國藥廠阿斯利康(AstraZeneca)也與英國初創公司BenevolentAI合作,將就腎病和肺纖維化找出療法。美國藥廠安進(Amgen)藥物研究員Angel Guzman-Perez就認為,AI另一優勢是它也有其獨特的想像力:「可能會走向一個人類不會前往的方向。」

繼續閱讀︰AI用數據研製新藥 反而是它的最大局限?

相關文章︰從招聘到挽留員工 人工智能如何改革人事部?分析求職者性格 人工智能請人更可靠?用人工智能請人 是消除還是延續偏見?診症能力媲美人類 人工智能將成未來醫生?要取代人類醫生 人工智能還欠甚麼?

上文節錄自第181期《香港01》周報(2019年9月23日)《新藥研發低迷 人工智能可如何顛覆生態》。

更多周報文章︰【01周報專頁】《香港01》周報,各大書報攤、OK便利店及Vango便利店有售。你亦可按此訂閱周報,閱讀更多深度報道。