【科技.未來】基因數據庫屢破懸案 親戚DNA在無意中舉證

撰文:孔祥威
出版:更新:

美國「金州殺手」(Golden State Killer)去年4月落網,逾四十年的連環兇殺懸案得以告一段落,自此開啟了科學搜證的新時代——以公開基因數據庫重組族譜來鎖定犯人的方法,已協助警方解決一宗又一宗的棘手案件。隨着基因檢測潮流愈趨熾熱,預料會有愈來愈多懸案罪犯被送進監獄,然而,重組族譜技術也意味着會有大量無辜或不知情的人被捲入調查之中。懸案要水落石出,是否要以公眾私隱為代價?

警方透過遺傳系譜緝兇的方法,成功令四十年懸案的疑犯Joseph James DeAngelo落網。(路透社)

1998年9月,在美國北卡羅萊納州I-85幹道一塊廣告牌下,躺着一具死於絞殺的十歲男童屍首。經DNA測試發現,受害人是一對亞裔和白人夫婦的兒子,但與失蹤兒童記錄中無一匹配,身份不明,被稱為「廣告牌下的男孩」(Boy Under the Billboard),成為懸案。

案件直到去年12月才有所突破,遺傳系譜學者Barbara Rae-Venter把男童的基因檢測數據與網上基因數據庫進行比照,找到男童一名曾參與基因檢測的親戚。這名親戚另有一名女親戚,正尋找一起長大的失散表弟。女親戚表示,表弟十歲時與父母移居北卡羅萊納州,不久之後,表弟的父親跟親戚說與太太離婚,表弟隨韓裔母親回韓國生活,表姐弟自此失去聯絡。女親戚向警方講述了表弟失蹤的情況,兩者一拍即合,終於證實了男童名叫Robert “Bobby” Adam Whitt,生於密歇根州,成長於俄亥俄州。

遺傳系譜學者Barbara Rae-Venter協助警方偵破多起案件。(資料圖片/barbara.genealogyconsult)

那麼,Bobby的母親又在何處?警方翻查失蹤女性案件後有所發現。在Bobby屍體被發現的四個月前,在同一幹道延伸至南卡羅萊納州一段的路邊叢林中,警方發現一具亞裔女屍,雙手有捆綁印痕,死於窒息。經基因鑑定證實她是Bobby的母親,並在國際間協力下得知,她名叫Myoung Hwa Cho。

警方找上了Bobby父親、Hwa Cho的丈夫,他因為干犯其他罪行正在獄中。連番盤問之下,他承認自己殺害了妻兒。這宗逾二十年的懸案,終於在本月初得以偵破。

透過遺傳系譜緝兇

Rae-Venter早在去年4月,已用相同技術令「金州殺手」嫌疑犯Joseph James DeAngelo落網。DeAngelo涉嫌於上世紀七十至八十年代在加州謀殺12人,並性侵最少50人。Rae-Venter把疑犯的基因資料上載到名為GEDmatch的公開基因數據庫,找到了DeAngelo的族兄弟姊妹(third cousins,即共同祖先為高祖父母),重組系譜後鎖定了DeAngelo。

DeAngelo最終被警察拘捕,負責追捕「金州殺手」的探員Paul Holes對這項技術推崇備至:「這是最新的偵案技術,也是廿多年前開始使用DNA以來最大的一場革命。」一名執法部門官員向新聞網站《BuzzFeed News》透露,自「金州殺手」落網以來,馬里蘭州、華盛頓州、加州、佛羅里達州等地的警察相繼以同樣方法破案。加州非牟利組織DNA Doe Project也以之辨認出幾名失蹤人士的身份。難怪去年末Rae-Venter登上了《自然》 (Nature)科學雜誌2018年度十大科技人物排行榜。

CeCe Moore是這股法證新潮的另一炙手可熱人物,她除了是尋根電視節目《Finding Your Roots》的常客外,去年5月更被DNA法證公司Parabon聘用為首席遺傳系譜學家。自去年5月中首次成功協助警方拘捕了三十年前華盛頓雙屍謀殺案疑兇William Earl Talbott II後,Moore領導新成立的遺傳系譜部門屢建奇功。Parabon至今已上傳至少200人的基因檔案到GEDmatch,參與「解決」了20宗已公開案件,另有八宗未公開,現時正跟進約40宗案件。

GEDmatch創辦人Curtis Rogers事前不知道警方用他的網站令「金州殺手」落網,故收到指摘他洩露用戶私隱的電郵時大為憤怒。但他後來收到更多祝賀信,一名女性用戶更要求讓執法部門更容易找到她的資訊,因為她的父親殺死了祖父後需要經常進出精神病院,她懷疑父親也殺害了其他人。

(香港01製圖)

遺傳系譜緝兇到去年才一鳴驚人,一大原因是美國的基因檢測潮流近年愈趨旺盛,積累了大量市民基因數據。約十年前起,23andMe、FamilyTreeDNA、Ancestry等好幾家直接面向消費者(direct to customer,DTC)的基因檢測公司,在美國陸續推出基因檢測服務。消費者只需花數十美元,並把口水或拭過口腔的棉花棒寄回這些公司,就可得到一份檢測報告。這些報告主要會告訴客戶其祖先來源,例如有多少比率是高加索人種或蒙古人種之類、與數據庫中其他做過檢測的人的血緣親疏,以及是否具有特別基因。

以基因「大義滅親」

據《麻省理工科技評論》(MIT Technology Review)整理及估算,截至本年1月,已合共有至少2,600萬名消費者的DNA資訊記錄在美國四大基因檢測公司的數據庫中,並預期若熱潮持續,數據庫記錄數量將在24個月內突破一億人。

消費者只需花數十美元,並把口水或拭過口腔的棉花棒寄回基因檢測公司,就可得到一份檢測報告。(資料圖片/視覺中國)

有別於這些基因檢測公司,GEDmatch沒有實驗室,不做檢測,它只是商人Curtis Rogers和運輸工程師John Olson出於興趣、助人了解家族歷史和尋找失散親人而設的免費網站,讓做過基因檢測的人上載結果配對。

正如我們約有一半基因分別來自父和母,約四分之一來自祖父母輩,與其他不同親戚之間也有一定範圍的基因是相同的。只要把某人的基因樣本上載到GEDmatch與約120萬個檔案作比較,遺傳系譜專家就可以找出哪人是他的親屬,以現時的數據量,一般可找到族兄弟姊妹一輩或更近的親人。專家再以這些親戚為基礎,利用人口普查數據、死亡證、結婚證、訃聞,甚至社交網站帳號等資訊,像砌拼圖般重組他的族譜。養子可尋回親生父母,警方則以此收窄偵查範圍,甚至鎖定疑犯身份。

事實上,GEDmatch的數據量遠不及Ancestry(1,000萬)、23andMe(500萬)等檢測公司,美國聯邦調查局(FBI)的數據庫CODIS(The Combined DNA Index System)也記錄了1,600萬名罪犯的基因資料。GEDmatch之所以吸引到市民、研究人員和警方,全因它是最具彈性的基因數據庫。檢測公司的數據庫各有諸多限制,例如有些禁止上傳罪案現場的基因資料,又或不接受其他公司所做的檢測報告。

此外,CODIS只針對20個特定基因位置採集數據,不會記錄某人的所有遺傳編碼。這些位置上是一些稱為STR(short tandem repeats,短串聯重複序列)的簡短而重複的DNA序列,重複次數長短因人而異,不可能有兩人在20處皆完全一樣。美國史丹福大學生物學者Jaehee Kim解釋,這樣做的原因是為了盡量保障私隱,確保只足夠罪案舉證之用,而去除了其他生物資訊如瞳孔顏色、膚色、疾病等,就像採集指紋一樣。

遺傳系譜緝兇到去年才一鳴驚人,一大原因是美國的基因檢測潮流近年愈趨旺盛,積累了大量市民基因數據。(資料圖片/法新社)

美國最高法院於2013年裁定,這種方式即使在未經同意下採集,仍沒有違反憲法《第四修正案》(The Fourth Amendment)中「不合理搜查和扣押」的條文,全因STR的資訊「不足以暴露被捕人士的遺傳特徵」。

史丹福大學人口遺傳學家Noah Rosenberg指出,這種方式雖可讓法證專家在血漬之類容易變質的樣本中,仍可相對容易地取樣,但它極不適合用來配對親屬,因為數據的精細度不足以追溯祖源和親屬關係。像DeAngelo等懸案疑犯被上載到GEDmatch的基因資料,或DTC基因檢測公司所用檢測方法,記錄某人基因組上數十萬個稱為SNP(單核苷酸多態性)的DNA序列差異位點,就適合得多。

再者,CODIS只有已知罪犯的數據,無法與無案底者比對,作用有限。GEDmatch則不問基因數據來源,不論是23andMe的口水檢測,還是不知名實驗室所做的血液報告,一概照單全收,資料更完全公開,自然是應用遺傳系譜最佳之處。

史丹福大學人口遺傳學家Noah Rosenberg指出,特定基因位置採集數據適合用來配對親屬,因為數據的精細度不足以追溯祖源和親屬關係。(資料圖片/史丹福大學)

遺傳系譜緝兇協助警方破案有如神助,但該技術從面世之初便引起爭議,現時也暫無法例可以規管基因檢測公司或警方使用這種新穎而強大的搜查方法。各界爭議的焦點何在?請詳見另文《基因檢測公司協警破案 遺傳監視鋪天蓋地?

上文節錄自第151期《香港01》周報(2019年2月25日)《 來自遠房親戚的「指證」 基因數據庫有助破懸案》。

更多周報文章︰【01周報專頁】《香港01》周報,各大書報攤、OK便利店及Vango便利店有售。你亦可按此訂閱周報,閱讀更多深度報道。

【科技.未來】專題相關文章:實驗室製「迷你腦」 三大方向造福人類美國不規管 歐洲不放行 基因編輯重燃基改爭議黑客編輯肌肉基因 基因編輯有幾神奇模糊人類定義 生物黑客的超人類實驗改造基因適應太空 你有無資格生存?