【人面辨識】美創科公司「起底」App惹爭議 數據庫量遠超FBI

撰文:機器之心
出版:更新:

在本週紐約時報刊登的一篇報導中,一家名為Clearview AI 的創業公司,因其「數十億張圖像」組成的面部識別系統,一舉成為社會熱議的焦點。
如果任何一個陌生人在街上拍下你的照片,手機app很快就能搜到你的姓名、住址和其他詳細信息,這個世界會變成什麼樣子?

Clearview 已經很大程度上讓這個想法成為了可能,這家公司設計了一款人臉識別程序,比如說你給某個人拍張照片,把照片傳到程序上面,就可以查看這個人的所有公開照片,包括這些照片的地址鏈接。

這個程序的的背後是一個超過三十億張圖像的數據庫,Clearview宣稱這些圖像是在Facebook、YouTube、Venmo等社交媒體上抓取的,這個量級遠遠超出了美國聯邦政府或者任何一家矽谷巨頭的的數據庫體量:FBI自己的數據庫收集了全美公民的護照和駕照照片,其中「僅」包含6.41億張照片。聽起來有點科幻?想來想去,《黑鏡》(Black Mirror)裡面確實有一集是講這樣的故事的。

僅靠一張臉,即可檢索出全網所有相關圖片。看到任何陌生人都能很快得到他/她的信息,現實與科幻就差個打分系統了。(《黑鏡:急轉直下》劇照)

據報導,從去年開始,美國有600多家執法機構都藉助這款程序來協助偵查犯罪案件,諸如入店行竊、信用卡詐騙、謀殺及性犯罪事件等等。不過大部分執法者對其背後的原理知之甚少,尤其是人臉圖像採集過程中所涉及的隱私問題。

目前,Clearview的數據集還沒有向公眾開放。公司的官網上顯示,其產品僅向執法部門開放。但如果它一旦公開,那麼對於普通人來說,通過一張臉去爬出一個人的資料,會變得如同在Google搜索一個人的名字那樣簡單。

更進一步來說,該程序還能用來做很多事情:比如識別抗議活動中激進分子的身份,不僅能搜出他們的名字,甚至還能知道他的住所、工作單位和社交關係網絡;如果在地鐵上遇到一個感興趣的人,也可以這樣做。

▼▼▼相關圖輯:【私隱何價】中國人臉資料網上任買 10元人民幣有5000張▼▼▼

+3

如上所述,Clearview的系統是構建在包含30多億張爬取自網絡(如Facebook、YouTube和Venmo等)的圖像數據庫上,爬取數據的過程可能違反了網站服務條款。執法機構可以根據具體情況上傳相關人員的照片,然後Clearview系統會返回相匹配的圖像以及圖像鏈接、社交資料等。

這家公司創立於2016 年,兩位聯合創始人中,一位是來自澳洲的越南裔人Hoan Ton-That,他在十三年前輟學並移民美國,在嘗試成為職業模特以後,突然投身科技圈,每天與人工智能、機器學習、圖像識別的知識為伴。

另一位是Richard Schwartz,目前已經60多歲,此前是報社的社論編輯,後來擔任過紐約市長Rudy Giuliani的助手。這兩個人就是在2016年的一次讀書交流活動上相識的,之後共同創辦了公司。值得一提的是,這家公司在初創過程中還獲得了來自Peter Thiel的投資,後者是著名的PayPal創始人,也是Facebook的天使輪投資人。

該公司的官網頁面過分簡潔:主要是一些業務的介紹,而對於創始團隊、辦公地點、發展歷程等方面則沒有細寫。

該公司的官網頁面過分簡潔 (Clearview官網截圖)

肆無忌憚的網絡數據爬取引發擔憂

儘管此類系統可以為警方的辦案過程提供便利,但不可避免的是,警方在使用人臉識別算法的過程中伴隨著風險。假陽性識別會導致罪行誤判,隱私擁護者擔心人臉識別的過度使用導致人們時刻處於警方的監控之下。包括此前一直飽受爭議的人臉識別偏見問題,這是個由來已久的問題,在中日韓等亞洲國家開發的算法,識別東亞人的臉比白種人更準確;在歐洲國家開發的算法,在識別白種人的面部特徵方面更加擅長。

通過一張臉去爬出一個人的資料,會變得如同在谷歌搜索一個人的名字那樣簡單。(視覺中國)

而且使用這套系統的前提,是要把自己的照片上傳到Clearview AI的服務器上,目前還不確定這是否安全——儘管Clearview表示其員工不會洩露你的照片。在該公司展示其技術的過程中,紐約時報記者Kashmir Hill竟發現公司可以在警方的系統中追踪她。

雖然Clearview公司正在避免隱私洩露的嫌疑,但人工智能係統確實是在進行不間斷地監視。當一些警官應要求通過Clearview app搜索Hill的圖片,很快Clearview公司的代表就打來電話,詢問他們是否在和媒體進行採訪——這很可能說明這家公司有能力得知執法部門正在搜索什麼。

比起數十億張照片被做成數據集更重要的是,Clearview已經與超過600家美國執法部門達成了合作。儘管還沒有對人臉識別系統的準確性進行實驗性驗證,但這家公司提供的技術已經可以做到遮住下半張臉,依然可以識別出你的身份,而且可以列出很多連你自己都不知道的照片。

你在臉書、推特等所有社交網絡上使用的圖片,都已被這家創業公司收集成數據集,而這家公司的客戶裡包括 600 多家美國執法機構。(美聯社)

Clearview公司產品的曝光引發了各路媒體對於人工智能隱私的探討,紐約時報援引一名專家的話說,這些人臉識別系統中的商業資本成分,必須在被濫用之前全面禁止。「一直以來,我們都在依靠行業自律來避免技術被應用到危險的方向上。但現在因為盈利的誘惑,一切都被打破了,」美國東北大學計算機科學教授Woodrow Hartzog說道。「如果人臉識別的技術不受控制,顯然弊大於利,現在唯一能做的就是禁止它。」

大規模的數據,高性能的算法吸引了大量執法部門的注意,不過能讓Clearview獲得600多家部門青睞的主要原因肯定是價格。據報導,公司向執法部門推銷的價格僅為2000美元(約港元15540元)。Clearview 程序中的底層代碼還顯示該軟件具備與AR 技術配合使用的能力,這意味著佩戴AR 眼鏡的人可能會使用Clearview AI 來立即確定任何人的細節信息。

儘管此類系統可以為警方的辦案過程提供便利,但不可避免的是,警方在使用人臉識別算法的過程中伴隨著風險。(視覺中國)

在被媒體報導之後,Facebook正準備調查Clearview蒐集數據的行為。在一份聲明中,Facebook發言人表示:「我們的政策禁止其他機構爬取Facebook上的信息,或將信息加入索引。因此我們正在審查有關這家公司的聲明,如發現違反規則的情況,我們將採取適當行動。」

【本文轉自「機器之心」,微信公眾號:almosthuman2014】