互聯(lián)網(wǎng)的網(wǎng)絡(luò)通向四通八達,每一處用戶提供的單向數(shù)據(jù)就會變成多流化,在你不知道的角落里秘密流通,畢竟家家都需要大數(shù)據(jù),連騙子都不例外。聯(lián)通員工販賣泄露用戶信息的消息想必已經(jīng)是家喻戶曉,日常生活想必每個人都遭遇了詐騙、推銷等的電話連環(huán)call,對于信息隱私安全越加薄弱的互聯(lián)網(wǎng),加上隨后即將爆發(fā)的物聯(lián)網(wǎng)、車聯(lián)網(wǎng),甚至是AI時代里,我們的隱私又該如何逃脫呢?



AI技術(shù)的探索,連馬賽克都阻擋不了。有時候,為了保護個人隱私,人們會對一些出現(xiàn)在照片或視頻里的人臉或其他不宜泄露的信息打上馬賽克,但是這種對圖像或視頻做模糊處理的方法很快就會變得毫無用處,因為 AI 軟件可以透視馬賽克并還原圖像的本來面目。
軟件工程師 Richard McPherson 利用機器學(xué)習(xí)教會一款軟件圖像識別技術(shù),用來識別一些被打了馬賽克的人臉或物體,而這種基于人工神經(jīng)網(wǎng)絡(luò)的圖像識別方法可以將被模糊處理過的圖像重新還原。目前,該軟件能識別圖像處理軟件 Photoshop 馬賽克處理過的圖像和視頻網(wǎng)站 Youtube 進行過模糊處理的視頻。
AI時代的發(fā)展,離不開深度學(xué)習(xí)和神經(jīng)開發(fā),就以目前現(xiàn)有的技術(shù)與數(shù)據(jù)來說,遠不能滿足它。像是無人車,AI系統(tǒng)與汽車的結(jié)合物,谷歌對旗下的無人車進行測試與訓(xùn)練ANI系統(tǒng),都是為了提升它的識別與感知能力。
譬如對視覺指示系統(tǒng)(Vis),是為預(yù)測聲音,預(yù)測環(huán)境進行物理互動后果的一個重要環(huán)節(jié),它能識別分析棍子擊打、刮擦或是捅一系列物理聲音,最主要的還是幫助機器人理解物體的物理屬性、環(huán)境互動。但這些能力的前提是深度學(xué)習(xí),它目前的訓(xùn)練方式是注入4.6萬種聲音的1000段視頻,以深度學(xué)習(xí)的算法對其聲音解析并與數(shù)據(jù)庫配對。
總得來說,AI比起互聯(lián)網(wǎng)更依賴于數(shù)據(jù)庫,一切能力的強化都需要數(shù)據(jù)庫配對訓(xùn)練,也正是因為AI時代對于數(shù)據(jù)的需求量大,我們消費者的信息隱私才顯得岌岌可危。
日常里那些成精了似的人工智能語音助手,例如Sirl,真的能為我們帶來,包括讓個人和企業(yè)效率的提高嗎?為了高效便利的生活,我們真的就可以對個人數(shù)字AI助理坦露自己最隱秘的事情嗎?就像亞馬遜CEO貝佐斯在 Re/code 大會上講的那樣,保護隱私是這個時代的難題,對于AI來說,更甚。
守口如瓶,對于人類來說都很難成真,而為AI作為一個離不開共享數(shù)據(jù)庫的個人助理又能如何將那數(shù)據(jù)半道劫持,不會真正的外傳呢?為了應(yīng)對數(shù)據(jù)上的保護,蘋果的應(yīng)對方式是想將(一定會收集用戶信息的)科技公司在隱私保護方面的級別,提升到新的高度,而“差分隱私 (Differential Privacy)”,正是它找到的答案。這項密碼學(xué)前沿技術(shù)的基本原理,就是向包含個體信息的大量數(shù)據(jù)集里注入噪音(或者說擾動),目標(biāo)是保證每個個體信息都無法泄露,同時這個數(shù)據(jù)集的統(tǒng)計學(xué)信息依然可以被外界分析,目前科學(xué)家們正在研究,究竟注入多少噪音,可以實現(xiàn)隱私保護和數(shù)據(jù)分析的最佳平衡。
可被外界分析就意味著沒有絕對安全性,像是經(jīng)典案例里的Netflix,曾放出“經(jīng)過匿名處理的”上億條電影評分數(shù)據(jù),“僅僅保留了每個用戶對電影的評分和評分的時間戳”,希望通過競賽的形式,找到更好的影片推薦算法。但是 2009年,德州大學(xué)的兩位研究人員,通過這些匿名數(shù)據(jù)與公開的IMDB數(shù)據(jù)做對比,成功將匿名數(shù)據(jù)與具體的用戶對應(yīng)了起來。為此,Netflix 不得不取消了,這項原計劃每年舉行的競賽。

數(shù)據(jù)隱私在這個互聯(lián)網(wǎng)主控的時代里都難以保護,就像接力棒似得投擲到下一個更危險的棒手AI手中,未來我們的生活或許會越加趨近智能,與此同時我們的隱私如同軟肋般,被AI把控著。在不能阻止技術(shù)迭代發(fā)展的前提下,未來的科技作態(tài)就只能精索安全級別,盡可能的是保護用戶數(shù)據(jù)隱私了。