超级时时彩

數據匿名化或不足以保護個人隱私 | 《自然-通訊》
數據科學和人工智能有望變革我們日常生活的方方面面,如醫療、衛生保健、商業和治理。

本文轉載自”Nature自然科研“。

《自然-通訊》發表的一篇論文 Estimating the success of re-identifications in incomplete datasets using generative models 介紹了一種可以評估一個人的身份是否能夠從一個不完整的匿名化數據庫中被重新識別出來的方法。該論文認為目前的匿名化和數據共享方法可能不足以保護個人隱私或滿足數據保護法律法規的要求,如歐盟的《通用數據保護條例》(GDPR)。


來源:VisualHunt

數據科學和人工智能有望變革我們日常生活的方方面面,如醫療、衛生保健、商業和治理。這些方法依賴于大規模的詳細個人數據,但是收集和共享個人數據引發了有關個人隱私的擔憂。針對這個問題,目前的解決方法包括匿名化處理和公布不完全的數據集。但是,近期發生了利用匿名數據集,包括瀏覽歷史記錄、手機和信用卡數據,成功重新識別出個體身份的情況,這表明上述措施可能還不夠充分。

英國帝國理工學院的Yves-Alexandre de Montjoye及同事開發了一種統計方法,能夠準確估算通過匿名數據集正確地重新識別個體身份的可能性。作者發現,只需要知道少數幾個屬性,如郵政編碼、出生日期、性別和子女數量,一般就能夠以高可信度重新識別出個體身份——即使數據集是不完整的。已知屬性越多,識別的可能性越大。例如,99.98%的馬薩諸塞州人口可以通過15個人口統計學屬性識別出來。因此,他們總結認為只公布取樣數據集或不完全數據集不足以保護個人隱私。

所有文章僅代表作者觀點,不代表本站立場。如若轉載請聯系原作者。
查看更多
發表評論 我在frontend\modules\comment\widgets\views\文件夾下面 test