官术网_书友最值得收藏!

1.2.2 隱私脫敏

隱私脫敏通過采用有失真且不可逆的方法對隱私信息進行保護,使脫敏后的信息無法與數據主體關聯起來。隱私脫敏包括但不限于現有的對數據中包含的隱私信息進行泛化(Generalization)、抑制(Suppression)、解耦(Anatomization)、置換(Permutation)、擾動(Perturbation)等方法,未來還需要在隱私脫敏方面進行新的理論創新。隱私脫敏又常被稱為隱私化或匿名化。

1.泛化

泛化是將一類屬性中的特定值用一個更寬泛的值代替。比如一個人年齡為25歲,可以將其泛化為20~30歲;一個人的職業是程序員或者律師,可以將其泛化為白領(腦力勞動者)。

2.抑制

抑制是指發布信息時將某個屬性、屬性的值或者屬性值的一部分以*代替。比如將手機號碼表示為135****3675,信用卡號碼表示為4392********。

3.解耦和置換

解耦和置換都是去除準標識符和敏感屬性間的關聯性,而不改變準標識符或敏感屬性的值。解耦是將原始記錄表分為兩個表發布,一個表發布準標識符屬性,另一個表發布敏感屬性,兩個表只有一個相同的GroupID作為共有屬性。置換是把一個數據記錄集合劃分成組,在組內對敏感值進行置換,從而打亂準標識符和敏感屬性間的對應關系。

4.擾動

擾動的主要思想是用合成的數據值取代原始的數據值。擾動后統計信息不發生顯著改變,而且改變后的數據與真實數據主體失去關聯性。擾動的主要機制包括加噪、數據交換、合成數據生成等。加噪主要用于數值型數據的隱私保護,從一個特定分布的噪聲中生成噪聲值添加到敏感值上。數據交換的主要思想是交換個人數據記錄間敏感屬性的值,可以保持統計分析的低階頻數統計或邊沿分布。合成數據生成的主要思想是依據數據構建一個統計模型,然后從模型上采樣取代原始數據。擾動因為簡單、有效且可保持統計信息的特性,所以在統計發布控制中已經有很長的應用歷史[11]

在上述脫敏操作的基礎上,發展出了一系列隱私脫敏模型和方法,包括k-匿名[12]、l-多樣性[13]、t-接近性[14]、差分隱私[15]、本地化差分隱私[16]等。在后續章節中會對其加以介紹。

主站蜘蛛池模板: 南阳市| 塔河县| 揭东县| 曲水县| 丹阳市| 从江县| 轮台县| 周宁县| 巴青县| 札达县| 双江| 五常市| 绵阳市| 平江县| 宁晋县| 鞍山市| 靖安县| 于都县| 陆丰市| 泽库县| 皋兰县| 永川市| 宁明县| 东阳市| 平乡县| 古蔺县| 利辛县| 吴桥县| 建宁县| 红桥区| 白朗县| 宝应县| 白河县| 神池县| 万宁市| 靖边县| 锡林浩特市| 观塘区| 兖州市| 夏河县| 阳朔县|