文档库 最新最全的文档下载
当前位置:文档库 › K-匿名隐私保护相关技术的研究

K-匿名隐私保护相关技术的研究

【摘要】在数据发布领域,k-匿名技术是一种简单有效的隐私数据保护技术。因此国内外专家学者们对匿名化技术开展了广泛深入的研究工作以寻求防止或减少隐私泄露的有效方法。本文根据已有的一些研究结论,阐述了匿名化技术的一般概念、匿名化原则、匿名化方法和匿名化度量等方面,并且介绍了两种经典的匿名化算法。

【关键词】数据发布;匿名化技术;k-匿名

1.引言

下面文章将在第2部分介绍数据发布和匿名发布的相关概念及定义,第3部分介绍常见的匿名算法,第4部分小结。

2.相关概念,相关定义

2.1 匿名技术[3]

匿名技术:是身份隐藏中最直接的技术。它作为隐私保护的数据挖掘技术不对数据挖掘结果进行保护,也不将原始数据进行隐藏伪装,而是公布带隐私的所有数据,但是他人拿到隐私数据却不能推导出该数据拥有者的身份。

2.2 匿名发布技术相关定义[4]

定义1:属性

令:b(a1,…,an)是一个有限数量元组的一个表,b的有限元属性元组是{a1,…,an}。

假设表b(a1,…,an),{ai,…,aj}{a1,…,an},有一个元组t∈b,用t[ai,…,aj]来表示t中ai,…,aj的值vi,…,vj的有序序列。用b[ai,…,aj]来表示投影,维持b中属性ai,…aj的元组复制。

定义2:类标识符

假设一个实体集u,一个特定的实体表t(a1,…,an),fc:u→t以及fg:t→u',其中uu’.t的一个类标识符记为qt,是一组属性{ai,…,aj}{a1,…,an}其中:pi∈u所以fg(fc(pi)[qt])=pi.成立。

定义3:k-匿名

rt(a1,...,an)是一个表qirt是与rt有关联的类标识符,并且仅当在rt[qirt]中出现的每一个有序的值至少要在rt[qirt]中出现k次的话,就说rt满足k-匿名。

推论:

假设rt(a1,...,an)为一个表,qirt=(a1,...,an)是与rt相关联的类标识符,ai,...,aja1,…,an,rt满足k-匿名,那么在rt[ax]中出现的每一个值的有序序列至少要在rt[qirt]中出现k次,x=i,...,j。

相关文档