一种面向决策树构建的差分隐私保护算法

被引:11
作者
熊平 [1 ]
朱天清 [2 ]
金大卫 [1 ]
机构
[1] 中南财经政法大学信息与安全工程学院
[2] 武汉轻工大学数学与计算机学院
基金
中央高校基本科研业务费专项资金资助;
关键词
数据挖掘; 差分隐私; 数据发布; 决策树;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
对差分隐私的基本概念和实现方法进行了介绍,提出了一种用于决策树分析的差分隐私保护数据发布算法。该算法首先将数据完全泛化,然后在给定的隐私保护预算下采用指数机制将数据逐步精确化,最后根据拉普拉斯机制向数据中加入噪声,保证整个算法过程满足差分隐私保护要求;对指数机制中方案选择的方法进行了有效的改进。相对于已有的算法,本算法可在给定的隐私保护预算下使数据泛化程度更小,使所发布数据建立的决策树模型具有更高的分类准确率。实验结果验证了本算法的有效性和相对于其他算法的优越性。
引用
收藏
页码:3108 / 3112
页数:5
相关论文
共 7 条
[1]  
Calibrating noise to sensitivity in private data analysis. Dwork C,Mcsherry F,Nissim K,et al. Proceedings of the 3rd Conference on Theory of Cryptography (TCC’’06) . 2006
[2]  
Differential privacy. Dwork C. Automata,languages and programming . 2006
[3]  
Data mining with differential privacy. Friedman A,Schuster A. Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . 2010
[4]  
Differentially private data release for data mining. MOHAMMED N,CHEN R,FUNG B C M,et al. Proc of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Min-ning . 2011
[5]  
Data mining:practical machine learning tools and techniques. WITTEN I H,FRANK E,HALL M A. . 2011
[6]  
Mechanism Design via Differential Privacy. Frank McSherry,Kunal Talwar. Proceedings of the 48th Annual IEEE Symposium on Foundations of Computer Science . 2007
[7]  
On the complexity of dif-ferentially private data release:efficient algorithms and hardness re-sults. DWORK C,NAOR M,REINGOLD O,et al. Proc of the41st Annual ACM Symposium on Theory of Computing . 2009