面向协同过滤推荐的差分隐私保护技术研究

发布者：董恺发布时间：2020-03-13浏览次数：1180

博士学位论文答辩公示

答辩博士：郭桃林

指导教师：罗军舟教授/博导

论文题目：面向协同过滤推荐的差分隐私保护技术研究

答辩委员会：

廖晓峰教授/博导重庆大学 (主席)

陶先平教授/博导南京大学

肖甫教授/博导南京邮电大学

倪巍伟教授/博导东南大学

杨明教授/博导东南大学

答辩秘书：董恺副教授/硕导东南大学

答辩时间：2020年3月18日16：00

答辩地点：https://zoom.com.cn/j/288808794

欢迎各位老师同学参加！

学位论文摘要：

协同过滤是目前最常用的推荐技术，其能够为用户提供个性化的推荐服务，从而有效缓解信息过载问题。然而，协同过滤需要用户上传个人历史数据，存在隐私泄露风险。即使通过传统的匿名技术对用户数据进行模糊处理，攻击者仍可通过去匿名等攻击手段推断用户的隐私。差分隐私是对于隐私的严格定义，能够对用户隐私提供保证。因此，设计面向协同过滤推荐的差分隐私机制已成为当前的研究热点。

现有研究工作从隐私保护机制的部署方式角度，可以划分为服务器端保护、用户端保护以及用户端-服务器端协作保护三类。上述三类工作分别存在各自的共性问题：在服务器端保护方面，现有研究假设用户之间相互独立，而当用户关系对推荐结果产生影响时，需要对关系数据添加大量噪声，从而严重降低推荐准确性；在用户端保护方面，现有研究主要根据内容相似性对用户偏好内容进行干扰，没有考虑内容发布前后攻击者先验知识和后验知识的变化，故而易受推断攻击；在用户端-服务器端协作保护方面，现有研究仅仅将用户端保护与服务器端保护进行简单结合，在用户端和服务器端分别对用户数据及中间结果进行重复干扰，从而严重影响推荐结果的准确性。

针对上述问题，本文分别对三种部署方式展开研究工作。首先，在服务器端保护方面，提出基于图链接分析的服务器端保护技术，对推荐场景及隐私信息定义的约束条件进行修正，在此基础上证明推荐功能函数的单调性，并提出添加噪声的优化方法，从而提升推荐准确性。其次，在用户端保护方面，提出基于贝叶斯理论的用户端保护技术，通过差分隐私对攻击者先验知识及后验知识的差进行约束，防止推断攻击；此外，在保证用户功能需求的基础上，通过非线性规划方法，最大化隐私保护程度。最后，在用户端-服务器端协作保护方面，提出基于本地差分隐私的用户端-服务器端协作保护技术，一方面通过随机响应技术在用户端对用户数据进行干扰，使其满足差分隐私的定义，另一方面通过无偏估计方法在服务器端对原始数据的统计特征及关联特征进行恢复，并将恢复结果用于推荐，从而提升推荐准确性。在上述理论研究的基础上，论文设计并开发了一套面向协同过滤推荐的差分隐私保护原型系统，并在真实的饭否应用中进行部署和测试。

论文针对协同过滤推荐中的用户隐私保护问题，从服务器端保护、用户端保护以及用户端-服务器端协作保护三个方面进行了深入研究。与现有的研究工作相比，论文所提出的隐私保护技术能够在保证用户隐私的前提下，提供更高的推荐准确性，从而能够更好地对隐私与功能进行权衡，这对协同过滤应用推广与用户隐私保护研究具有重要意义。