面向隐私保护的密文数据检索与集合操作的关键技术研究

来源 :北京交通大学 | 被引量 : 8次 | 上传用户:yueaimeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的发展,互联网每时每刻都产生着海量的数据,这使得数据的存储和计算需求日益增大。云计算平台能够为云租户提供强大的存储空间和雄厚的计算资源,云租户只需要支付相对廉价的费用,就可以将繁重的计算和存储任务外包给云服务器,从而提高计算效率并节省云租户的开支。但存储和计算的外包将会使云租户失去对数据的直接控制,导致云租户数据的隐私信息泄露,譬如个人电子医疗信息、金融交易或商业文件等。因此,如何保障数据安全,实现数据的隐私保护成为近几年的研究热点。加密技术是保护隐私数据存储安全的主要手段之一。加密后的数据可直接上传到服务器端,实现数据的外包存储。而传统的加密技术将数据转化为无法识别的密文,丧失了大部分的语义特征,使得服务器端无法实现对密文数据的操作,如安全的密文检索、有效的集合操作等。因此,对于大部分数据来说,在实现隐私保护密文存储的基础之上,能够进行数据的密文检索以及集合操作等则具有更实际的应用价值。本文主要从隐私保护下数据的密文检索和集合操作两大方面展开相关研究,设计满足实际需求的隐私保护算法。1.隐私数据的密文检索。如何从存储在云端的海量密文数据中检索到用户感兴趣的信息是近几年的研究热点。数据以密文的形式外包存储在云端,而基于传统加密构造的密文检索方案只能实现简单的密文检索,无法对外包密文数据进行访问控制。在基于属性加密的机制中,数据拥有者制定访问控制策略实现对数据的细粒度访问控制,即只有满足策略的数据使用者才能对密文数据进行解密,这种机制实现了对外包数据的授权共享。因此,将属性加密机制的优势与密文检索相结合,即基于属性加密的密文检索,可以有效地实现密文数据的授权检索。而在已有的研究工作中,密文中的访问控制信息是直接被泄露的,无法保护密文策略的隐私以及抵抗关键字猜测攻击。针对此问题,本文提出了隐藏策略的基于属性加密的密文检索(Hidden Policy Ciphertext-Policy Attribute-Based Encryption with Keyword Search,HP-CPABKS)方案,并给出了详细的安全性证明与实验数据分析。该方案使用"与"门访问控制策略和非对称双线性对操作,主要实现了:(i)数据拥有者制定访问控制策略,实现对密文数据的细粒度访问控制功能;(ii)满足访问控制策略的用户可以将复杂的检索操作委托给云服务器,由云服务器实现密文检索功能,同时不泄露原始数据的隐私信息;(iii)有效地实现了对访问控制策略的隐私性保护,并成功地抵抗了关键字猜测攻击。2.隐私数据的集合操作。如何在隐私保护的前提下从不同的数据库中提取出相同或者近似的记录和信息也是本文研究的另一个主要内容。而集合交集计算作为集合操作的基础运算,可以有效地应用到电子医疗数据库记录匹配或者在线推荐系统中。随着数据库中数据量的不断增大,高效快速地挖掘出数据集之间的相关信息才能更好地满足实际需求。集合相似度计算不同于集合交集计算,只需要计算出集合之间的一个统计信息,即相同元素所占比例,而无需得到具体的相同元素。集合相似度计算的应用也非常广泛,如相似图片查找、文章剽窃检测等。本文针对隐私集合交集计算和集合相似度计算分别从功能和效率上展开相关研究,主要内容包含:·基于传统公钥加密的隐私集合交集方案,需要大量开支管理公钥证书。本文将基于身份的加密机制应用到隐私集合交集中,大大地简化了公钥证书的管理。同时,在已有的对称集合交集协议中,计算双方之间需要大量的交互。为了尽量减少双方之间的交互,并实现结果输出的对称性,本文设计了基于身份的对称的隐私集合交集协议(Identity-Based Symmetric Private Set Intersection,IBSPSI)。协议中利用组合公钥的技术,避免了加密算法中复杂的双线性对操作,有效地提高了整个协议的计算效率。安全性分析和实验结果表明IBSPSI协议是语义安全的且在实际应用中是切实可行的。·为了减轻IBSPSI中客户端的计算以及存储负载,本文利用云平台的计算和存储资源实现数据存储及计算外包,结合基于身份加密的无证书管理优势,构造了基于身份加密的密文集合匹配(Identity-Based Private Matching over EncryptedData,IBPM)的外包计算方案,将复杂的密文集合操作委托给云服务器。IBPM方案还实现了对数据的细粒度访问控制,即云计算服务器只有拿到用户的授权令牌时才能对其数据集合进行交集操作。在DBDH和DLN困难假设下证明了IBPM是选择性安全的,同时在具体数据库上进行了效率验证,数据结果显示该方案能够满足实际应用需求。·大数据量的快速增长使得对计算效率的要求也随之提升。结合数据挖掘中的Minhashing算法,利用近似计算逼近精确计算,实现了大数据集下安全高效的集合相似度计算。文中还提出了近似计算的验证机制,保证了第三方辅助服务器返回的计算结果的正确性,并对验证机制进行了详细的理论分析。通过实验进行测试分析,相比于已有方案,本文提出的方案大大提升了计算效率,更能满足实际应用需求。同时,实验结果表明,验证机制的实际测试结果与理论结果完全一致。
其他文献
泛戏剧形态,是指一些初具戏剧因素,但还不成熟的戏剧形态。本文认为它在概念上分为三个方面,即本质“人物扮演”、内容“故事情节”、外在形式“舞蹈动作、唱念说白”等。三
东北黑蜂蜜是我国地理标志保护产品,含有丰富的营养物质和较高的经济价值。近年来,市售蜂蜜产品标识混乱,以次充好,以假乱真的现象频繁发生,严重损害了消费者的合法权益和对
天然气分布式多联供技术具有能源利用效率高,能源供应类型多,污染物排放少,负荷响应快等优点。文章以某工业园区为例,对多联供系统的设计方法进行了研究。从系统的能源利用率
目的探讨经乳晕外缘做弧形切口行乳腺良性肿块切除的可行性及临床应用。方法经乳晕外缘做弧形切口,钝性分离皮下组织造隧道达乳腺肿块组织表面以远,用电刀整块切除乳腺肿块。结
自改革开放以来,我国的建筑行业呈现出了高速发展的趋势,但是在进行建筑工程施工的时候,工程施工成本一直是进行工程项目管理重要的组成部分,同时由于工程施工阶段具有涉及内容多
为更好地解决在时间和方向测量精度低的情况下,仅利用到达频差(frequency difference of arrival,FDOA)进行定位求解的问题,对基于FDOA的无源定位算法现状和发展方向进行分析
腹股沟疝和股疝的腹膜前修补的历史可以分为两个部分:腹膜前间隙的解剖历史和腹膜外疝修补术的手术历史。外科手术又可分为两种手术入路:经腹膜入路(后入路)和经腹股沟入路(
随着中国经济的发展,人们的生活水平不断提高,旅游逐渐成为人们主要的休闲方式,因此研究旅游者的行为特征对于提高游客体验满意度及提升景区产品和服务品质具有非常重要的意
目的 分析腰硬联合麻醉在老年患者经尿道前列腺电切术中的麻醉体会及安全性。方法 选取2016年3月至2017年3月该院收治的78例实施经尿道前列腺电切术的老年患者作为观察对象,
经常会有菜鸟问这样的问题:影响电脑性能的关键部件是哪一个?其实这个问题不难回答,CPU、主板、内存、硬盘、显卡等等,都对电脑的性能有一定的影响,尤其内存更是不可忽视。有经