论文部分内容阅读
随着大数据时代的到来,越来越多的数据(如社交网络数据,移动定位轨迹数据,传感器感知数据,科学观测数据等)涌入到人们的日常生活和工作中。上述涌现的海量、异构和劣质(不精确)数据在体量、结构以及质量上呈现出区别于以往的规模和特点。与此同时,伴随人们现阶段对日常应用和生活品质的进一步追求,计算任务也正变得日益复杂(如更加复杂的统计、挖掘和科学计算等),计算开销和资源消耗正不断增大。为应对由数据特性和计算需求两方面带来的挑战,高效、准确地获取用户所需计算结果,鉴于传统的本地计算模式(计算、存储资源受限,且计算不经济)已无法满足上述需求以及云计算技术为代表的第三方计算技术的迅猛发展和应用,外包计算(即将数据外包至第三方进行计算并获取返回结果)应运而生。然而,在以云计算技术为支撑的外包计算模式中,云端可能因某些因素(如软硬件错误、额外商业利益诱导等)对外包计算中数据的隐私性和外包计算结果的可靠性进行攻击。因此,深入研究外包计算中的安全和隐私问题显得至关重要。本文针对安全外包计算中的若干关键问题展开研究,主要工作如下:(1)提出了基于隐私属性个性需求的轨迹数据隐私保护发布机制。面对数据隐私性和数据可用性之间的矛盾,我们鉴于现有隐私保护数据发布方案大多因忽略数据记录隐私需求差异而导致同质化发布下数据可用性低下的问题,考虑实际生活中不同个人、单位所对应数据(如记录、轨迹等)所拥有的差异化隐私需求,研究个性化隐私保护数据发布。鉴于目前移动轨迹数据(有噪、高维)对隐私保护需求的迫切性,我们具体研究个性化的隐私保护轨迹数据发布技术,在保护用户个性化隐私需求的情况下,提高发布数据的可用性。我们通过实验结果验证了所提方案的效率和有效性。(2)提出了基于幂群分组聚合验证的不确定频繁模式挖掘高效验证方案。面对数据可靠计算与计算管控受限之间的矛盾,鉴于现阶段复杂数据挖掘和计算任务(如频繁模式挖掘)需求的日益增长,以及不确定数据来源的不断增长(如感知数据、概率统计数据等),我们研究外包环境中不确定数据上复杂计算的高效验证技术。鉴于频繁模式挖掘计算在数据挖掘和统计预测中占据的重要地位,我们具体研究外包不确定频繁模式挖掘的高效验证技术,确保不确定数据上模式计算的可靠性。具体的,我们构建幂群分组并应用基于群组的聚合验证算法实现了对所产生幂群分组的高效、可靠验证。我们通过理论证明和分析了所提方案的有效性和安全性,并实验验证了所提方案具有的良好性能。(3)提出了基于乘性随机扰动的多数据拥有者安全协作计算方案。面对数据分布式划分与实体协作计算之间的矛盾,尽管现阶段外包环境中的安全外包数据挖掘计算已被提及并有一定研究,但关于基于划分数据的分布式数据安全协作计算仍未引起充分的研究和重视。现有方案都因密码学和安全多方计算存在的低效问题而无法实用。为解决这个问题,我们以乘性随机扰动技术作为外包数据隐私保护基础,研究多数据拥有者间高效协作计算机制,并设计相应的安全保护机制。其中,我们根据不同安全假设和需求以一种递增的方式阐述并强化本章所设计安全协作计算方案。我们以经典的数据挖掘方法,如KNN,K-means以及SVM为例进行分析验证,来验证所提方案的有效性。