【摘 要】
:
近年来,随着云计算等相关技术被工业界广泛使用,公有云上的数据安全问题成为了一大研究热点。用户的银行交易信息、收入情况、医疗记录等隐私信息在云服务器上有可能被窃取、利用。为了彻底解决云端数据库数据不可信问题,全密文数据库应运而生。在数据传送、查询并返回给客户端的全过程中,服务器无法解密密文,从而有效保证了数据安全性。纯软件密文数据库通常需要借助密码学的相关加密算法实现密文查询运算,如使用顺序可见加密
论文部分内容阅读
近年来,随着云计算等相关技术被工业界广泛使用,公有云上的数据安全问题成为了一大研究热点。用户的银行交易信息、收入情况、医疗记录等隐私信息在云服务器上有可能被窃取、利用。为了彻底解决云端数据库数据不可信问题,全密文数据库应运而生。在数据传送、查询并返回给客户端的全过程中,服务器无法解密密文,从而有效保证了数据安全性。纯软件密文数据库通常需要借助密码学的相关加密算法实现密文查询运算,如使用顺序可见加密ORE实现密文的范围查询。相关运算以UDF进行实现并编译保存在服务器端,UDF在需要时被调用,以此支持相关SQL查询。尽管全密文数据库在基础查询、运算功能上已进行了很多相关研究和实现,但是围绕密文数据库性能上仍面临着许多挑战,提升检索性能便是很重要的研究方向之一。索引结构是数据库查询优化的重要利器,因其搜索树的结构可以实现数据的快速定位。然而,当前密文数据库中实现的“索引”机制是一种广义的概念,指的是针对密文进行范围查询的检索方法:如使用布隆过滤器进行数据存储和检索(受布隆过滤器本身哈希函数的限制);在可信执行环境中对数据进行解密从而执行查询(依赖硬件支持,受硬件容量等属性限制,且需要先解密再运算,性能损耗大)等。这些方案并非是检索性能的提升,更像是检索功能的基本实现方案。本文基于团队前期实现的密文数据库Enc DB进行索引方案研究和实现。Enc DB使用ORE方案提供范围查询功能,在此基础上,我们利用ORE密文可比较的特性,提出Enc DB范围查询提速的索引方案——Enc DB+IDX:该方案通过为ORE密文单独设计数据类型和基于该类型的运算符和运算符类,从而以数据库原生索引结构维护了一棵有序的密文B-tree。同时通过结合查询计划执行器的相关计算统计规则,为范围查询重新设计了密文改写逻辑,保证索引在等值查询和范围查询中均能生效,实现了用户SQL查询、创建和使用索引的透明化。此外,本文还对ORE解密和DET辅助解密两种场景下聚集函数索引支持提供了实现方案,保证了索引结构的多场景支持。和当前密文数据库索引方案相比,本文的设计方案是基于ORE密文搜索树的查询加速实现。最后本文围绕查询执行计划选择、查询耗时、在基准评测中的吞吐量等指标设计了相关实验,从不同维度展示了索引的正确性和有效性。在读频繁的场景下,Enc DB+IDX方案的吞吐量相较于基线方案提升了2个数量级。在读写均衡的场景下,Enc DB+IDX方案的吞吐量是基线方案的2倍以上。
其他文献
激光诱导击穿光谱技术(Laser-induced Breakdown Spectroscopy,LIBS)是一种基于原子发射光谱的多元素分析技术,具有样品预处理简单、快速分析、实时在线等特性。将模式识别算法应用于LIBS光谱数据分析中,以提高其分析性能,推动LIBS技术的应用进程。针对丹参产地识别问题,基于LIBS技术得到丹参的光谱信息,利用支持向量机(Support Vector Machine
钻杆是钻井过程中实现力的传递、钻头钻进、井轨迹的延伸和导向钻井控制的主要设备,钻杆螺纹是否完好是钻杆安全连接的关键。因此,针对钻杆公母螺纹检测,研究合理有效的检测方法是实现全自动接钻杆的关键基础性研究。本文采用图像处理技术测量钻杆螺纹参数的方法,通过大量的实验,深入的研究了钻杆螺纹检测方法。主要的研究成果有:首先介绍钻杆螺纹检测系统的硬件实验平台和软件系统组成,根据选型规则搭建图像采集系统。其次,
镀铬是电镀产品生产中一种比较重要的工艺,其温度控制效果和自动化控制水平直接关系到镀件的质量与产量和电镀工艺能否顺利执行。因此,设计一个可靠性高,稳定性好的自动控制系统在镀铬生产线中是十分重要的。本文以镀铬自动生产线控制系统设计为目标,对镀铬生产线的工艺和控制要求进行分析,并结合企业的实际情况,设计了一套基于TIA Portal Wincc和西门子S7-1200 PLC电镀生产线自动控制系统,对自控
随着深度机器学习与人工智能的迅猛发展,强化学习作为最接近“强人工智能”范畴的机器学习方法已成为近年来的热门研究方向。强化学习采用无监督的方式进行“试错”学习,智能体基于自身经验学习最优策略,无需预先标注好的样本或大量的先验知识,对于解决动态场景下的复杂问题优势明显,应用潜力十分巨大。目前,对于强化学习的研究主要集中于深度强化学习以及多智能体深度强化学习两个方面。对于深度强化学习,已有越来越多不同种
近年来,随着云计算技术的不断发展,人们不再担心存储计算资源受限这一问题,但也随之导致了数据泄露事件的频繁发生,这时时刻刻提醒着人们需要对自己的数据信息进行隐私保护。通常,用户会选择将加密后的数据存储到云服务器中,但这种方式会导致对密文数据的检索变得非常困难。由此提出了可搜索加密(Searchable Encryption,SE)技术,它能在密文状态下对用户查询的关键字进行匹配检索,但如何使密文检索
监控摄像头目前已被广泛应用于公共或私人场所,并在安防活动中扮演着重要的角色,但其带来的隐私安全问题也不能被忽视。监控摄像头通常被安装在酒店前台,超市收银台或售票处等公共场合的角落。在这些场合下,用户输入个人识别码(PIN)解锁或付款的过程可能会在有意或无意中暴露。一旦PIN被破解将会给用户带来严重的隐私泄漏问题和财产损失,然而,几乎没有监控设备的制造商意识到这一隐患。PIN是一种传统的基于知识的认
随着大数据时代的到来,各行业在互联网技术的加持下迎来了蓬勃发展。海量的数据资源蕴含了丰富的实际价值,经过数据挖掘等技术的处理分析可以创造出巨大的社会以及经济价值。大数据技术给各领域带来便利的同时,将数据安全问题辐射到更广泛的领域。数据被盗、非法篡改、恶意传播等大规模数据安全事件屡见不鲜,资源的开发共享和数据的安全保护已成为数字经济时代长期存在的矛盾难题之一。数据库水印技术可以有效地保证数据库所有者
癌症,是一类严重危害人类生命健康的复杂疾病,具有高度异质性。癌症亚型识别问题是癌症研究领域中最重要的问题之一,同一种癌症的患者在生存风险、对药物的敏感性等多个方面存在明显差异,这意味着癌症存在多种不同的亚型,因此研究癌症的亚型划分,能够为癌症患者提供准确的诊断和治疗。高通量测序技术的不断发展,使得测序的规模迅速扩大,并且测序成本极大降低,现已积累了大量癌症患者的基因组、转录组、表观基因组以及蛋白组
信息时代的来临催生了人工智能技术的快速发展,为打破数据孤岛,同时避免传统机器学习模式集中收集训练数据带来的隐私威胁,联邦学习技术得以诞生。联邦学习由一个中央服务器与多个参与者组成,通过多次迭代共同训练一个全局模型。尽管前景看好,联邦学习应用到实际场景中时仍然遇到了很多的挑战,其中最为突出的就是异构问题与隐私问题。首先,联邦学习作为一种分布式机器学习框架,其训练数据在各个客户端的分布往往非均匀,数据
人工智能时代的到来,让人们的生活变得更丰富和便利。深度学习作为人工智能技术中的一柄利器,为机器学习各个领域的发展开辟了新的天地,同时也解开强化学习发展的枷锁。强化学习是一种求取任务中的最优策略的方法。得益于深度学习,强化学习在诸多领域中都获得了里程碑式的进展,例如智能驾驶、机械控制、电子竞技等。多智能体强化学习作为强化学习不可或缺的一门分支,主要被用来研究多智能体合作或竞争的问题,在许多领域中已经