结合污点分析与机器学习的隐私数据泄露检测系统设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:bird2000521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,用户的个人隐私数据拥有巨大的经济价值,相关的安全问题也愈发严重,各国组织纷纷出台相应的个人隐私保护政策。为了不违反隐私法规,企业需要进行数据合规的工作。数据合规最首要的任务便是对软件程序中隐私数据的定位以及泄露风险分析,使得自动化的隐私数据泄漏检测技术成为企业组织当前关心的重点。当前隐私泄露风险检测技术的实现多重点关注于泄露位置的检测,但一般不关注数据是否已经经过匿名化处理,对已经脱敏的数据也可能误报泄露风险,导致增加了数据合规的工作量以及维护的成本。本文旨在提供准确完整的隐私数据分布结果,提高匿名化隐私数据的检测能力,降低传统方法对隐私数据泄露风险的误报率。本文利用污点分析、程序图表示技术和机器学习分类模型为开发或安全工程师提供更准确的程序隐私数据泄露风险检测服务,进而减轻数据合规的工作量,保证软件系统对隐私数据的全方位监控与保护。本文由此提出了一种隐私数据泄露风险分析的方法(Private Data Leak Analysis,PDLA),该方法首先基于污点分析技术得到外部输入的用户隐私相关数据变量在项目程序中的传播路径;其次通过隐私数据变量传播路径中的函数调用提取出可能为加密函数的候选函数集合;随后针对候选函数,利用程序表示学习技术提取函数特征并结合图核函数生成函数的特征向量;其后利用机器学习分类模型对候选函数进行分类识别,以提升对隐私数据泄露风险评估的准确性,生成最终的扫描检测结果。本文基于所提方法设计并实现了一个面向Java Web项目的隐私数据泄露风险检测系统,该系统使用Spring Boot、Django、Soot、React等技术与架构完成系统的实现。实验表明,本系统在牺牲较少召回率的情况下,其准确率可以达到88%以上,与传统隐私风险检测工具Find Security Bugs相比,本系统将误报率减少20%。综上,本文系统能够提供全面的隐私数据分布并给出更准确的风险检测结果,从而节约维护成本,提高数据合规工作效率。
其他文献
实际数据通常来自多个不完整的数据源,不完整的多视图聚类方法提供了一些自然的方法来聚类这些不完整的数据。先前的研究假设所有视图都丢失相同比例的样本,并且不含有噪声。但是,在大多数实际应用中,不完整视图通常具有不同的缺失率(即不平衡不完整视图)和噪声,即包括强视图(缺失率低的视图)和弱视图(缺失率高的视图)。这些不平衡的缺失会导致先前的不完整多视图聚类算法失效,而且噪声导致不可靠的聚类结果。我提出了两
背景近年来,关于亚洲人重睑的形成机制问题,学术界仍存在着一定的争议。正因如此,学者们设计出了多种重睑术式。然而,利用这些方法进行重睑成形时,因大量去除睑板前组织而造成术后明显的瘢痕及重睑皱褶变浅或消失等问题使得患者对术后的重睑外观形态感到不满意。因此,为了重建生理性重睑结构,本研究在上睑解剖观察的基础上设计了一种新型的重睑成形技术,并命名为Kiss重睑术。方法从2018年6月到2019年12月,我
传统的阳极支撑平板式固体氧化物燃料电池(Solid oxide fuel cell,SOFC)由于在高温下所受热应力不均且氧化还原稳定性差,长时间运行容易产生基体翘曲、电解质破裂等问题而影响电池寿命。针对上述问题,本文结合管式SOFC几何对称的特性,设计并制备了中空全对称阳极支撑SOFC,同时对这一新结构电池做了较为深入地研究,取得的研究成果如下:(1)通过干压成型法和丝网印刷工艺获得电池阳极基体
本文主要讨论在带位置参数的非平稳AR(p)过程中利用M估计同时估计位置参数和自回归系数时参数估计的渐近性质,我们假设它的新息为独立同分布随机变量序列且分布属于特征指标0<α<2的稳定律的吸收域。关于一般的AR(p)过程的M估计,前人已经做过很多工作,如Davis等(1992)研究了一般的非平稳AR(p)过程的M估计和LAD估计的渐近性质,Chan和Zhang(2012)给出无限方差新息的非平稳AR
学位
学位
随着我国城市化进程的不断推进,日趋需要一种新的交通工具来解决城市的交通拥堵问题,地铁凭借其独特的优势,被越来越多的被大中型城市所青睐,成为公共交通的重要组成部分。由于其空间的相对密闭性及大客流的存在,存在诸多风险,一旦发生事故则后果不堪设想,而火灾就是地铁各类事故中最易发生、伤亡最大的一种。因此结合目前城市安全发展的需求,从预防和控制的角度进行地铁车站火灾风险评价具有很大的现实意义。本文通过对国内
随着科学技术的发展、能源需求的日益增加,油罐车作为短途能源运输最重要的装备,人们对其性能的实用性要求和安全性要求越来越高。从企业发展的角度,更渴望一种简洁又行之有效的设计思想,它既能融入当今的新技术、新方法和新手段,又能切实地提高产品的竞争力,本文提出的虚拟样机技术、油罐容器的建模技术、结构内部的仿真技术、结构优化技术等,他不仅可以缩短产品开发周期、降低开发成本,而且可以提高生产效率和产品质量,从
基于深度学习的目标检测是计算机视觉领域研究的重要方向,在实际场景中应用也极为广泛,包括人脸检测、自动驾驶、医学诊断等。传统的目标检测方法主要致力于实现更高的分类正确率,使得目标定位更为准确,将误分类情况下的代价看做是相同的,然而这与实际情况是不相符的。在实际场景中目标存在着不同的类别与重要性,不同类型的误分类将会引起不同量级的代价,这就是代价非平衡性问题。同时,由于目标检测的顺利完成需要较为充分的
在活体成像研究中,开发灵敏度高、特异性强、成像效果优异的分子影像探针对癌症等疾病的诊断与监测具有重要意义。近年来,人们已经报道了多种类型的分子影像探针用于生物成像领域,不同模态的分子影像探针在进行成像应用时,各有优缺点,其中长余辉成像探针具备高灵敏度、高信噪比,但是空间分辨率差的特点,而磁共振成像探针具备高空间分辨率但是灵敏度低的特性。为了提升成像精准度,人们将两种成像模式结合起来,构建了长余辉/