面向结构化数据集的敏感属性识别与分级算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:juguoxianzhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和属性间关联规则挖掘,将任意结构化数据集的敏感属性进行识别和敏感度量化;通过对敏感属性簇中属性间的互信息相关性和关联规则分析,对敏感属性进行分组并量化其平均敏感度,实现敏感属性的分类分级。实验表明,该算法可识别、分类、分级任意结构化数据集的敏感属性,效率和精确率更高;对比分析表明,该算法可同
其他文献
2011年11月16日,丹佛斯在天津武清开发区举办了在华十五周年庆典。丹佛斯全球董事会主席雍根柯劳森(Jorgen Clausen)、丹佛斯全球总裁兼首席执行官克里安森(Niels B.Christiansen)
为切实贯彻“德智体全面衡量,择优录取”的招生原则,应尽快探索出一条行之有效而且具有可操作性的实施办法,在具体实施中,应打破现有录取格局,增加额定招生计划的录取比例,新生进校
The perceiving local site effects on strong ground motion are particularly important for the mitigation of earthquake disasters as well as future earthquake res
1949年11月中国科学院(以下或简称"科学院""中科院")成立。作为国家最高科学研究机构,国家始终要求科学研究为国民经济服务,而科学研究的属性和科学家的追求则是希望在基础科
期刊
在新闻的编写过程中,选择一个适当的由头,能够将新闻内容实质更加直观切实的展现在受众面前。具备一条优秀的由头,能够引发更加强烈的反响,同时将新闻背后所蕴含的社会背景,
针对专业生产实习效果不理想的问题,通过调研高分子材料与工程专业发展的基本概况,根据专业建设和培养所面向的化学纤维行业背景,重点分析了高分子材料与工程专业实习教学过
2010年国际制冷技术交流会定于2010年8月6-7日在珠海举办,大会将聚集制冷行业专家学者、企业精英,发布国内外最新的行业政策信息及制冷行业前沿科技成果,为行业提供广泛的国
伴随着全球经济危机的突然爆发和恶性蔓延,螺杆压缩机市场也难逃整个经济环境的“魔掌”,2008年下半年和2009年初均受到较为明显的冲击,且整个2009年依然面临较大的经营压力
Although many methods of spatial analysis have been developed for a better understanding and modelling of urban space analysis, there is still a need for explor