海量不完整数据的核心数据选择问题的研究

来源 :计算机学报 | 被引量 : 0次 | 上传用户:kingsword001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,越来越多的带有缺失值的数据需要处理,因而数据不完整成为一种常见的数据质量问题.不完整的数据给大数据的查询、挖掘和分析带来了困难.在某些情况下,数据中的很多缺失值是无法被确定的.只能根据用户的需求,在不完整的数据上选择一部分用户感兴趣的核心数据集合,来提高不完整数据的可用性.完整度较高,规模较小,在用户感兴趣的属性上给出更多完整信息的核心数据集合,能够支持高效的查询处理,提高查询结果的准确性和完整性.该文形式化了核心数据选择问题,证明了这至少是一个NP-难问题.由于需要同时优化核心数据集合的完
其他文献
安全多方计算是国际密码学界近年来的研究热点之一,也是网络社会隐私保护的关键技术.安全多方科学计算是安全多方计算的一个重要方面,最大(小)值的计算是一个基本的科学计算
在新兴的软件定义网络(Software Defined Networking,SDN)、OpenFlow交换机中,为满足OpenFlow协议宽匹配域的需求,SDN交换设备需要更大的查找表存储容量.当流表溢出时,将导致
本文通过研究不同种类的醇对于微生物脂肪酶催化的酯水解反应的抑制作用,对水相中酯合成反应的机理进行了初步的探讨,并对微生物脂肪酶催化的油酸 和甲醇的酯合成应进行了条件
摘要发展创意农业的关键在于对各种动力资源进行整合,建立高效的动力机制,实现动力资源向现实动力转化。运用系统动力学原理和农业可持续发展理论,分析了创意农业发展的动力要素,阐述了动力资源转化为现实动力的基本规律,指出了创意农业发展中的障碍性因素,提出了创意农业动力要素资源转化为现实动力并使其实现效用最大化的制度安排和对策。  关键词创意农业;动力资源;动力效用;制度与对策  中图分类号 S-01文献标
近年来,腐败犯罪依然居高不下。其中,贪污罪是我国腐败现象的重要表现之一,成为司法机关所重点打击的职务犯罪。随着社会形势复杂多变、犯罪手段日益多样,导致司法实践中对贪
也许读者并不熟悉安·兰德,但我想大部分人部听过这样一句话,“不能把这个世界,拱手让给我们所鄙视的人”。而此句正是出自安·兰德1943年的成名作《源泉》,咄咄逼人又莫
介绍了测定水中痕量邻氯酚和对氯酚的气相色谱法,采用XAD—7树酯富集、PEG—20M柱分离后,FID检测。邻氯酚和对氯酚的最低检出溶度分别为4.8ppb和5.1ppb。5升ppt级浓度的水样,
应用层组播技术由于依靠终端主机转发组播数据,任意中间节点的退出,都将导致其下游节点中断组播数据的接收,因此构建高效的组播恢复算法是提高组播效率的重要措施之一.针对该
原子吸收法(AAS)分析样品中的重金属,前处理是关键一步,本文介绍一种简单,可行的直接测定方法,同时建立了锰、铁、钴、镍、铜的分析方法。
杂醇油是制酒过程中由蛋白质和糖类分解而成的具有强烈气味的高级醇类,其主要成份有异戊醇、异丁醇、丙醇等。它在体内分解速度较慢,所以毒性比乙醇高。酒中杂醇油的测定过去