基于压缩的海量不完整数据近似查询方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:jch26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据的爆炸式增加,不完整数据普遍存在,传统的数据修复方法对于海量数据处理代价过高,且不能彻底修复,在这些不完整的海量数据上进行满足给定需求的近似查询引起了学术界的关注.因此,提出一种基于压缩的海量不完整数据近似查询方法,该方法对属性值缺失字段进行标记,根据频繁查询条件对标记后的数据进行压缩,并建立对应索引;根据属性划分对索引文件再次压缩以节省存储空间,采用编码字典对索引压缩文件进行选择和投影操作,最终获得不完整数据的近似查询结果.实验表明,该方法能够快速定位不完整数据的压缩位置,提高了查询效率,节省了
其他文献
<正>众所周知,大学校训是广大师生所遵守的行为准则和道德规范,它所承载的是一个学校的历史和文化底蕴,是大学精神的集中体现,堪称大学的精髓和灵魂。"自强不息,厚德载物"是
对著名的Holder不等式和Minkowski不等式新出现的一种简单的证明方法给予了推广。
提出了一种鲁棒的非平坦路面车道线检测算法.给出一种简单的逆透视变换方法,该方法不依赖于摄像机参数,计算简便.基于法向车道线模型研究了车道线的线特征提取方法,结合线特
本文阐述了目前桉树人工林的发展现状及人工林存在的稳定性差、生物多样性小、养分水分消耗过度、地力衰退、病虫害以及化感等生态问题,以及人工林经营中存在的若干问题,提出
<正>胡锦涛同志在党的十七大报告中指出:"科学发展观,第一要义是发展,核心是以人为本,基本要求是全面协调可持续,根本方法是统筹兼顾。"在办公室的实际工作中,我们要注重认真
本文以广东三岭山森林公园的马尾松、尾叶桉、大叶相思人工林为研究对象,研究对比它们的碳储量和碳汇经济价值,为评价广东的3个优势造林树种的碳汇能力及为广东的造林选择提
颅内动脉瘤(CAs)是危害人类健康的常见、多发病,其发生与发展的机制目前尚不明确。以往研究认为他汀类药物可以通过抑制炎症反应而延缓CAs的发展。近年来国内外研究表明:CAs
为数据归档系统选择恰当的数据压缩算法是实现海量数据归档管理的关键,但是由于算法选择问题涉及内容复杂,全面定量评估算法对系统的影响困难等因素的存在,致使数据压缩算法
<正>2017年高考新课标全国文综卷Ⅲ政治试题(以下简称"2017年全国卷Ⅲ"),以立德树人为根本任务,坚持高考命题改革方向,体现学科核心素养培养要求。从总体上讲,整体相对稳定,
随着我国权分置改革的不断完善和证券公司信息化的不断发展,更多人将目光投向了证券市场,参与到证券投资中来,如今我国证券市场投资者的数量庞大,投资者的权益成了证券市场健