HashMap优化及其在列存储数据库查询中的应用

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:liongliong553
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HashMap在基本字典操作中具有常数级别的平均算法时间复杂度,广泛应用于大数据的检索。Block_HashMap(BHMap)基于C++HashMap,其优化包括三方面:哈希函数选取,冲突解决和关键字匹配。优化核心在于冲突解决时,以链地址法为基础,提出了一种高效利用高速缓存的存储结构Block_List来存储冲突的数据,并且预先缓存哈希值,节省匹配时间。实验证明,在桶数目充足的情况下,BHMap会多消耗少部分内存,但在桶数目有限,数据重复率比较低的情况下,时间性能上相对C++标准模板库中的Map提升10倍以上,比unordered_map快3.5倍以上,且消耗的内存与unordered_map相差不大。在列存储数据库分组和连接查询中,关键字的分桶、解决冲突和匹配操作也都涉及到基于哈希的技术,最终把BHMap应用到列存储数据库的关键查询中。
其他文献
<正>浙江省桐乡市第二实验小学是丰子恺漫画特色学校。我们将漫画与作文教学相结合,让学生的作文有材料可写,培育出了学校作文教学的一朵奇葩。1.漫画作文,开凿了学生习作的
介绍了纳米氧化锌的应用前景及国内外的研究现状,对制备纳米氧化锌的化学沉淀法、溶胶凝胶法、微乳液法、水热合成法、化学气相法的基本原理、影响因素、产物粒径大小,操作过
跨境电子商务的快速发展迫使外贸公司转型升级,高校人才培养周期长且实践教学资源不足,造成跨境电子商务人才供需失衡。基于人才培养的社会属性及存在市场失灵的现实,需要高
果业是万荣县的主导产业,栽植面积为3.47万hm^2,占总耕地面积的50%以上,其中苹果树面积2.34万hm^2,桃、梨、杏等面积1.13万hm^2。近年来,随着人们对无公害果品生产的需求,以
当德国西门子公司卷入雅典奥运项目贿赂丑闻的数目,从2000万欧元上升到2亿欧元的时候,西门子公司CEO克劳斯&#183;柯菲德(K1aus Kleinfeld)的办公室里进驻了许多调查人员,他不可避
出线构架是变电站的重要组成部分,随着配电装置的日趋小型化,出线构架的宽度成为变电站配电装置横向尺寸的关键影响因素,本文提出一种“螺旋式”垂直出线方式,与线路直接对接,有效
受2010年秋残蝗密度高,越冬基数大,春季桃花汛水流量不稳等因素的影响,2011年东亚飞蝗在山西省南部发生严重,发生面积2.71万hm2。其中以永济市伍姓湖内涝蝗区和开张镇河泛蝗区发生
20几岁,浪漫地道的英国味,让透纳的乡村风景画成为上流社会的宠儿;30岁后,透纳便很少在公众场合抛头露面,拒绝出卖任何画作;40岁以后,除了零星的作品,公众几乎感受不到透纳还活着。  绘画和旅游是透纳的最爱,他的光影山水总让我觉得心有戚戚焉,尤爱《勇猛号战舰》。这幅画有种压倒一切的霸气。一艘威风凛凛的战舰,在眩目的金色海洋里,展开最后一次告别航程。如果你满腔愁绪,看到的就是传统大不列颠悲婉的落日;
日前,由中国调味品协会科学技术委员会主办、安琪酵母股份有限公司承办的2017年全国调味品行业科学技术交流大会暨中国调味品协会科学技术委员会换届大会在广西柳州召开。本次
报纸
纳米ZnO作为一种功能材料,有着许多优异的性能和广泛的应用。综述了纳米ZnO传统的制备方法及其特点,并进行了对比,指出了各种制备方法的特点、存在的问题,同时还介绍了近年来