一种基于MapReduce的分布式索引方法

来源 :物联网技术 | 被引量 : 1次 | 上传用户:yangyuxxxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量文本快速索引是云检索系统的一个难点,而分布式索引程序的开发难度较大。文中提出了一种基于MapReduce的分布式索引方法,通过在Map函数中执行文档的解析及索引,以及在Reduce函数中合并索引数据,以减少文档排序的工作量,提高索引效率。实验结果表明,该方法适用于海量数据的并行处理。
其他文献
“纳米”技术是当今最时尚的高科技名词,从纳米冰箱、纳米洗衣机,到纳米丝绸,再到纳米水、纳米油,甚至纳米房……及信息技术、基因工程之后,纳米技术又成为一颗新的科技明星。据调
无线传感器网络中采集的数据存在着较大的冗余与误差,影响数据的可靠性;而在温室环境监测中,对数据的准确性要求比较高。因此,为了提高多传感器采集数据的准确性,在研究了现有的几种数据融合算法以后,提出一种基于多传感器的综合数据融合算法。给出了采用格罗布斯准则消除粗大误差,并引入哈夫曼树的思想对数据进行项融合的方法。结果表明,该算法可以有效提高测量数据的准确性。
一、概述雷电灾害给人类带来过许多惨痛的教训,直到今天还在继续。现代科学技术的突飞猛进,自动化办公水平日益提高,给人们的工作、生活带来了全新感受。雷电这个早已被我们所“
随着无线充电技术的发展,电磁感应式无线充电器占据了市场的龙头。对于电场耦合式无线充电,目前在国内市场极为少见。文章针对基于电场耦合原理进行简单无线充电电路设计,采用TL494组成脉宽调制控制电路并用669、649对管和IRF740组成的功率放大电路模块组成发电端,用TPS5430降压转换器组成电路充电后级稳压模块。本系统电路的充电效率能够稳定在50%左右,且用实验结果证明了电场耦合原理进行无线充电
一直以来,各种电子词典类的广告充斥在各报纸版面,电视节目中,它们不仅用影视界名人做形象代言,还用学生和家长现身说法。
一、概述桩基础是一种常见的基础形式。其作用是将上部建筑物的荷载传递到承载力大的深土层中;或使软弱土层挤密,以提高地基土的密实度及承载力。人工挖孔灌注桩(以下简称人工挖
武汉理工大学校园卡系统已经平稳运行8年之久。为了解决校园卡在使用过程中少量校园卡出现帐户余额与卡内余额不相符的情况,校园一卡通系统对账机制采用了"以小为准"的方法,从而杜绝以卡为准或以库为准的片面处理方法。
随着众多藏文网站的开发和使用,越来越多的藏文信息在网上得以传播和交流。西藏的互联网中,藏文信息的比重和其所带来的影响也越来越大。由于历史和地缘因素,西藏文化一直是国内外学者、军事和安全机构的研究内容,从中外藏学研究的如火如荼就可见一斑。自西方国家19世纪末开始出版藏文书籍至20世纪80年代"西藏问题"国际化,国外对西藏的历史、政治、经济、宗教、文化教育以及藏文字的研究均渐成规模,但是以藏文为传输内
EDKII是目前最流行的一个高度分层和抽象化UEFI BIOS的开发架构,它针对不同平台硬件参数设置引入了新的设计概念PCD。PCD就是在计算机系统初始化过程中建立起来的一个全局平台配置数据库,它为整个平台的驱动,函数库和模块组提供了有效的信息共享和设置机制。研究了数据库建立和使用的流程和方法,同时指出该数据库平台在非源代码发布中的一些设计弊端。