大数据环境下Lucene性能优化方法研究

来源 :南京理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:xx19890701
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高大数据环境下的数据查询分析效率,该文结合内存计算技术和批量更新技术提出一种优化倒排索引方法——内存磁盘索引(RFDirectory)。基于Lucene实现内存和磁盘相结合的倒排表管理技术。将新增数据写入缓存中,并周期性地写入磁盘索引结构中,从而提升倒排索引的写入性能。通过整合磁盘和内存的多分块倒排结构,为用户提供高效的数据查询分析结果。实验结果表明:在大数据环境下,RFDirectory方法的索引构建时间缩短为磁盘索引(FSDirectory)、内存索引(RAMDirectory)方法索引构建时间的
其他文献
可植入心脏除颤器正越来越多地用于治疗非心肌梗塞病人的室性心律失常。但以前和现在的研究有不足之处,需用随机试验确定可植入心脏除颤器与药物治疗相比是否降低有关病人的
各省(自治区、直辖市)畜牧兽医学会、各学科分会、杂志编辑部、各团体会员单位、各有关单位、各优秀论文奖获奖者:论文征集活动是第八届中国畜牧科技论坛的重要内容之一。
为了准确测量不同装药号发射药的温度,该文提出一种利用传热综合参量确定火炮发射装药温度的方法。通过分析发射装药与环境间的传热过程,导出了以传热综合参量表示的装药温度
“武隆区将在仙女山与白马山之间规划修建一座‘天下鹊桥’,实现两山的联动与协调发展。”8月13日,重庆市武隆区长卢红在市政府新闻发布会上爆出这一重磅消息。卢红透露,“天
为了提高网络入侵检测的入侵检测结果,该文设计了特征和分类器参数组合优化的网络入侵检测算法。分别分析了特征、分类器参数对入侵检测结果的影响,并建立了两者组合优化的数
为了提高2D系统的跟踪水平和响应速度,将参考信号的可预见信息引入到2D系统中,考虑由Roesser模型描述的2D离散系统的预见跟踪控制问题。采用在状态与稳态值间取差分的方式构
系统动力学(SD)素有战略与策略研究室之称,本文运用该理论和方法来建立出口加工区开发阶段的SD模型.通过该模型的计算机模拟运行.分析出口加工区开发的系统行为变化.目的在于找出主要政
黔江区地处渝东南中心和武陵山区腹地,集革命老区、少数民族聚居区、边远山区、国家扶贫开发重点区于一体。“八七”扶贫攻坚时期,黔江地区贫困群众面对“赤贫千里”的无奈现
重庆市长寿经济技术开发区是重庆市政府2001年批准设立的重庆化工园区,园区设在生态保护红线、自然保护区、水源保护区及其它环境敏感区域内。日前,记者深入长寿经开区探索保护
采用圣保罗法(Cemburaeau法)研究了孔隙率及含水率与气体渗透系数之间的关系。结果表明,混凝土气体渗透性很大程度上取决于其含水率——含水率越大,混凝土的气体渗透性越差。