n-Gram/2L索引结构的存储与时间优化算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ycw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对分词检索算法n-Gram/2L的索引结构作了改进,在第二级倒排表中加入对文章标识的索引,提出一种基于Zigzag的分词检索算法n-Gram/2LZ(n-Gram/2L on Zigzag join)。在对数据量较大的文章进行检索和索引时,该算法在保留原有算法特性的基础上进一步减少了索引冗余,降低了索引的存储量,同时对查询算法的优化降低了查询时的系统开销,并且减少索引中记录访问次数,提高了查询效率。
其他文献
目的:分析早期乳腺癌前哨淋巴结活组织检查术对预测腋窝淋巴结状态的临床价值。方法选取2012年10月—2013年10月本院收治的68例腋窝淋巴结阴性的原发性早期乳腺癌患者,均为女性
妊娠期间因冲任气血不调或不和,或胎元不固以致妊娠期间有腰酸腹痛,或下腹坠胀或伴有阴道少量出血等主要临床表现的妊娠疾病,常为堕胎小产之先兆,相当于现代医学之先兆流产。本病
通过对现有的基于IPv6亲密伙伴的安全通信方案进行了研究和分析,结合移动IPv6网络中移动节点的特性,提出了一种基于移动节点预测驻留时间构造上层节点的双层管理机制。通过在移
【正】 当今的世界被称之为“四化”世界,即经济国际一体化、科技世界网络化、产业结构跨国化、金融流通洲际化。企业要在“四化”世界立于不败之地,企业经营者——企业家就
提出了基于蕴涵算子族Lλ0λG的模糊推理的思想,这将有助于提高推理结果的可靠性。针对蕴涵算子族Lλ0λG给出了模糊推理的FMP模型及FMT模型的反向α-三I支持算法。
本文根据薄板稳定理论,导出连续矩形板稳定问题的三弯矩方程,然后用“差分法”(实为z变换)解此方程,最后给出求临界荷载的方程。
研究了支持向量机多类算法DAGSVM(Direct Acyclic Graph SVM)的速度优势,提出了结合DAGSVM和简化支持向量技术的一种快速支持向量机多类分类方法。该方法一方面减少了一次分类
RBAC(Role Based Access Control)是一种被广泛认可的信息系统访问安全规范管理模型,但RBAC访问安全规范模型如何与组织系统的业务过程规范模型融合,从而更有效地服务于可信业
目的观察综合气道护理管理方案在气管切开术后康复患者中的应用效果。方法研究时段自2016年9月~2018年9月,选定本院收治的气管切开术后康复患者68例,以随机化分组原则为主,分
湿地具有重要的保护价值,传统的湿地管理和决策方法面临挑战。要提高湿地的保护和管理水平,不仅需要先进的管理模式,更需要先进的技术手段。建立高效实用的扎龙湿地监测与决策支持系统,将湿地管理和决策过程实时化和科学化,以加强对湿地的监控和管理,成为亟待解决的问题。以扎龙湿地为研究对象,以RS、GIS、GPS和Web技术为技术支撑,开展湿地监测与决策支持系统研究与开发,为扎龙湿地的保护提供及时、有效的辅助决