一种基于关联规则挖掘的查询扩展算法及应用研究

被引量 : 0次 | 上传用户:nullg08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今这个信息爆炸的时代,信息迷失、信息过量已成为许多人在进行查询时面对的问题。而随着互联网使用的普及,搜索引擎作为一种查询工具,已经应用的越来越广泛了。但是,目前大部分搜索引擎的技术是依赖于关键词进行检索,因此常常会返回大量无用信息,致使查询效率低下。因此,如何通过关联规则挖掘,提高扩展查询中的查全率和查准率,已经成为近年来研究的一大热点和难点。关联规则挖掘是数据挖掘中最基本、也是最重要的功能。通过关联规则挖掘发现更多的查询词,从而提高查询扩展的效率,是查询扩展的主要研究方向之一。本文首先对关联规则、关联规则挖掘及查询扩展的相关基础理论进行了梳理;然后着重对关联规则挖掘各个算法进行了深入研究,并对FP-growth算法的性质与优缺点进行了剖析;在此基础上,本文设计了一种基于关联规则挖掘的查询扩展算法,新算法对FP-growth中挖掘频繁模式的方法进行了改进,降低了时间复杂度,并设计了一个基于网页标记信息的查询扩展模型,将新发现的关键词应用到查询扩展中,该模型通过对网页关联度进行量化表示,从而对扩展得到的结果集进行筛选。本算法通过实现关联规则挖掘-扩展查询的循环,在保证了关联规则挖掘效果的基础上,提高了查询扩展算法的查准率,最后通过实验证明该算法有效。
其他文献
按照国家《安全生产法》和建设部关于安全生产管理的一系列要求,结合建筑施工安全的现状,提出了建筑施工安全管理的思路及科学的施工安全措施,对当前施工企业做好各级安全管
社区社会管理关乎党的执政地位、国家长治久安和居民的切身利益,随着自媒体时代的快速发展,自媒体拥有了越来越多的话语权。我们要充分利用自媒体网络平台,抓住时代机遇,明确
随着离子交换树脂的发展,离子交换法在废水处理中的应用越来越广泛。介绍了离子交换技术在化肥废水、含铬废水、含酚废水处理中的应用,阐述了在废水金属离子的回收过程中离子
目的建立铁必复颗粒的质量标准。方法采用薄层色谱(TLC)法对制剂中大黄、葛根、川芎和石菖蒲4味药进行定性鉴别;以高效液相色谱(HPLC)法测定葛根中葛根素的含量,色谱柱采用Lichro
<正> 创造思维,就是有创新见解和创造发明的思维。它是创造新思想、新形象、新事物的具有积极社会意义的一种思维形式。美籍华人藏英年先生在解释什么叫“创造”的时候说:“
为比较空气和纯水背景的模型效果,扫描5个(2、3、5、8和10 mm)不同光程的红茶汤近红外光谱,应用排列组合原理和偏最小二乘法(PLS)建立2种背景下单光程和多光程组合茶多酚近红
随着羌活需用量的不断增加,以及人们对野生羌活的大量采挖,使得羌活资源日渐短缺。文章根据前人的研究成果,从羌活的分类、生物学特性、化学成分、药理作用以及人工栽培等方
数字口译作为口译教学中的难点之一,需选择适合自身的训练方法,结合相关的语境词汇整体记忆,并借助适当的笔记加以辅助记忆,通过不断地实践练习,才能从根本上提高数字口译的
<正>采访权的核心,是对新闻事件核心现场和关键人物的接触、采访,是信息网络的建立和对信息源的全面掌控。采访,不是记者、编辑的专利,作家、学者、大学生甚至普通人,都可以
<正>"阿里阿德涅线团"来源于古希腊神话,常用来比喻认识、解决复杂迷茫事物的方法。如今,伴随着移动互联和传播科技的发展,纸媒面临巨大的生存压力,纷纷破解与新媒体的融合之