基于关联规则挖掘技术的文献检索研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:zhxg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文献检索是科研工作人员获取研究文献的重要途径,随着Internet的迅速发展,文献信息资源也随之爆炸,面对浩如烟海并且不断迅速增长的网络文献信息,如何在信息的海洋中方便、及时地获取到自己感兴趣的文献成了一个非常关注的问题,传统的文献搜索引擎在一定程度上满足了科研工作人员获取文献的需求。但是,面对海量的检索结果,如何准确、快捷地找出用户关心的文献,使得传统的文献搜索引擎显得力不从心,远远不能满足用户提出的文献检索需求。针对这个问题,本文提出了一种基于关联规则挖掘技术的文献检索模型,将数据挖掘技术应用到文献检索中,使文献检索结果更满足用户的检索需求。本文的研究工作及创新内容主要包括以下几个方面:  1.提出一种改进的AprioriTid算法  针对关联规则挖掘的AprioriTid算法缺点提出了一种改进的AprioriTid算法。通过实验表明,该算法有效地优化了空间复杂度和时间复杂度。  2.提出一种基于关联规则的Top-k扩展检索算法  提出一种基于关联规则的Top-k检索扩展检索算法,通过实验证明,它能更好地理解用户的检索需求,能更大程度上弥补初始检索的缺陷,使文献检索性能有较大的改善和提高。  3.提出一种基于关联规则挖掘的检索词推荐模型  我们把一篇文献看作是一次交易,关键词作为交易项,挖掘出关键词的频繁项集,生成规则库。在进行相关检索词推荐时,直接查询规则库,找出检索词的相关词或词组,生成推荐导航。通过实验,表明了该模型具有良好的推荐效果。  4.提出了一种优化整合后的PageRank排序算法  对用户检索的历史信息库进行关联规则挖掘,将用户对文献的间接评价作为影响排序的因子加入到PageRank算法中,结合用户的检索需求排序检索结果,实验表明该算法更能体现用户的检索需求,可以帮助用户在短时间内找到满意的文献信息。  5.设计了基于关联规则挖掘技术的文献检索框架,并实现了系统原型  实现了基于关联规则挖掘的文献检索原型系统,并且通过用户的反馈,表明了该原型系统对用户检索文献有很大帮助,能较好地完成用户的主观检索需求到文献的客观描述信息之间的映射。
其他文献
随着各种各样不同种类的信息越来越多的出现在互联网上,普通的搜索引擎已经很难满足用户特定的搜索需求,于是,基于主题的垂直搜索引擎应用而生,它能够针对用户不同的搜索需求在最
由于社会节奏的加快和生活压力的增加,心理压力逐渐成为影响人体身心健康与生活质量的重要因素,自动检测和衡量心理压力有利于个人及时掌握自身的压力状态并进行自我调节,避
Hash函数是一种重要的密码学原语,随着Hash函数研究的发展,对其安全性分析也不断深入。2004年美洲密码学大会上,王小云等人宣布了对于一系列Hash函数,包括MD4、MD5、HAVAL-12
科技文献是科研人员展示研究成果的主要形式之一,并能促进研究成果在学术界的交流与传播,推动科技文化向前发展。论文作者单位译文、论文标题译文和英文摘要都是科技论文中必不
据统计,企业信息系统遭受内部网络攻击的比例高达85%,究其原因:一是企业应用系统大多采用“用户ID+口令”的简单身份认证方式,二是数据以明文方式在内部网络中传输。基于PKI/CA的
随着互联网技术的不断发展和网络资源的高度共享,人们在访问共享资源的同时,存在互连双方身份认证、信息的保密性与完整性的访问控制(Access Control,AC)安全问题。传统的身份认
生产调度问题一个具有广泛应用背景和重要理论价值的组合优化问题,是许多实际生产调度过程的简化模型。它具有建模复杂性、计算复杂性、动态多约束、多目标性等特点,并已被证
互联网的飞速发展,使得人们能够更容易、更直接地通过网络获取各种形式的信息。但是网上的信息浩如烟海,增长和更新速度越来越快,而且互联网是一个开放性、动态性和异构性的全球
随着网络技术的发展和应用范围的扩大,人们越来越依赖于网络进行信息的处理。但是由于网络攻击工具和攻击手段的日趋复杂化和多样化,仅仅依靠传统的网络安全防范措施己无法满
分布式拒绝服务(Distributed Denial of Service,简称DDoS)攻击如今是Internet上的头号威胁,已经给Internet造成了极大的经济损失,严重影响了网络应用向更深、更广的方向发展。由