关联规则算法在科技查新中的应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:ys13920715
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技查新工作是指通过手工检索和计算机检索等手段,运用综合分析和对比等方法,为评价科研立题、成果、专利、发明等的新颖性、先进性和实用性提供文献依据的一种信息咨询服务形式,是为管理部门和科研人员提供决策依据的情报服务。数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘技术成了商业智能的核心技术,被广泛应用到了诸多领域。本文主要把数据挖掘中的关联规则算法应用到科技查新工作中,对查新搜集到的电子文档进行关联分析,挖掘出用户真正感兴趣的规则,最终得出更加真实、科学的查新结果。论文深入了解了科技查新工作的具体流程,掌握了对文献进行综合分析的具体方法;重点研究了关联规则的挖掘算法,并将关联规则中典型的Apriori算法运用于查新分析工作中使之得以实现。主要进行了以下几方面的工作:①在众多的网络数据库中选定了CNKI网络数据库作为实验数据库搜索查新的对象。并以“数据挖掘”作为关键字查询搜索,搜集了部分相关文献并以CNKI提供的下载方式下载了文献的部分标引数据。②把搜集下载到的文献数据通过简单处理保存到Excel表中,再导入到SQL数据库中,对其进行清洗、集成、和转换,把文本数据替换成字符型数据。使数据通过预处理后整理成为可以进行数据挖掘操作的数据格式。③设计并构建了查新系统的总体结构,着重研究了查询分析子系统的各个模块功能。并将Apriori算法应用于规则挖掘模块,对数据集进行关联挖掘。根据给定的最小支持度(min_sup),在待挖掘数据库中找出所有频繁项集,根据给定的最小置信度(min_conf),由频繁项集产生强关联规则。最后,论文通过将关联算法应用于查询分析中,证明了此算法对科技查新领域中的数据分析工作具有一定的实用性。
其他文献
面向方面编程技术与传统的重构技术融合,掀起了面向方面软件重构研究的热潮。这一课题分为方面挖掘和方面重构两个步骤,方面挖掘是方面重构的先决条件,也是面向方面软件重构的关
随着Internet视频会议和视频点播等多媒体业务的应用日益广泛,传统的单播传输方式已经不再适应这一类业务的传输特性,于是组播技术成为研究热点。组播技术的出现解决了网络数
随着计算机的普及和信息技术的发展,人们需要处理的信息量飞速地增长,这样使得如何获取信息成为一个值得关注的问题。目前,大多数的搜索引擎是根据用户输入的关键字组合,返回
伴随Web2.0时代的到来,流媒体技术及其相关应用得到快速发展。流媒体内容从创作、发布、查询等各个环节都普遍受到人们关注,如何对流媒体内容进行有效管理成为一个研究热点。
嵌入式系统设计是一个快速发展的领域,目前嵌入式系统的软件大都基于不同的硬件平台,而不同平台间的软件移植比较困难。鉴于市场上的产品更新周期越来越短,必须提高嵌入式系
目前,互联网上诸多个性化服务系统的“孤岛”现状已经制约了个性化服务应有效能的发挥。而跨系统个性化服务能够以用户为中心在不同系统间重用用户的个性化信息,从而改善个性
随着世界电信技术的飞速发展,电信网络种类和业务量急剧增加,网络规模越来越大,随之的网管产品也越来越多。因为网管系统的前台系统联系着业务系统和后台网管系统,所以前台系
镜片生产过程中,需要根据镜片的规格参数对其进行分拣。目前国内企业对镜片的分拣通常采用人工完成,工人首先需要对镜片的参数进行逐个测量,然后根据测量结果对镜片进行分拣
人脸检测(Face Detection)是指在输入图象中确定所有人脸(如果存在)的位置、大小、位姿的过程。人脸检测作为人脸信息处理中的一项关键技术,近年来成为模式识别与计算机视觉
复杂网络研究正渗透到数理学科、生命学科和工程学科等众多不同的领域,对复杂网络的研究已成为网络时代科学研究的一个极其重要的挑战性课题。近年来随着计算机技术快速发展和