关联规则算法研究以及在科学数据挖掘中的应用

被引量 : 0次 | 上传用户:kaixin314159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘就是从海量数据中提取知识,又被称为数据库中的知识发现。它是一个跨学科的新兴研究领域。关联规则分析是其中的一个重要分支,它基于数据项的同时出现特征从数据库中发现项或属性间事先未知且隐藏的有趣联系。从大型数据库中挖掘关联规则的问题已经成为近年来数据挖掘研究领域中的一个热点。本文首先介绍了数据挖掘的基本概念、存在问题及发展方向。其次介绍了关联规则分析的基本概念、分类及一些常见的算法思想,并着重讨论了一些经典的关联规则算法。为解决频繁模式挖掘问题,本文通过分析FP-growth算法中包含的冗余操作,引入数据结构FP参考树/表,改变FP-growth算法中条件模式基的存储和生成方式,提出了新的FPRSG算法,高效地解决了频繁模式挖掘问题。理论分析与实验结果表明,FPRSG算法优于经典的FP-growth算法。数据挖掘与科学研究的结合是近来新兴的研究课题,在很多方面都有值得研究的地方。大规模科学数据具有数据量大、特征复杂的特点,在对其进行处理时,往往使得理解、分析这些科学数据,并从中获取知识变得十分困难,由此科学数据挖掘势在必行。为了提高科学数据存储和传输的效率,本文提出一种基于遗传算法的科学数据压缩率预测方法。为检验本方法对给定的科学数据的效果,关联规则被用于科学数据压缩率预测的训练结果评估。评估结果对于领域研究人员也有一定的参考价值。在本文的最后对全文内容进行总结,并展望了数据挖掘进一步研究和应用的方向。
其他文献
电子政务是一个城市提高核心竞争力的要件之一。在大数据背景下对西部城市电子政务发展在存在的问题进行阐述,并就如何加快西部城市电子政务的发展提出一些针对性建议。
信托观念源自英、美法系国家,信托除了可协助个人管理、处分及运用财产之外,更可用以从事公益活动,在运作上颇具弹性,故为近代大多数国家所普遍采用。台湾随信托法、信托业法
随着我国国有企业改革的步伐的逐步加快,资本市场不断出现新的问题,如:证券市场频繁发生大股东侵占挪用上市公司资金、大股东欺诈中小投资者、上市公司财务信息披露违规误导
可重构模块机器人系统是由一组具有标准连接接口的连杆模块和关节模块组成,这些连杆模块和关节模块能够被快速的装配成不同运动学参数和动力学行为的机器人构形。和传统的固
春秋列国争霸,战国七雄逐鹿中原,而秦国不断发展壮大,先后灭掉六国,最后终于完成了统一大业,建立了中国历史上第一个统一的中央集权的封建王朝,究其原因,秦国灵活务实的外交
本文引入诞生于生物科学领域的共生理论,吸收和发展国内外供应链联盟相关领域的最新研究成果,从对供应链联盟的基本认识和发展方向入手,分析了供应链联盟中的共生现象以及形
客户对于企业的满意程度将直接关系到企业的生存和发展。认真对待企业的客户满意度,并能够完成对这一问题的有效管理,还能够促进企业资源的最佳整合。尤其是在企业竞争日趋激
不可再生资源是社会经济发展的重要物质基础,不可再生资源可持续利用是实现经济可持续发展的必然要求。因此,不可再生资源可持续利用的经济学分析具有重要的理论意义和实践意
慢性前列腺炎是危害青年身心健康的常见疾病,发病率呈上升趋势。临床观察近年来发病年龄趋于下降,以高中生和大学生常见。主要因为现代青年人脑力劳动多于体力劳动,长期处于紧张
基于本单位在专业技术人员管理与激励方面存在的问题,通过开展多通道专业职务设计,开辟专业技术人员专业职务发展通道,推动企业内部人才梯队建设,实现人力资本不断增值,促进