论文部分内容阅读
随着IT技术的飞速发展,数据库技术的广泛应用尤其是大数据时代的到来,导致在各个应用领域会产生海量的数据。这些数据中包含了许多有用的知识,因此如何发现这些知识显得尤为重要。数据挖掘正是在这样的背景之下得到广泛重视和深入研究并取得重大进展。关联规则挖掘作为数据挖掘的主要研究方向之一,其主要研究目的是从大型数据集中找出属性间隐藏的、有趣的关系。目前挖掘关联规则的算法中,采用群体智能算法挖掘关联规则越来越受到人们的关注。拟态物理学优化算法(Artificial physics optimization, APO),是由谢丽萍和曾建潮于2010年提出的一种基于牛顿第二定律的随机搜索算法。受牛顿第二定律启发,该算法通过个体间的虚拟力作用而改变个体的速度和位置,朝着优化目标移动,最终收敛于全局最优解的周围。它原理简单、参数少、收敛速度较快并且算法程序实现简单,已被证明是一种行之有效的全局优化方法。 本文主要工作是首次构建APO算法挖掘多维关联规则模型,设计了模型中的各种方法和参数,使APO算法在挖掘关联规则是体现出了不俗的性能。该模型中个体的编码方式采用整数编码,相较与二进制编码整数编码具有个体长度更小、运行效率更高的优点。在适应度函数上本文设计了一种摒弃最小支持度阈值和最小置信度阈值并能挖掘出用户更感兴趣的适应度函数。 由于APO算法挖掘关联规则模型有易陷入“早熟”、搜索精度不够高等问题,本文还将APO算法进行了改进。在分析万有引力定律、牛顿第二定律的基础上,并结合物体位移与加速度间的关系,得出一个位移与时间的相关函数。基于该函数将APO算法的移动规则进行了改进。并通过实验验证了改进后的算法确实比原始APO算法拥有更好的性能,然后亦将改进后算法应用的挖掘关联规则上来,实验结果显示,在挖掘关联规则问题上,改进后的算法仍然在各方面保持了更高的性能。