论文部分内容阅读
关联规则挖掘算法是数据挖掘中最核心部分之一,传统的挖掘算法已经难于适用于当前数据量的挖掘。人们都在尝试使用新的智能算法,如遗传算法、粒子群算法、鱼群算法等来挖掘关联规则。本文结合粒子群和模拟退火两种算法的优点,将两种算法混合在一起,使用改进的混合模拟退火粒子群算法。由于粒子群算法在寻找最优解时很容易陷入局部最优解的情况,使得在解决实际问题时,往往求出的解是非全局最优解,由于模拟退火算法在执行过程中能够以一定的概率接受差解,所以它能够很好的避免算法陷入局部最优解。那么本文将模拟退火算法和粒子群算法相结合后,在基本粒子群算法中引入模拟退火算法的Metropolis准则。算法实现粒子在更新自身最好位置、群体最好位置及自身当前位置时能够有一定概率接受差解,这样能很好避免粒子陷入局部最优位置。本文将改进混合算法运用到关联规则挖掘中,采用实数编码的方式来设定粒子,并且选择了合适的评价函数。最后通过挖掘高校应届研究生就业情况的关联规则为实际例子,并和遗传模拟退火算法(GA-SA)、标准PSO算法进行了对比,证明了该混合算法在关联规则挖掘中的可行性及优越性。最后针对挖掘出的关联规则,对以后的研究生在就业方面提出了一些建议。本文的主要研究内容如下:(1)介绍了数据挖掘及关联规则挖掘概念,并分析了基本挖掘算法的优缺点,详细描述了粒子群算法和模拟退火算法的实现过程及它们各自的优缺点。(2)描述本文混合模拟退火粒子群算法实现过程。在基本粒子群算法中,在更新粒子的自身最好位置和群体最好位置时,引入了Metropolis准则,并且将原先的群体最好位置用两个量来记录;接着在更新每个粒子的位置和速度时,再次引入Metropolis准则,两处使用Metropolis准则可以从单个粒子和整个群体两个角度出发,防止算法陷入局部最优解。将本文改进的混合算法与其他文献中的混合算法、标准PSO算法进行函数测试对比。(3)将改进混合模拟退火粒子群算法运用到关联规则挖掘中,以研究生就业的关联规则挖掘为实际例子。对比GA-SA算法、标准PSO算法在相同条件下的挖掘情况,证明了该改进混合算法在关联规则挖掘中的可行性。