论文部分内容阅读
随着信息技术的飞速发展,移动互联网络广泛普及,大量快速更新的数据使得现实问题复杂度随之增加。如何高效快速进行大数据分析,引起学者广泛关注。大数据研究旨在大量动态变化数据中搜寻有价值的信息,例如数据分析,数据分类,预测和描述性统计等。群智能算法是能够有效处理大数据问题的算法之一,有较强应用性。当处理大型复杂问题时,群智能算法作为启发于种群间协同合作的智能算法,能提出有效的解决策略。聚类分析技术将具有相似特征的数据聚集在同一簇类中,并将特征差异较大数据分别存于不同类别中,属于一种高效数据聚合技术。将群智能算法与聚类算法结合,可以更有效地解决高维数据分析问题,同时研究改进策略提升原算法性能,解决现实领域中的数据处理问题。本文将优化后的蜂群算法应用于密度峰值聚类算法,利用人工蜂群算法快速搜索最优解的优势,提升算法的数据聚集性能。本文的主要内容和创新如下:(1)提出一种高效普适寻优的蜂群优化算法(EUBCOA)。该算法提出了两种改进方法,首先引入搜索因子u,同时采用基于局部最优解的跟随蜂选择策略。为了实现算法搜索能力的可控性,引入搜索因子u调控算法全局搜索与局部搜索范围。在迭代前期,扩大搜寻范围,提高收敛速度增大找到全局最优解的概率;在迭代后期,采用基于局部最优解的跟随蜂选择策略,提高算法找到目标最优解的寻优速率。该算法选取10个Benchmark函数进行仿真寻优测试,实验结果表明:改进算法提高了发现目标最优值的速率,证实EUBCOA算法处理优化问题的高效性。(2)提出一种基于自适应强度调节因子的蜂群算法(CAIBC)。为提高算法的搜索精度与速率,提出新的自适应更新步长Li,在搜寻前期增大步长,扩大搜寻范围;随着蜜源迭代更新,算法在局部搜索过程中精细搜索,提高算法的精度。本文选取6个Benchmark函数测试CAIBC算法的寻优性能,实验效果及数据证实了CAIBC算法能有效改善算法的目标最优解质量。(3)提出一种基于人工蜂群的改进密度峰值聚类算法(IDPCA)。首先引入随机方向向量因子全面收集数据信息。其次利用改进蜂群算法(CAIBC)全域快速优化的特性获得聚类中心并判断数据点所属类别。为证实本文提出的IDPCA算法高效数据分析能力,选取9个数据集,并采用Silhouette和F-measure指标测试IDPCA算法的聚类性能。在此基础上将IDPCA算法应用于经济领域中,取得了较好的实验结果。