论文部分内容阅读
大数据时代背景下,股票市场产生的数据越来越多,传统分析方法已很难满足现代对股市板块分析的需求,如何从海量股票数据中挖掘出有用信息,并对股市板块进行分析和预测成为了一个重要的研究课题。数据挖掘作为一种新的数据技术在此环境背景下迅速发展,为开发数据信息资源做出重大贡献。聚类是一种无监督学习的数据挖掘技术,可以充分地分析数据内部特征和数据间的联系。通过形成的多个簇,挖掘出数据之间潜在的联系与特征,避免直面庞大的数据集。群体智能算法是一种演化计算技术,具有实现简单、收敛速度快、全局收敛性优等优点,已受到越来越多国内外专家和学者的关注。群体智能优化算法是人工智能的一个重要分支,与人工生命联系紧密。通过模拟自然界生物群体的各种行为,利用个体之间的信息传递和合作实现寻优的目的。果蝇优化算法(Fruit Fly Optimization Algorithm,FOA)是群体智能优化算法的一种,因其寻优精度高且设置参数少,已经广泛应用到多个领域。但是FOA仍然存在不足:FOA在处理复杂函数问题时,收敛速度减慢,且收敛精度降低。针对此问题提出一种实时学习的果蝇优化算法(A Real-Time Learning Fruit Fly Optimization Algorithm,RTLFOA)。RTLFOA通过实时的获取种群知识,在种群陷入早熟时,通过获取的种群经验引导果蝇群体进行不同尺度的变异。变异后,味道浓度较差位置处的果蝇个体进行全局搜索,提高算法的收敛速度;味道浓度较优位置处的果蝇个体进一步对局部区域进行搜索,提高收敛精度。通过比较RTLFOA与其它算法对基准函数收敛性的测试结果,证明了RTLFOA有效的提高了收敛速度和收敛精度。近邻传播聚类算法(Affinity Propagation,AP)是一种无监督学习的聚类算法,不必指定聚类数目且处理大规模数据集具有较好的聚类结果。但是AP聚类算法的偏向参数设置难度大。(1)基于群体智能优化算法的全局搜索能力,首先提出基于差异化距离的果蝇优化算法(Fruit Fly Optimization Algorithm based on Differential Distance,FOADD)。FOADD算法使距离原点相同距离处的果蝇同时移动,避免了无效移动,提高算法的搜索效率。(2)基于FOADD的快速搜索能力,提出基于差异化距离果蝇优化的近邻传播聚类算法(Affinity Propagation based on FOADD,AP-FOADD)。在搜索空间内对偏向参数进行寻优,并使用经典数据集进行测试,根据Silhouette有效性指标与聚类结果证明其有效性。基于AP-FOADD聚类算法,对股市板块进行分析。本文选取了112家北京上市公司,并以四项可以反映上市公司盈利能力的财务指标为研究对象,对上市公司聚类。通过聚类结果对上市公司的经营能力、发展潜力进行分析,并根据上市公司年度报告证明聚类结果的有效性,为投资者提供投资组合、规避投资风险提供理论依据。