论文部分内容阅读
委员会机器是由一个门网络和多个专家神经网络组成的模块化集成系统。门网络将任务划分成多个子任务,专家神经网络各自承担全局任务中的一项子任务,最后将各子任务的解进行组合,实现对全局任务的求解。大量文献已经证实,整个系统的泛化性能可通过联合多个简单专家网络并组成委员会机器的方法得以提高。但在现实应用中,人们常因问题太复杂而无法对任务进行准确分解;由于现实问题的复杂程度千差万别,导致对委员会机器中专家网络“简单”程度把握的困难。因此,如何自动地更准确划分任务并为各子任务分配合适的专家网络,成为发挥委员会机器潜在性能的关键。针对这些问题,本文着重做了以下工作:1.传统的委员会机器使用模糊C均值算法(FCM)对样本集进行聚类,以实现分解任务的目的。针对FCM算法只能对类别规模相似的数据集进行聚类的情况,提出了含影响力因子的模糊C均值算法(FCMef)。为每个类别都赋予一个影响力因子,使各类别的规模可以通过影响力因子得以控制。利用影响力因子指数来调节各类别的影响力对比度,使FCM算法和FCMef算法统一到一个通用的模型中。2.提出了自适应的含影响力因子的模糊C均值算法(AFCMef)及相对更稳定的两阶段AFCMef算法。在FCMef算法中:1)影响力因子取值较大时更能体现类别间的规模差异;2)如果影响力因子过大,则会出现类别消失的迹象。AFCMef算法利用上述两个现象,启发式地寻找最优影响力因子指数。3.针对传统的委员会机器中采用单层线性网络作为专家网络时“简单”程度过于单一的情况,对单层非线性专家网络作了推广,并最终推广到了采用多层BP网络作为专家网络的更一般情况。4.概括了神经网络(专家网络)训练的一般过程,总结了训练过程中对训练结果的影响因素,从训练策略的角度提出了积极训练策略和消极训练策略。5.分别对降水、南中国海台风移动路径和恶意代码行为特征三类实际数据进行实验,肯定了委员会机器及本文对它所做的一些改进的作用。特别地,在利用降水数据对改进的委员会机器模型进行参数建模,得到三个关键参数在模型中取得较好预测效果时取值的相互关系规律,为同类问题的参数取值提供参考。