论文部分内容阅读
随着近年来大数据和深度学习的发展,具有几十年研究历史的复杂系统科学迎来了新的研究机遇。复杂系统的研究广泛应用在生物、化学、计算机、通信、社会科学等各个领域中。由于复杂系统的特性在自然界、人类社会、人工系统中广泛存在,所以复杂系统的知识发现具有普适性以及广泛的应用场景。在这些实际系统中的模式发现及预测问题都可以归纳为复杂系统中知识发现,包括了社群发现、链路预测、节点预测、图预测等。基于以上背景,本文将复杂系统结构特征与知识发现任务相结合,旨在对复杂系统的知识发现进行全面研究。本文首先给出了复杂系统的一般模型以及知识发现任务的定义。并在这一定义的基础上,本文进行了基于非监督学习的模式发现、基于监督学习的全局分类以及局部模式预测三个方面的研究,并在论文最后讨论了复杂系统知识发现的一般性神经网络架构。1、非监督的复杂网络空间模式发现问题复杂网络往往呈现出多层的异质网络特点,多层之间又有相互作用。基于此,本文在移动通信网络上进行了模式发现研究,提出了基于谱聚类的空间模式发现算法。首先,本文提出了个体特征提取方法,并结合网络构建方法对移动通信系统这类在数据表现形式上不具备明显拓扑结构关系的系统进行复杂网络模型的构建,以便发现和保留该系统中包含的空间关联关系,为后续的知识发现奠定基础。其次,本文研究了移动通信系统的复杂性特征。移动通信系统是一个双层耦合复杂系统,既包含移动用户网络,又包含通信基站网络。依据现网数据分析表明,移动通信系统具有明显的非线性特性,具有复杂性。最后,基于谱聚类的空间模式发现算法应用于移动通信网络,并进行实验。实验结果表明,这一算法能够通过自适应地调整分簇数在不同的空间尺度上发现不同特征的移动基站社群。这一研究成果对于电信运营商对移动通信网络的前期建网部署、中期运营维护、和后期业务推广具有一定的理论指导意义。2、复杂网络全局模式分类问题针对复杂网络的模式预测问题,本文提出了基于表示学习的复杂网络分类算法。传统复杂网络领域的研究主要围绕单个复杂网络的统计特征或者动力学特征展开,而极少研究不同复杂网络整体之间的分类问题。复杂网络内往往是高维的非欧式空间,这就使得传统的机器学习分类算法无法直接应用到该问题领域。为了实现对复杂网络的整体模式预测,本文提出了基于网络表示学习的复杂网络分类方法。首先,通过网络嵌入算法将复杂网络的节点特征转换成矢量嵌入到高维向量空间,再通过主成因分析进行特征降维,将高维空间降维到二维欧式空间中形成图像。最后,算法通过卷积神经网络对图像进行训练和测试,从而实现复杂网络分类的目的。基于训练出的模型,本文也提出了基于熵的PCA优化算法。该算法通过对最后一层卷积特征进行降维,使得降维后的特征可应用于传统分类器中。该研究成果可以应用于复杂网络的社团诊断、以及复杂网络预测等应用领域。3、复杂网络局部模式预测问题与图神经网络架构针对复杂系统的局部模式预测问题,本文提出了基于特征协同的图池化算法以及空间模式检测的图神经网络架构。首先,特征协同的池化组件用以将网络中的局部模式聚合成节点。池化操作提取了网络中更抽象的特征。其次,算法结合基于多重边的赋权游走,完成了节点预测任务。实验证明多重边上的赋权游走可以在集成更多特征的同时有效降低分类器中的训练参数量。文章将该算法应用于三个引文数据集上进行实验验证,结果表明该算法的预测准确率较其他图神经网络算法均有提高。本文最后对深度神经网络架构进行了讨论,给出了空间模式检测网络的一般性架构,包括了负责节点表示的特征提取组件、负责社群发现的模式识别组件、负责网络表达的模式对齐组件、以及负责预测的分类器组件等。该架构通过对不同组件的替换可以实现不同的知识发现任务。本文的研究成果可应用于通用的复杂系统知识发现系统的构建,实现快速的工程应用。