论文部分内容阅读
大数据时代的降临,使得数据成为一种珍贵的资源。数据中蕴藏着许多有用信息,例如疾病传播规律、人类行为倾向、市场营销等等。数据预测作为数据挖掘的核心应用之一,是开发利用这种资源的重要手段。数据特征常常被用来描述数据性质和关系,好的数据特征意味着好的预测结果。因此,针对具有非线性、不平稳和高度不确定性等特点的数据,如何提取得到更好的数据特征成为一项十分重要且有意义的工作。当前存在的特征提取和预测模型大都是基于浅层学习开发的,这些模型转化的数据特征都是基于统计学方法计算得到的,这样得到的特征不能准确、有效的表达样本数据之间的内部关系。深度学习理论的发展离不开大脑视觉系统的仿生学成果,它采用了深层次的架构模型,可以对数据样本进行逐层的抽象转化,得到深层次的数据特征。由于在数据特征的提取和转化上具有强大的优势,它已经被广泛应用到图像识别、语音处理、自然语言表征等领域。因此,本论文从深度学习在数据特征的提取和预测方面展开研究,所做的具体工作如下:(1)对时间序列数据进行预测。结合递归神经网络和受限玻尔兹曼机网络对时序数据处理的优势,构建了一个基于递归神经网络-受限玻尔兹曼机深层结构的深度学习预测模型,模型的深层结构可以优化门诊量数据的原始特征,通过对比仿真实验证明了预测模型的有效性。(2)复杂网络的社团划分算法。基于网络模块度的社团检测算法中提取到的数据特征未包含非线性关系的问题,为解决该问题,建立了一个基于深度自编码网络的深度模型,该模型可以通过逐层学习转化得到蕴含网络拓扑结构中的非线性关系的数据特征。在人造网络和真实网络上的仿真实验说明了该模型提取转化的数据特征可以有效的提高社团检测效果。(3)复杂网络的社团演化预测。动态社团演化包含了静态网络的社团拓扑结构信息和社团演化的时间序列信息,所以本文从社团内部和外部的角度综合考虑网络演化过程中的社团的变化,选择并优化了社团演化中社团合并的影响因素,然后构建了一个基于深度信念网络的社团合并预测模型,该预测模型可以在通过对所提取的影响因素进行学习得到具有代表能力的数据特征,以此提高预测的精度。