深度谱核学习及其理论本质与拓展研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:ayong790401
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核方法是人工智能领域中卓有成效的统计学习技术,是改善学习器解决非线性问题能力的关键方法。但近年来,随着机器学习快速发展,经典核已难满足愈加苛刻的拟合和泛化性能需求,甚至无法有效利用。已有理论和实验研究表明其核心瓶颈在于局部性限制与计算效能低下。而新兴的谱核与深度核分别从映射性质与复合架构两方面,各自尝试突破局部性和计算效能的问题,对核方法的进一步发展提供启发性思考。然而,目前业界对谱核和深度核的研究与应用仍处于初级阶段。一方面,现有谱核大都仅能打破单调性限制,仍受制于平移不变函数的平稳性约束,无法揭示特征空间中更丰富的信息流形;另一方面,现有深度核大都结构封闭、难以优化、无法扩展,未能充分利用深度网络架构带来的指数级计算效能优势;此外,考虑到两者的共性与特性,从映射和结构协同构建深度谱核学习以期改善核的局部性限制与计算效能约束,具有重要研究意义。据此,本文就深度谱核学习,主要做了如下四方面工作:1)提出通用可扩展的深度谱核学习框架:针对现有谱核表征能力不足,以及深度核形式结构封闭的问题,提出深度谱核网络。首先,推导可打破局部性限制的非平稳非单调谱核映射,以近似表征任意有界连续半正定核函数,并将其自然嵌入有向无环图结构的深度网络中;接着,对深度谱核网络的特性进行了系统性的直观分析与实验验证。2)提出优化更高效的贝叶斯随机核映射网络:针对深度谱核网络存在的优化困境,提出可依概率逃逸局部极小值点的贝叶斯随机核映射网络以改进学习过程。首先,构建基于Copula的先验后验桥以建模不确定性,并设计基于随机变分推断的贝叶斯学习范式实现高效优化;其次,对先验后验桥的工作机制及贝叶斯学习范式的有效性展开了深入探讨及实验验证。3)提出可推广至超深架构的解空间软迁移方案:针对深度谱核网络解空间波折不平坦,难适用于更深更宽网络架构的瓶颈,提出解空间软迁移方案。首先,构建修正的Concrete门控以自动刻画计算元素的单调/非单调状态,并设计基于变分贝叶斯推断和Spike and Slab先验的损失函数以动态平衡经验风险与迁移力度;进一步,通过直观分析和系统实验验证了各组件对改善解空间问题的可行性,并成功将深度谱核网络扩展到极深的110层残差连接架构。4)提出刻画深度谱核学习表征能力的理论框架:除上述学习框架及扩展方案外,还提出一个理论框架来定量刻画深度谱核网络及其变体的表征性质。首先,推导了浅层非平稳非单调谱核映射的逼近阶,结论表明其能取得理论最优的表征能力,比同架构下分段线性神经网络映射要优O(mη/d2)倍,其中m是计算元素数目,d是输入特征维度,η是Lipschitz常数;其次,进一步将该浅层结果推广到深层有向无环图网络架构,结论表明深度架构可将指数级逼近误差降低到多项式级,进而显著改善计算效能,以较少计算元素紧凑刻画复杂高级概念。基于此,我们通过深入研究表示能力更优、优化求解容易、理论基础完备的深度谱核学习,以期机器学习的新兴研究、基础理论、工程应用提供可行方案及重要借鉴。
其他文献
学位
随着我国平安城市、雪亮工程、社会综合治理体系的深入发展,目前各个城市都建设了大量的摄像头,这些摄像头所产生的海量监控视频存在着数据冗余、组织混乱等问题,而视频结构化技术可以对海量视频进行结构化组织和管理,可有效支撑当前智能监控信息化建设的需求。在视频结构化技术中,行人重识别和行人属性识别是两个重要的研究方向。当视频能够捕获到目标图像时,需要采用行人重识别通过图像特征对目标进行识别;当视频无法捕获到
学位
随着互联网的普及,来自新闻、博客、社交网络等媒体的文档爆炸增长,从中发现特定信息的需求因而日益强烈。对于大规模文本,主题模型可以自动地发现其中的关键主题,从而成为一种有效的组织、探索和理解信息的方式。近年来,神经网络的发展为主题建模提供了灵活的学习框架。因此,基于神经网络的主题模型(又称神经主题模型)引起了广泛的关注。然而,现有的神经主题模型依然面临许多挑战,如无法在主题推断过程中利用文档间关系、
学位
学位
学位
学位
近年来,IEEE 802.11 WLAN技术快速发展并广泛部署于家庭、校园、企业园区、机场等诸多场景,为用户终端设备提供高速率的无线连接。随着终端设备数量的爆炸式增长以及互联网应用的日益丰富,大多公共场所的WLAN网络呈现出用户密集的态势。在用户密集环境下,由于频谱信道资源有限,增量部署AP并不能有效提升网络容量,且用户间的信道争用更为激烈,传统的关联控制机制使得终端选择信号强度最高的AP进行接入
学位