深度生成模型学习算法研究与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：qinlinjie8

【摘要】

：

如何让机器从大量感知数据中抽取高层的数据表示是人工智能领域的核心问题，理论和生物学言论强烈建议，构建这样的智能系统需要深度模型，而传统深度模型的训练不仅容易陷入局部最

【作者】

：

李慧

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2014年期

【关键词】

：

深度生成模型机器学习算法退火转换文档建模语义哈希玻尔兹曼机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

如何让机器从大量感知数据中抽取高层的数据表示是人工智能领域的核心问题，理论和生物学言论强烈建议，构建这样的智能系统需要深度模型，而传统深度模型的训练不仅容易陷入局部最优，而且需要大量的标注数据，以深度信度网(Deep Belief Networks，DBN)为代表的深度生成模型以及相应高效训练算法的提出为解决这一问题带来了希望。本文旨在研究深度生成模型的理论和结构，在研究其贪心训练算法的基础上，对基本模块受限玻尔兹曼机(RestrictedBoltzmann Machines，RBM)的训练算法做进一步的改良，并根据语义哈希的思想将深度生成模型应用到文档建模领域，为文本应用提供更优的解决方案。　　本文首先介绍了深度生成模型以及文档建模方面的研究背景、研究意义和国内外研究成果，在此基础上，对深度生成模型的结构和训练算法、文档建模的相关理论和技术进行了全面的研究与分析，总结了目前相关领域的研究困难与不足。其次，本文深入研究深度生成模型训练的基本模块RBM，在研究其定义和结构的基础上，提出了一种基于退火转换(Tempered Transition)的训练算法，借助于退火转换处理多峰分布的强大能力，这种RBM训练算法抽取的样本具有无偏性和多样性的优点，将其与基于吉布斯抽样和基于并行退火的现存训练算法进行对比，实验结果表明，基于退火转换的RBM训练算法优于现存的训练算法，不仅获得最好的混杂率，还有效提高了训练效果。接下来，本文设计了一个文档建模的算法框架，根据语义哈希思想将深度生成模型应用到文档建模，算法框架包括深度生成模型的训练和使用两个部分，模型的训练包括对词频建模、贪心预训练和参数调优三个步骤，模型的使用包括生成文档二元地址码、计算地址码海明距离两个步骤，实验结果显示，语义哈希文档建模方法的检索效率最高，并且可以获得和传统方法相似的检索效果。最后，总结了本文在深度生成模型和文档建模方面的主要研究成果和创新点，并展望了未来的研究工作。　　总之，本文的研究成果对深度生成模型、RBM的训练和文档检索应用具有重要的参考价值，可以有效提高RBM训练的效果和文档检索的性能。　　

其他文献

开放实验室的安全传输系统设计与实现

随着计算机网络的发展与网络应用的迅速普及,以及网络信息安全技术的不断成熟,使各专业实验室对网络用户开放成为可能,并且这种需求会越来越强烈.该文通过对SSL协议相关技术

学位

网络实验室安全数据传输SSL协议安全代理OPENSSL

基于小波变换的图像分割研究

该文主要讨论了小波变换在图像分割中的应用.包括:小波应用于传统的灰度直方图区域分割;小波应用于边缘检测;小波与马尔可夫模型相结合应用于纹理分割.小波应用于传统的灰度

学位

图像分割小波变换多尺度分析隐马尔可夫模型边缘检测

一种基于语义Web服务的信息网格服务社区的设计与实现

该文结合中德软件集成技术联合实验室SIGSIT(SIno-German joint laboratory of Software Integration Technologies)的启动项目FLAME2008(FLexible semAntic service Managem

学位

虚拟服务社区信息网格语义web服务分布资源管理

基于Agent的软件服务框架模型中服务的发现和协调策略研究

未来的计算环境应该是一个分布、开放、移动的计算环境.针对未来计算方式的演变和发展以及当前Agent系统对Agent服务环境方面研究的不足,作者和李旭辉博士提出了一个基于Agen

学位

Agent移动Agent计算环境软件服务

基于多核处理器的数据获取研究

数据获取（Data Acquisition，简称DAQ）系统是高能物理实验的重要组成部分。随着高能物理实验复杂度的提高，数据获取系统的性能需求也随之提升。在万兆级带宽下迅速完成事例数据的

学位

高能物理实验数据获取系统多核处理器并行计算无损数据流压缩

嵌入式人像考勤系统

该文阐明了嵌入式系统的硬件与软件特征.重点剖析了嵌入式操作系统Windows CE的体系结构,包括Windows CE的内核、文件系统、通信系统以及图形窗口和事件子系统(GWES)等.由于W

学位

嵌入式系统人脸识别考勤系统考勤管理自动化

基于GIS的地价评估系统研究与开发

中国土地估价业务起步于80年代末期,90年代中期才得以发展.在土地估价研究中,中国充分借鉴了发达国家一些成功的经验和方法,研究出符合中国国情的评估方法,建立了较为完善的

学位

地理信息系统土地定级空间分析地图库

关系驱动的多agent域内协调模型研究

多agent系统的组织方式问题:该文提出了群体agent的逻辑"域"结构,适应开放的多agent环境动态变化的要求,构造了一种新的基于域的动态自组织模式.协调过程限定在不同粒度的域

学位

协调多agent系统人工智能分布式处理

一种用ASP逻辑编程处理规划动作的非直接效果的方法

该文首先介绍了answer set planning的理论基础和研究现状,以及动作理论界对衍生问题的研究情况;然后定义了一个基于高级动作语言C、通过用因果关系描述的领域约束确定动作的

学位

衍生问题非直接效果ASP逻辑编程answer set解答器answer set规划

面向规范的数学网络计算环境

针对传统面向对象、面向过程软件开发方法过程中计算机专家和领域专家知识没有分离导致不能开发出高水平的软件的问题,进一步研究了面向规范的软件开发方法.在基于面向规范的

学位

面向规范程序设计MICE网络计算MATHML分布式计算

深度生成模型学习算法研究与应用

与本文相关的学术论文