深度生成模型学习算法研究与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:qinlinjie8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何让机器从大量感知数据中抽取高层的数据表示是人工智能领域的核心问题,理论和生物学言论强烈建议,构建这样的智能系统需要深度模型,而传统深度模型的训练不仅容易陷入局部最优,而且需要大量的标注数据,以深度信度网(Deep Belief Networks,DBN)为代表的深度生成模型以及相应高效训练算法的提出为解决这一问题带来了希望。本文旨在研究深度生成模型的理论和结构,在研究其贪心训练算法的基础上,对基本模块受限玻尔兹曼机(RestrictedBoltzmann Machines,RBM)的训练算法做进一步的改良,并根据语义哈希的思想将深度生成模型应用到文档建模领域,为文本应用提供更优的解决方案。  本文首先介绍了深度生成模型以及文档建模方面的研究背景、研究意义和国内外研究成果,在此基础上,对深度生成模型的结构和训练算法、文档建模的相关理论和技术进行了全面的研究与分析,总结了目前相关领域的研究困难与不足。其次,本文深入研究深度生成模型训练的基本模块RBM,在研究其定义和结构的基础上,提出了一种基于退火转换(Tempered Transition)的训练算法,借助于退火转换处理多峰分布的强大能力,这种RBM训练算法抽取的样本具有无偏性和多样性的优点,将其与基于吉布斯抽样和基于并行退火的现存训练算法进行对比,实验结果表明,基于退火转换的RBM训练算法优于现存的训练算法,不仅获得最好的混杂率,还有效提高了训练效果。接下来,本文设计了一个文档建模的算法框架,根据语义哈希思想将深度生成模型应用到文档建模,算法框架包括深度生成模型的训练和使用两个部分,模型的训练包括对词频建模、贪心预训练和参数调优三个步骤,模型的使用包括生成文档二元地址码、计算地址码海明距离两个步骤,实验结果显示,语义哈希文档建模方法的检索效率最高,并且可以获得和传统方法相似的检索效果。最后,总结了本文在深度生成模型和文档建模方面的主要研究成果和创新点,并展望了未来的研究工作。  总之,本文的研究成果对深度生成模型、RBM的训练和文档检索应用具有重要的参考价值,可以有效提高RBM训练的效果和文档检索的性能。  
其他文献
随着计算机网络的发展与网络应用的迅速普及,以及网络信息安全技术的不断成熟,使各专业实验室对网络用户开放成为可能,并且这种需求会越来越强烈.该文通过对SSL协议相关技术
该文主要讨论了小波变换在图像分割中的应用.包括:小波应用于传统的灰度直方图区域分割;小波应用于边缘检测;小波与马尔可夫模型相结合应用于纹理分割.小波应用于传统的灰度
该文结合中德软件集成技术联合实验室SIGSIT(SIno-German joint laboratory of Software Integration Technologies)的启动项目FLAME2008(FLexible semAntic service Managem
未来的计算环境应该是一个分布、开放、移动的计算环境.针对未来计算方式的演变和发展以及当前Agent系统对Agent服务环境方面研究的不足,作者和李旭辉博士提出了一个基于Agen
数据获取(Data Acquisition,简称DAQ)系统是高能物理实验的重要组成部分。随着高能物理实验复杂度的提高,数据获取系统的性能需求也随之提升。在万兆级带宽下迅速完成事例数据的
该文阐明了嵌入式系统的硬件与软件特征.重点剖析了嵌入式操作系统Windows CE的体系结构,包括Windows CE的内核、文件系统、通信系统以及图形窗口和事件子系统(GWES)等.由于W
中国土地估价业务起步于80年代末期,90年代中期才得以发展.在土地估价研究中,中国充分借鉴了发达国家一些成功的经验和方法,研究出符合中国国情的评估方法,建立了较为完善的
多agent系统的组织方式问题:该文提出了群体agent的逻辑"域"结构,适应开放的多agent环境动态变化的要求,构造了一种新的基于域的动态自组织模式.协调过程限定在不同粒度的域
该文首先介绍了answer set planning的理论基础和研究现状,以及动作理论界对衍生问题的研究情况;然后定义了一个基于高级动作语言C、通过用因果关系描述的领域约束确定动作的
针对传统面向对象、面向过程软件开发方法过程中计算机专家和领域专家知识没有分离导致不能开发出高水平的软件的问题,进一步研究了面向规范的软件开发方法.在基于面向规范的