基于深度学习的表示学习算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:saood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表示学习又称表征学习(Representation learning),是利用机器学习或数据挖掘算法获取实体或者关系的向量化表达。表示学习的目标是,通过机器学习将研究对象的语义信息表示为稠密低维实值向量。机器学习和神经网络领域顶尖专家Yoshua Bengio教授对表示学习的重要性进行了阐述:“机器学习算法的成功通常取决于数据表示,这是因为不同的数据表示可以或多或少的包含和隐藏数据变化背后的可解释因素”。近年来,关于表示学习的研究和应用正在不断深入和扩展。关于表示学习的文章在CVPR,NIPS,SIGKDD,AAAI等人工智能顶级会议和IEEE Transactions on Image Processing,IEEE Transactions on Geoscience and Remote Sensing等人工智能顶级期刊上都有发表。随着大数据时代的到来和技术的不断积累,如何更好的从数据中学习更高层次和更抽象的特征表示成为了新的研究热点。深度学习是指在多层神经网络上运用各种机器学习算法解决图像,文本等各种问题的算法集合,是目前效果最好也是研究和应用最广泛的方法。本文针对如何在表示学习的过程中保持数据向量的独立性,数据空间的分布相似性以及如何利用部分标签信息优化特征表示,使其更加鲁棒和抽象的问题,在不同的应用领域如迁移学习或多任务学习中,采用基于深度稀疏自编码的表示学习方法取得了良好的分类效果。我们的方法构建了统一的共享潜在特征空间,并使不同领域的数据分布在此空间上保持一致。然而,当面对的任务是较大的图像数据集时,如何在深度学习架构中保持输入数据的固有结构且避免海量数据标签的需求是一个需要解决的问题。为此,本文利用半监督学习的方法构建基于叠加卷积稀疏自编码机的表示学习模型,取得了良好的效果,具有重要的研究和应用价值。本文对基于深度学习的表示学习算法进行了研究,并提出了几种基于深度学习的表示学习算法。主要研究工作如下:(1)提出一个迁移学习领域的表示学习算法SRICA,该算法基于深度学习的方法,通过学习数据的抽象特征表示提高迁移性能。本项研究基于如下几个出发点:首先,由于要保持特征表示子空间中向量的独立性和稀疏性,因此传统的深度学习模型难以有效的完成这个目标。其次,由于迁移学习中源领域的标签信息可知,放弃标签信息优化特征会导致不能有效缩小领域差距。针对以上问题,通过引入重构独立成分分析算法并扩展至深度架构,将原始数据向量映射到共享潜在空间中,并通过源领域标签信息编码优化特征表示,最小化KL距离缩小源域和目标域在共享潜在空间中的距离,优化特征表示,提高迁移学习分类的准确性。实验结果表明:SRICA优于其他的对比方法。(2)提出一个能够在多任务间进行模型参数共享和特征表示学习的多任务学习方法DSML。由于多任务学习中每个任务模型存在通用参数和特有参数,因此仅仅基于特征表示优化的多任务学习方法难以有效的优化通用参数。针对这一问题,利用深度稀疏自编码的算法优化模型通用参数,保证了数据表示的稀疏性,从而有效的克服过拟合问题,提高了数据表示质量。并在参数调优的过程中,使用了更为简洁的模型,有效的降低了计算复杂度,提高了算法的效率。实验结果表明:DSML在图像分类任务上优于其他对比方法。(3)提出了一个半监督学习的基于卷积方法的表示学习算法SCSAE,该算法可以保持输入数据固有结构并优化表示特征。针对有监督深度学习算法如深度卷积神经网络需要大量有标记数据,以及无监督深度学习方法如自动编码机不能有效利用标签信息的问题,SCSAE通过带白化层的深度稀疏自编码机学习特征表示,使用softmax回归模型将标签编码优化,并通过卷积的方法优化特征表示,以学习更高层次的特征表示用以数据分类等任务。最后,通过系统的实验证实SCSAE在图像分类任务上能够获得出色的效果。
其他文献
肉类食品是人类饮食的重要组成部分,肉制品安全与人们的身体健康和生命安全直接相关。近年来接连发生的肉制品安全事件使人们充分意识到建立准确、有效的肉品质量监管机制的重要性。然而,目前的检测方法仍以实验室分析为主,可用于快速、简单和现场检测肉源性成分的方法较少。针对肉制品检测的研究现状,本论文以聚合酶链式反应(PCR)、环介导等温扩增(LAMP)和重组酶聚合酶扩增(RPA)等核酸扩增技术为基础,并与荧光
随着我国社会经济的飞速发展和物质财富极大丰富,人们的物质生活水平得到了极大的提高,消费者也越来越倾向于购买高端化、个性化和品质化的产品。但传统的自动化生产线主要实现单一品种、大批量的生产,这一生产模式已远远不能满足消费者的需求。为解决需求变动所带来的生产问题,考虑到高端化、个性化和品质化产品的多品种、小批量、到达时间随机等特点,企业往往采用工作台的生产方式,安排员工各自加工,然后根据工艺要求,将加
该文针对行政规范性文件的文本纠错任务,提出了一个基于BERT(Bidirectional Encoder Representations from Transformers,一种经典的自然语言处理领域的预训练模型)的文本纠错模型,模型针对冗余、缺失、错序、错字等四类任务分别建模,分为检错和纠错两个阶段。检错阶段检查出文本是否有错、错误的位置以及错误的类型等内容,纠错阶段运用BERT掩码语言模型和混
下扬子地区在晚中生代时发生了强烈的、多阶段的成岩成矿作用,形成了大量的岩浆岩和多金属矿床。然而,下扬子地区内的两大构造单元,长江中下游成矿带和江南造山带东段,却有着明显不同的成矿特征。长江中下游成矿带燕山期岩浆作用主要产生Cu-Au-Fe矿床,而江南造山带东段却发育大量W-Mo矿床。此外,相对于与成矿密切相关的早阶段岩浆岩而言,长江中下游地区晚阶段A型花岗岩的岩石成因及构造背景研究较为薄弱,且争议
采用酶解法提取新疆伊吾县野山杏多肽,探究其对衰老模型小鼠的抗氧化作用。通过单因素实验,考察酶底物比、料液比、提取时间、p H值和酶解温度对野山杏多肽水解度的影响,结合正交试验,优化野山杏多肽提取工艺;以提取物为原料,D-半乳糖制备小鼠衰老模型,分为空白对照组,野山杏多肽低、中、高剂量组(50、75、100 mg/kg),衰老模型组以及Vc阳性对照组,连续灌胃饲养30 d,测定血清、肝组织和脑组织匀
图或者网络可以对现实世界普遍存在的实体、关系、属性进行建模,构成属性网络。随着信息技术的发展,各种网站、桌面软件、手机应用、传感器产生了大量属性网络数据,如人们熟知的社交网络数据,物联网数据等,为相关研究提供了丰富的数据资源。属性网络的模式发现被广泛用于传染病爆发预测、道路拥堵检测、网络入侵检测等领域。现有网络模式发现的研究多关注单一网络或网络结构方面,而本文将研究重点聚焦于属性依存网络,即多个存
随着环境和能源的严苛要求,电动汽车已成为当前和未来很长一段时期汽车产业发展的趋势,正加速向电动化、智能化、轻量化方向发展。与目前集中式驱动的电动汽车不同,分布式驱动电动汽车具有传动高效、结构紧凑、各轮驱动与制动力矩独立可控等特点,动力输出更加平稳高效,被认为是未来低碳社会与智慧城市的主要交通工具之一。分布式驱动电动汽车取消了差速器等传动系统的机械连接,由四个独立的轮毂电机直接驱动,这对提升汽车稳定
传统特征选择方法在进行特征选择前,特征空间中的所有特征都已存在并且其特征值是可获取的。然而,在实际应用领域的许多具体问题中,存在很多无法预先获取整个特征空间,并且其特征以流的方式存在的场景。为此,出现了面向特征流的在线特征选择方法研究。特征流是指特征数据以流的方式逐个或成组到达,且无法提前获知整个特征空间的信息。随着大数据时代数据体量和维度的剧增,传统批处理模式的特征选择方法因不具有增量处理特性,
自从实时渲染的技术面世以来,一度成为影视动画行业热议的焦点。随着计算机硬件的不断进化与软件研发的技术突破,实时渲染技术也经历了几个发展阶段,已经日趋成熟,以其为技术核心的虚幻引擎在游戏、数字艺术、工业设计、虚拟制片等领域的应用也十分广泛,一方面实时渲染技术的革新使三维动画的创作焕发了新的生机;但随着该技术的日渐普及,其昔日的优势也成了发展的瓶颈。如何应用实时渲染技术在三维动画创作中进行创新与突破,
人们身处在跨模态环境,人工智能要更好地理解人们所处的环境,则需要具备解析跨模态信息的能力。通过模态学习搭建能处理和连接跨模态信息的模型。如在内容理解领域,需要分析文本、图片、视频、语音等跨模态数据对应的不同级别特征和其他辅助描述特征等。因此跨模态媒体分析是目前人工智能研究中重要的课题之一,它为不同表现形式(模态)数据间提供了沟通的桥梁。根据跨模态数据的不同表现形式,研究者将跨模态媒体分析任务细分为