【摘 要】
:
随着近年来互联网技术的革新和不断创新,深度学习技术逐渐爆发,人们向往着能实现与机器的“交流”,希望机器能够模拟人的思考方式,做到人类能够做到的一些简单的或者重复的工作和内容,从而实现人机交互与智能。本文结合计算机视觉和自然语言处理两大领域的知识,提出解决图像自动生成描述句子的问题,即如何让机器理解图像并表达出来,这是学术界和工业界的一个尤为吸引人的跨学科研究领域。图像描述生成的任务是将一幅图像中所
论文部分内容阅读
随着近年来互联网技术的革新和不断创新,深度学习技术逐渐爆发,人们向往着能实现与机器的“交流”,希望机器能够模拟人的思考方式,做到人类能够做到的一些简单的或者重复的工作和内容,从而实现人机交互与智能。本文结合计算机视觉和自然语言处理两大领域的知识,提出解决图像自动生成描述句子的问题,即如何让机器理解图像并表达出来,这是学术界和工业界的一个尤为吸引人的跨学科研究领域。图像描述生成的任务是将一幅图像中所涵盖的内容,包括图像中的对象、图像中对象的动作及位置关系、图像中的场景等等,翻译成具有特定的语句结构和语法规则的自然语言的过程,其最终的目的是将一幅图片“翻译”成一段人类可读的文字描述。基于此,本文的工作主要有以下三个方面:首先,本文提出了一种卷积神经网络和递归神经网络的联合模型,用于处理图像描述问题。对于图像部分,使用卷积神经网络处理图像内容,提取图像的显著性特征如颜色、纹理、轮廓等等;对于文本部分,使用递归神经网络中的长短期记忆网络处理文本词语的生成,包括前后语句的连贯、上下文语义和前后文情感的协调。随后通过将两个模型串联的方式解决图像描述问题,利用第三方数据验证了该模型的表现。其次,本文提出了一种基于注意力机制的改进算法,通过将模仿人眼“看”事物的方法转化成概率注意公式加入到模型中,用于辅助生成描述重点词汇和上下文的衔接。通过比较该改进算法与之前提出的方法,明确了该方案在图像描述任务上的表现更胜于未添加注意机制之前,并通过对比实验证明了该方法的优越性。最后,由于本文研究的是图像描述,自然而然地要将其延伸到中文领域进行研究,本文对于中文自然语言处理问题之中的分词技术也进行了分析,并且提出了一种基于最大熵模型的改进字典分词算法对中文文本分词,并基于Glove算法提出了改进的Glove算法适用于中文词向量化方法,进而利用特有的中文图像描述数据集验证该算法的效果,实现了中文图像描述生成。
其他文献
无线网络技术凭借着诸多优势,比如低成本、移动方便等,逐渐应用到工业系统中。同时也带来一些问题,例如,容易在数据传输的过程中发生丢包、时延等问题,会降低系统的性能甚至使其不稳定,故在无线网络环境下对系统进行控制具有现实意义。同时由于工业过程比较复杂,通常难以建立模型或者所建模型不准确,而在工业上现有的控制方法都建立在系统模型已知的前提,其具有很大的局限性。本文研究在网络环境下在模型未知的情况下对混合
能量路由器作为未来能源系统中的核心设备,不仅为分布电源、分布储能和负载提供了即插即用的接口,还担任了区域间能量分配的角色;而固态变压器作为能量路由器中重要的组成部分一直是研究的热点,但固态变压器存在耐压不高,整体效率偏低,控制复杂等问题。基于此本文探讨了目前固态变压器研究中应用广泛的级联拓扑及其相应的控制和装置的启动方法。本文分析了模块化级联型固态变压器的拓扑结构,对其中级联H桥(CHB)级、高频
先进高强钢的应用能够在保证车身强度的同时实现汽车轻量化,并达到节能、减排的目的。第三代先进高强钢Q&P钢,即淬火延性钢,因同时具备强度高和延伸率好等优点,特别适用于形状比较复杂的汽车零件,在汽车车身上的应用前景广阔。热冲压成形用钢凭借其良好的成形性能和较高的强塑积,广泛应用于车身安全结构件。材料的焊接性能是衡量其是否能够应用于汽车生产的关键因素之一,而电阻点焊是汽车车身构件连接的最主要方式,因此研
钛及钛合金由于具有优良的生物相容性和耐腐蚀性等特点,被广泛应用于生物医用领域,如修复骨板、牙种植体及血管支架等。其中,应用于人体的钛合金主要为高强度的Ti-6Al-4V,在人体关节植入、牙科替换等受力较大的部位应用较多,虽然具有较高的强度,但其长期在体液中会有Al、V等元素离子溶出,对人体的神经系统及新陈代谢产生不利影响。而纯钛具有无毒、良好生物相容性等优点。因此,以细晶强化来提高纯钛强度受到越来
Fe-Ga合金(Galfenol)兼具有低饱和磁场、高抗拉强度、高磁导率及良好的温度特性等优点,是迄今已知唯一兼具优良机械性能和磁致伸缩性能且环境适应性强,经济适用的巨磁致伸缩材料。Fe-Ga合金的磁致伸缩性能呈显著的各向异性,单晶方向的磁致伸缩系数达到400 ppm。采用轧制与二次再结晶退火强化η织构在有效提高Fe-Ga合金磁致伸缩性能的同时,可有效降低高频条件下的严重涡流损耗。目前国
随着“中国制造2025”战略思想的提出,实行生产的智能控制与优化协同,着力开发与应用智能化技术,实现信息深度感知、智慧优化决策和精准协调控制成为当前我国钢铁行业发展的关键性问题。对此,本文以某3500mm中厚板轧机轧制过程中由于各种不对称因素造成的轧件侧弯现象为研究对象,以实现生产过程中轧件侧弯的智能控制为目的,开发设计出一套基于机器视觉的轧件侧弯检测系统,并建立轧件侧弯前馈控制和反馈控制相结合的
随着科技水平的进步,工业应用对材料的性能要求越来越苛刻,现有的材料已经部分不能满足零部件的实际服役要求。在实际应用中,某些零件的不同部位实际的服役情况是不同的,某些零部件并非工作在恒定温度下,而是同一零件不同部位所承受的温度和使用要求并不相同,因此梯度功能材料就应运而生。其中不锈钢-高温合金功能梯度材料可作为耐高温以及大温差反复热冲击的材料,在石油化工、核反应堆中各种耐酸阀门和高温高压阀门以及发动
随着全球工业化的不断发展,人们在享受着工业化发展带来的便利的同时,不得不面对其带来的环境污染问题,尤其是空气污染和水污染问题更是给人们带来了很多的健康问题,所以解决环境污染问题迫在眉睫。TiO2半导体材料因其可以在光催化下无差别的降解各种污染物而引起科研工作者的广泛关注。但是TiO2半导体材料也存在着两个无法忽略的问题,首先TiO2半导体材料的禁带宽度非常宽,大约为3.2 eV;其次TiO2半导体
基于良好的力学性能和生物相容性,金属基可降解材料成为生物医用材料领域的研究热点。此前的研究主要集中在镁和铁基合金上。然而,降解速率过快和过慢的问题分别制约了这两种合金在临床上的应用。近年,锌及其合金因具有更适宜的降解速率和生物相容性而受到广泛关注。目前,探索新的合金种类及加工工艺来进一步提高锌合金的力学性能并有效控制其降解速率已成为重要的研究方向。本文以迄今广泛研究的Zn-Mg二元合金为基,探索了
随着现代航空工业的发展,近空间飞行器控制系统的性能要求不断提高,显然,传统的线性控制理论已不能满足近空间飞行器在各种实际工作环境中对控制性能的要求,因此,非线性控制理论方法就更加受到人们的重视。一方面,由于近空间飞行器的工作范围很大,工作环境复杂,所以近空间飞行器具有飞行包络大,工作模式多,工作状态多的特点,且近空间飞行器还需要有良好机动性能,负载性能等,因此,近空间飞行器飞控系统具有高度的非线性