基于场景的图像语义描述生成技术研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:hackrx123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述生成技术将输入图片进行一系列复杂处理,输出该图片对应的自然语言描述,属于计算机视觉领域与自然语言处理领域相交叉的领域。图像描述生成技术能够将图像信息与自然语言描述联系起来,使计算机能够理解图像信息并生成相应的自然语言描述。基于场景的图像语义描述生成模型由编码器与解码器两部分组成:编码器由卷积神经网络实现,卷积神经网络对输图像信息进行提取,去除不重要特征,保留有价值特征并将其送入到解码器中进行处理;解码器由注意力机制和循环神经网络组成,注意力机制根据提取的图像特征、前一个循环神经单元隐藏状态特征决定提取的图像特征的权重比例,循环神经网络根据注意力机制生成的特征、隐藏状态、单元状态三者生成相应自然语言描述。本论文研究内容如下:(1)在编码器方面,针对Res Net-101卷积神经网络存在的问题,采用基于深度、宽度、分辨率三个方面综合考虑的Efficient Net卷积神经网络,Efficient Net卷积神经网络不仅在图像特征处理方面的性能非常优秀,而且整个卷积神经网络参数量不大,使用Efficient Net卷积神经网络作为图像描述生成技术的编码器相对于基于Res Net-101卷积神经网络的图像描述生成技术相比较,不仅在BELU-4评价上提高了1.65个百分点,而且训练时间略微变短了。(2)在解码器方面,论述了注意力机制在实现过程中存在的过拟合问题,引入批量归一化技术进行改进,对注意力机制结构进行研究,为了提高注意力机制的性能,引入一层激活层改进注意力机制。针对LSTM循环神经网络所存在的待优化参数量大、训练时间长的问题,使用GRU循环神经网络代替LSTM循环神经网络进行解码操作,对编码器输出特征进行处理,降低整个解码器网络的参数量,加速网络模型训练,通过实验验证,使用改进注意力机制和改进循环神经网络作为图像描述生成技术的解码器,不但生成自然语言描述的性能有所提高,而且减少了解码器网络的参数量进而减少训练的时间。最后,用改进的图像描述生成模型实现了基于场景的图像描述。
其他文献
近年来,随着我国城市经济迅猛发展和交通行业的不断壮大,交通拥堵已经成为影响市民生活和城市发展的重大问题。通过卫星、手机等定位工具,时空数据的获取也越来越强。如何通过对所获得的轨迹数据进行挖掘,为居民提供快捷、有效的交通信息,从而方便出行,减缓交通拥堵,提高道路通过能力,成为研究者十分感兴趣的课题。但由于轨迹数据己远远超出了人类可直观理解的范围,且具有时序属性和空间属性等特点,传统的聚类方法在其分析
随着空间探索的不断深入,空间技术发展日新月异。发展卫星技术,使其在数据通信等领域得到广泛的应用,推动相关技术的革新,是未来空间探索的必然趋势。在应对复杂空间任务时,使用多个功能与结构较为简单的卫星代替单个具有复杂功能与结构的卫星具有更高的可行性、可靠性与灵活性。在协调多个卫星完成空间任务时,缺乏对卫星之间的协作关系的考虑将导致协作失败,甚至威胁到执行任务的卫星的安全。多卫星围捕作为典型的多卫星协作
学位
氧化物半导体薄膜晶体管(TFT)在消费级电子产品中占有的市场逐步扩大,消费者对显示设备的分辨率、刷新率的需求日益提高,使用氧化物TFT用于像素单元驱动与控制的市场潜力巨大。目前以氧化物薄膜晶体管作为显示驱动的设备造价颇高,还没有普及到普通消费者市场。ZnO材料的自然储量丰富,价格低廉,环保无毒,使用ZnO材料制备薄膜晶体管可以降低工业成本。但ZnO薄膜晶体管普遍存在不稳定现象,制约其成为工业化、市
随着科学技术和物质条件的发展,在极寒地区工作及生活的人员对于可穿戴装置的舒适度和安全性要求越来越高。为了满足这一需求,本课题研究了一种兼具定位和加热控制功能的控制装置,通过控制石墨烯加热片使其具备主动加热能力,温度信息及加热控制都可以同步在本地和远程显示及控制;本装置还可通过卫星定位技术实现对装置穿戴者的位置进行定位监测,增强极端环境下人员的安全保障,定位信息同样可以在本地和远程显示。兼具GPS/
在数字通信系统中,信道中往往存在着各种干扰和噪声,导致传输过程中信息出现错误。为了保证传输过程的可靠性,降低误码对正确信息的影响,往往会采用信道编码技术。传统的编译
学位
有机叠氮化合物是一类重要的合成子,具有良好的反应活性,能参与诸多反应。最典型的是作为三个氮的合成子,与不饱和化合物,如烯烃、炔发生环加成反应,形成1,2,3-三唑类化合物
金融时间序列的长期记忆性是现代金融热门的研究方向之一。基于分形市场理论,可以有效地刻画金融时间序列元素之间的长期依赖关系。国内债券市场作为金融市场的重要组成部分,对其进行长期记忆性研究不仅可以帮助我们理解和分析市场特征,而且能够向前预测较长时期的资产价格变化趋势,从现实出发具有重要意义。因此,本文在分形市场理论的框架下,运用分形分析方法和时间序列分析法对我国债券市场进行如下研究:运用两种分布特征检
学位