基于深度学习的图像描述算法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:oishiocean
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能领域的飞速发展,图像描述任务作为实现人机交互的关键技术成为了一项重要的研究课题。该任务不仅需要对图像中的内容进行准确的识别,同时需要理解图像中各个物体之间存在的关系,是一项十分具有挑战性的任务。目前基于深度学习的编码器-解码器图像描述算法框架使得算法性能大大提升。然而,依然存在着以下不足:(1)在使用长短时记忆网络进行解码生成图像描述本文的过程中,图像特征会被压缩到一维空间中,破坏了原始图像中的空间结构。同时传统的注意力机制是通过训练得到一个权重矩阵来获得图像的重点区域进行关注,会导致网络过分注重局部信息而忽略了图像的全局信息。(2)在现有的编码器-解码器框架下,解码器选用的都是循环神经网络及其变体形式,是一种单向的序列结构模型。在生成描述语句的过程中,会导致模型只能根据已经生成的单词进行预测,无法有效的关注后向上下文信息。因此针对上述问题,本文开展了基于深度学习的图像描述算法研究。提出了一系列改进措施,本文的主要研究内容和贡献包括:(1)提出了一种基于二维隐含空间结构多注意力机制图像描述算法,来使得在解码过程中保留图像的原始空间结构,使得注意力机制可以更好的抓住图像中的重点信息。之后添加了跨通道注意力机制去补充图像的全局信息。(2)提出了基于双向语言信息的图像描述算法,通过添加一个反向解码器来获得后向上下文信息作为补充,通过注意力机制自动的输入到正向解码器。之后设计两个自适应门控制机制来减少图像特征和反向上下文信息中噪声的干扰。综上所述,本文对基于深度学习的图像描述算法进行了研究。针对现有的编码器-解码器框架的缺陷提出了一系列的改进方案,并在公开数据集MS-COCO和Flickr-30K上进行了验证,取得了良好的效果与表现。
其他文献
典型报道是对具有普遍意义的突出事物的强化报道,即在大量重要事实、人物中选择最突出、最有代表性的事例、人物的报道,1是我国新闻事业的一种重要报道方式。典型报道在固定的时期内凸显时代特色,代表时代精神。2016年2月19日,习近平总书记主持召开党的新闻舆论工作座谈会。会上,习近平总书记用48个字高度概括了党的新闻舆论工作的职责和使命,其中包括“引领导向”、“团结人民”、“鼓舞士气、成风化人”等等。每个
学位
目前,我国工业化、城市化以及农业现代化加快推进的同时,农业发展面临着十分严峻的形势,农业资源环境破坏严重,水少地缺,耕地质量下降,资源约束日益趋紧,加上农业粗放的生产方式,投入品消耗过多,资源利用率不高。近年来,因土壤污染控制不力和环境监管不力导致食品安全事件频发,部分民众对国内的食品安全环境深感忧虑。为了保证国内粮食安全以及主要农产品的有效供应,我国实施了农业“走出去”战略,鼓励和支持企业开展对
学位
以人教版九年级化学教材第八单元为例,探索初中化学大单元教学的设计。主要有六大要素,分五步进行:以素养为目标,确定引领性的学习主题;以主题为核心,设计挑战性的学生活动;以活动为背景,设计持续性的评价量表;以课时为单位,设计开放性的学习环节;以单元为前提,进行反思性的教学改进。
期刊
党的十八大以来,党中央在许多场合高度强调提升舆论引导力。面对竞争激烈的传播生态,亟需正面宣传鼓舞士气、团结人心。本文选择2013年8月19日至2019年12月31日之间的新华网正面宣传报道过的新闻文本作为研究对象,综合运用抽样调查法、话语分析法和文献资料法等方法,借助荷兰学者梵·迪克的话语理论对此展开研究。通过对新华网正面宣传的2035篇样本话语分析后,发现话语具有行动的力量,借助话语可以发挥凝神
学位
新疆是我国棉花的主产区,坐拥中国八成以上棉花产量,近年来,新疆棉花年产量达500余万吨。丝绸之路经济带沿线的印度、巴基斯坦、乌兹别克斯坦、土库曼斯坦、哈萨克斯坦、塔吉克斯坦、吉尔吉斯斯坦、土耳其等产棉国,与我国新疆及内地棉区,构成了世界最大的棉花产区—丝绸之路经济带棉区,其棉花产量全球占比约70%。在丝绸之路经济带棉区,新疆棉花产业的地位举足轻重。中国与丝绸之路经济带沿线及其他相关国家棉花贸易往来
学位
零售网点的空间集聚现象是经济地理学、城市规划、经济学等诸多学科中重要的研究方向之一,布局的合理化对城市规划、基础设施建设、资源优化配置、满足居民消费需求等都有重要影响。零售网点的数量、企业类型和商业选址决定着零售网点未来发展趋势,是连接制造业企业与消费者之间的重要纽带。本文采用POI数据作为样本数据,借助ArcGIS软件平台,通过核密度估计和平均最近邻距离分析对零售网点空间分布特征进行研究,采用因
学位
精准度量用户之间的影响力进而针对目标对象发现个性化的影响力用户在精准营销、专家发现以及舆情研究等领域有着重要作用。传统研究大多基于用户网络结构来度量用户之间的影响力,然而由于缺乏用户语义信息,这种方法并不能完全表征用户之间的影响力。另一方面,随着位置社交网络迅速普及,人们越来越多地使用相关平台分享信息,进而产生了海量的社交关系及用户行为数据,使得基于用户语义行为信息精准研究用户之间的影响力成为了可
学位
随着经济全球化的不断深入,区域之间经济发展关系亦复杂多样,传统区域经济理论需要注入新的元素以适应不断演化的经济发展关系。既有的区域经济理论,基于单一经济主体发挥辐射作用带动周边区域(城市)发展的研究范式,忽略地缘比较优势,无法形成多元经济主体交互影响的经济发展格局。对于国内而言,同样存在区域间发展关系的复杂性问题,伴随着我国改革开放的步伐,区域间经济发展关系不断加深,但我国中西部经济发展失衡的问题
学位
阿盟国家不仅是中国外贸市场多元化战略的主要市场,也是“一带一路”建设的重要区域之一。在横跨欧亚非3大洲的65个“一带一路”沿线国家中,阿盟国家占沿线国家总数的1/5。近年来,中国与阿盟国家的双边贸易快速增长,2018年中阿贸易总额为2443亿美元,比2000年增长了15倍,占中国外贸比重达到5.2%。阿盟国家积极参与“一带一路”建设,中阿双方已在基础设施、交通物流、境外产业园区、跨境电子商务和金融
学位
伴随着“数字地球”概念的提出,卫星影像应用在了越来越多的领域之中,并且发挥着十分重要的作用。卫星影像在获取、传输和利用过程中,由于各种不确定的因素,极其容易受到外界的干扰,从而导致引入噪声,降低图像质量,进而影响后续任务的进一步处理和实际应用效果。因此,需要对受到噪声污染的图像进行去噪。图像去噪历来都是被重视的领域。随着深度学习的兴起,基于深度学习的卷积神经网络图像去噪在近些年取得了丰富的成果,但
学位