公共环境的图像描述研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:anruixiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让计算机能够感知和理解人类世界,并能用自然语言与之交流是人工智能领域的一个长期目标。深度学习的发展让这一目标成为可能,图像描述任务作为自然语言处理和计算机视觉领域的交叉课题,近年来引起了国内外学者的广泛关注。目前公共环境的各类视频监控系统主要采用目标检测与识别技术,存在数据量大、响应时间长且传输困难等问题,相较于图像,文本概括性强,能够以简练的形式传递信息,因此,研究面向公共环境的图像描述具有十分重要的现实意义。本文对公共环境的文本生成进行研究,具体的工作包括对公共环境的图像描述模型改进、面向公共环境的密集描述模型设计、基于公共环境的图像描述界面制作。主要的研究成果总结如下:1.针对图像描述的编码器-解码器结构在编码端特征提取不充分与解码端丢失上下文信息的问题,提出了一种基于Res Net与M-LSTM的图像描述模型。模型使用融合注意力机制的深度残差网络提取图像特征,对特征的各个部分赋予权重,在生成不同的单词时关注图像的相应区域,在解码阶段对长短期记忆网络(LSTM)进行改进,引入额外的门控运算,让网络的输入和状态在网络内部计算之前进行多轮交互计算,使得输入和上下文之间具有更加丰富的交互表示,有效的提高了模型的语言建模能力。2.针对图像描述难以对复杂的公共环境产生详尽描述的问题,设计并实现了基于公共环境的密集描述模型。模型采用改进后的Faster R-CNN对需要生成描述的区域进行识别与定位,使用网络结构简单、收敛速度快且表达能力强的双层GRU网络进行语言文本生成。相较于图像描述,密集描述提取出了更多丰富的图像底层语义信息。3.将训练好的公共环境图像描述与密集描述模型进行封装,制作公共环境图像描述的GUI用户交互界面,用户可在软件界面直接进行程序调用,具有一定的实际应用价值。
其他文献
水系锌离子电池作为一种新型可充电二次电池,因其高安全性、低成本和绿色等优点受到广泛关注。然而,缺乏适合的阴极材料是阻碍锌离子电池市场化应用的主要原因之一。由于高的理论容量和丰富的嵌入位点,钒基材料受到越来越多的关注。但是二价锌离子在充放电过程中会与其主体材料发生强烈的静电作用以及钒基材料本身导电性较差,导致了Zn2+嵌入和脱出的反应动力学缓慢。基于以上问题,我们通过对V2O5进行碱金属离子预嵌和碳
学位
碳化硅(SiC)纳米线因其耐高温高压、高机械强度、抗辐射等优异性能,广泛应用于极端恶劣环境下的电子器件。目前难熔材料熔化的温度高,关于SiC纳米线的熔化机理实验上知之甚少。力学性能是材料使用关键考虑因素之一,然而室温下的脆性和力学性能的分散性限制了SiC纳米线的进一步使用。材料的微观结构决定其宏观性能,本文从缺陷结构的角度出发,通过分子动力学模拟的方法研究了包含空位原子,间隙原子,孪晶界,堆积缺陷
学位
针对小学生语文表达能力较弱的现象,教师要注重授之以渔,引导学生慢慢进步,并以语文园地中的"词句段练习"为例阐述相关对策:首先从多感官体验思考,让学表达更有序;其次从正反面抒发感受,让表达更丰富;第三用修辞精雕细琢,让表达更诗意;最后多元增添巧运用,让表达更独特。
期刊
电容器表面缺陷,对电容器的产品质量与后续生产环节的进行有着极大的影响,为保证电容器的生产质量,对其进行表面缺陷检测极为必要。对于电容表面缺陷的检测,人工检测的方法由于其效率低,消耗大量劳动力成本等缺点,使得许多电容器生产厂家不再采用。基于图像处理的传统视觉检测方法由于其特征提取算法的局限性,导致这种方法的检测效果与实际的检测需求有着一定差距。针对上述两种检测方法的不足,本文基于深度学习对电容表面缺
学位
高铁的发展使得区域间的时间和空间距离被压缩,极大地促进了人员和资源的自由流动,提高了企业全要素生产率,降低了企业间的资源错配,同时还促进了企业管理者之间的面对面交流和企业的创新能力,对企业出口产品的生产产生了一定的影响。因此相对于以往文献中所研究的高铁开通使得企业内部资源发生调整,本论文采用的数据主要包含了2007至2013年间国内高铁、海关、工业企业和城市等,采用双向固定的效应模型,研究分析高铁
学位
由金属谐振元件构成的频率选择表面(Frequency Selective Surface,FSS)通常周期性地排列在二维结构中,由于FSS具有优良的频率选择特性,经常用于雷达天线罩隐身。目前,带通FSS天线罩在实践中得到了广泛的应用,它可以正常传输天线工作频段的电磁波,并将带外电磁波信号从入射波的方向反射回去,以降低单基站雷达散射截面(Radar Cross Section,RCS),从而达到隐身
学位
统编版教材“语文园地”中的“词句段运用”板块鲜明地指向了本单元语用点,精准地给学生提供用以锻炼运用语言文字能力的信息和资源,推动学生语言能力的生长。教师可以通过精准定位目标点、瞄准独特切入点、实践落实运用点来高效地使用好“词句段运用”板块提供的信息和资源,将“词句段运用”教学真正落到实处。
期刊
改革开放以来,中国凭借低廉的劳动成本快速融入全球价值链并成为“世界工厂”,但这种低附加值的生产模式无法打破被“低端锁定”的局面。与此同时,欧美等发达国家实施“再工业化”战略,印度等发展中国家的低成本优势开始显现,叠加国内生产成本的不断上升,中国制造业处于“新比较优势尚未确立、原有比较优势面临挑战”的中间阶段。由此可见,我国要提高制造业出口技术复杂度,提升制造业竞争力,打破发展僵局。在我国大力发展交
学位
随着世界生态环境污染和化石能源逐渐枯竭,我国提出“碳中和”和“碳达峰”的目标,推进我国能源供给侧的改革,高渗透率的可再生能源发电比例不断升高,传统的火力发电机组装机比例逐步下降。配电网的结构也发生变化以适应可再生能源的并网。其中微电网是整合分布式电源的常见形式,微电网群是缓解可再生能源的间歇性、波动性和随机性以及促进未来能源互联网发展的趋势之一,但是微电网群组成单元和结构复杂,微电网与微电网、微电
学位
近年来,随着计算机软硬件技术的发展,视频数据在互联网上呈指数式增长,基于视频的人体行为识别是对视频数据进行有效管理和分析的主要组成部分。本文利用深度学习相关理论,围绕准确识别视频中的人体行为的问题,从时间序列和空间特征两个维度展开研究。主要研究内容如下:(1)针对直接对全连接层输出的一维向量特征做时间序列建模而带来的识别效果不佳的问题,本文利用卷积长短期记忆神经网络(ConvLSTM)对卷积层输出
学位