基于深度学习的视觉语义方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:ysc4444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着视频业务的飞速发展,传统依靠人工管理视频的方法已无法满足如今需求,视觉语义成为视频智能分析的热点技术,该技术通过将复杂冗长的视频转换为简单易读的文本,极大提升了视频管理的效率。目前该技术处于初步探索阶段,在实际落地应用过程中仍有诸多不足之处,本文旨在针对如今视觉语义技术中存在的关键问题进行研究,主要工作如下:当前视觉语义研究者均在大量开放环境公共数据集上开展实验,未能考虑到特定环境训练样本缺乏的情况。本文针对视觉语义模型训练样本数量受限的问题,提出了一种基于半监督学习的噪声伪标签模型,通过训练半监督模型在大量未标注数据上预测伪标签,引入数据增强、随机失活及随机深度噪声策略,筛选数据并进行联合迭代训练,在训练样本数量不足的情况下所提模型仍能保证相对优秀性能。通过对比实验验证了所提模型在多个数据集上均能取得优秀成绩。目前视觉语义研究者往往致力于提升模型最终生成语义的整体准确率,忽视了对视觉信息中关键动作的建模。针对现有视觉语义方法未能有效关注动作交互问题,本文提出一种基于动作指导的视觉语义方法。该方法通过检测图像中的区域对象,基于自注意力机制计算场景特征,解码视频中的动作,利用动作来指导语义文本的生成。通过在多个数据集上开展对比实验,对模型性能进行定量、定性分析以及消融研究,所提模型在各项指标上均取得了较好效果。当前视觉语义研究者更关注语义生成的研究,忽略了视觉特征充分提取对模型的影响。针对视觉语义模型对视觉信息表征能力不足问题,本文提出一种基于配对高斯函数的损失函数优化方法。该方法从常用Softmax损失中特征样本的类间可分离性与类内紧凑性这对矛盾入手,引入高斯函数以及特征配对策略来优化损失函数,通过在多个数据集上开展对比实验,综合分析所提方法的性能及泛化能力,结果表明所提方法在各项指标上均有一定程度的提升。综上所述,本文研究以当前视觉语义技术存在的三个问题为导向,分别提出了针对性解决方案,开展了一系列实验,验证了所提方法的有效性。本论文有图29幅,表30张,参考文献88篇。
其他文献
随着国家“碳达峰”、“碳中和”战略目标的提出,“节能、绿色、环保”的可持续发展理念也受到混凝土行业的高度重视。同时,国家对超高层建筑、大跨度重载结构以及大跨度桥梁等建筑物需求越来越高,使得高强混凝土得到了广泛使用。为了提高对固废综合利用率并且配置高强混凝土。本文将石灰石粉、粉煤灰、矿渣以及硅灰等矿物掺合料与天然河砂、尾矿机制砂等细骨料以不同方式进行掺配,探究混凝土基本性能与梁力学性能。主要研究结论
学位
高速铁路沿线不可避免存在软土、密实砂层以及碎石角砾土等复杂地层环境,而常用水泥土桩虽然地层适用范围广,但桩身强度低不能有效控制沉降,且有效桩长的存在使得水泥土桩下部侧摩阻力得不到发挥;混凝土预制桩在上述地层桩体不易植入、桩周土发生剪切破坏时桩身强度却远远没有得到发挥等问题。水泥土复合预制桩作为一种新桩型,可以充分结合两种桩型的优势,提高承载力并能有效控制沉降。目前尚且缺乏柔性基础下水泥土复合预制桩
学位
近年来,大气中CO2浓度的不断增加导致全球变暖,严重危害自然生态系统的平衡和人类的居住环境。因此,CO2捕集技术的发展受到了广泛的关注,同时CO2作为一种C1资源,具有廉价、无毒、易获取、可再生等优点。如何将CO2变废为宝,转换成高附加产品是近年来的研究热点。共价三嗪骨架材料(CTFs)作为一种功能性多孔材料,其主要的结构特征是具有平面π共轭的芳香族1,3,5-三嗪环,并具有较高的比表面积、高含氮
学位
热解气化是将可再生的生物质资源转化为富氢气体的重要技术之一,但气化过程中焦油的生成会严重影响其大规模工业化利用。开发成本低、活性高且稳定性好的生物质焦油裂解催化剂成为提高生物质气化效率的关键。以改性褐煤为碳前躯体,利用离子交换法制备的Ni/C和Co/C催化剂在生物质焦油裂解中均具有良好的活性。其中Co/C具有更优异的亲氧性和抗积炭能力,因而在反应中能达到更好的稳定性。但炭基载体在高温下易发生损耗,
学位
城市绿地三维绿量反演及其梯度特征研究,可以为城市绿地快速、准确、全面监测提供数据基础和技术支撑。本文以徐州市城区为例,基于Sentinel-2A遥感数据、实地样方数据、DEM数据,通过区分城市绿地植被覆被类型,运用逐步多元线性回归方法构建和优化了城市绿地三维绿量反演模型,提高了模型的精确度,从三维绿量等级、像元尺度、地形尺度三个维度构建了梯度分布指数,揭示了城市绿地三维绿量的空间梯度特征,提出了徐
学位
在国家政策的推动下,我国经济高速发展,现代化经济体系建设不断完善。然而,这些成就是建立在牺牲过量能源、污染环境的基础之上。为了维持经济的长久发展,我国亟需改变现有粗放型的经济增长模式,完成产业的绿色转型。作为重工业的典型代表,高耗能行业对能源消耗和二氧化碳排放产生的影响不容小觑。价格机制是市场实现资源优化配置、促进企业转型的重要途径,却由于政策环境等因素产生价格畸形,无法充分发挥作用。对此,文章基
学位
近年来,深大冻结井筒内壁混凝土在凿井期裂漏严重,但机理不明,揭示凿井期内壁混凝土开裂机理是科学防治冻结井筒渗漏水害的前提。为此,本文研制了适用于新筑混凝土井壁温度-应力试验机并初步应用,为研究井筒内壁厚度、混凝土强度、约束条件对早龄期混凝土内壁裂缝演化规律提供了仪器支撑。首先,本文详细阐述了新筑混凝土井壁温度-应力试验机的研制过程,主要工作内容包括:完成试验机总体结构方案和软件控制界面的设计与优化
学位
离群点检测作为数据挖掘的主要研究方向,已得到学术界和工业界的广泛研究和应用。对于许多工程实际问题,数据集往往同时包含数值型和分类型属性,即,混合属性数据集,因此,对混合属性数据集中的离群点进行检测和研究具有重要的理论意义和实际应用价值。近年来,基于网络模型的离群点检测方法因其鲁棒的表达能力和能够捕捉数据对象之间的相互依赖性和长期相关性而广受关注。但该类方法大多用来处理数值型属性数据集,少有涉及混合
学位
近年来,随着西北侏罗系煤田的开发,矿井水害事故频发,离层水害问题严重。新上海一号煤矿作为西北侏罗系煤田上海庙矿区的典型矿井,水文地质条件复杂,覆岩固结强度低,易发生携泥砂突水事故。新上海一号煤矿111084工作面作为8煤的第2个回采工作面,在开采过程中发生了严重的顶板离层水害事故,涌突水携带大量泥沙掩埋了工作面,造成了巨大的经济损失。因而,研究分析新上海一号煤矿顶板水文地质与工程地质条件,揭示离层
学位
近年矿井工作面底板水害事件频发,威胁日益严重,精细探测回采工作面底板岩层富水性并监测底板改造效果是煤矿水害防治的重要环节。针对现有电法探测技术观测方式较为单一、对于工作面底板三维地质信息获取不足的缺陷,论文提出综合利用多钻孔、多巷道等多个空间位置的观测信息的多孔多巷立体电阻率探测技术。通过开展底板异常体电阻率响应规律数值模拟研究、水槽物理模型底板异常体电阻率响应的规律研究以及工作面底板富水性探测,
学位