基于可变形感知注意力机制和金字塔特征的图像目标检测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:vc__
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉的基础分支,能够为场景理解、图像描述和目标跟踪等复杂的视觉处理任务提供有价值的信息。目标检测的任务是在图像中判断目标的类别并确定在图像中的位置,这是计算机视觉领域最基本且最有挑战性的问题之一。近年来,深度学习技术凭借强大的特征表示能力,为目标检测领域带来了突破性进展。因此,基于深度学习的目标检测算法成为目前主流方法,而提高基于深度学习的目标检测算法精度的核心问题是,如何提取语义信息丰富的目标特征和设计合理高效的目标检测网络结构。本文围绕以上核心问题进行了以下几方面的研究:1.提出了一种基于深度自适应金字塔特征与层级监督的目标检测网络。针对多尺度特征融合时,特征语义信息存在间隙问题,在特征金字塔网络FPN的基础上设计了自适应特征融合模块和层级监督机制。一方面自适应学习通道权重来将金字塔尺度特征进行合并,另一方面使用层级监督机制对多尺度特征实施相同的监控信号,缩小了不同尺度特征之间的语义间隙。在PSAVAL VOC数据集和Vis Drone2019数据集上分别取得80.96%和20.18%的平均精度,比以FPN为代表的两阶段目标检测算法分别提高了1.76%和0.66%,比以Retina Net为代表的单阶段目标检测算法分别提高了2.87%和1.69%。2.提出了一种基于可变形感知注意力机制的目标检测算法。针对图像背景干扰目标检测的问题,设计了一种随着目标的形态变化而改变感知区域的注意力机制,可以有效地提取图像中特定区域的细节信息。该注意力机制通过对特征的通道信息和空间信息进行整合获得注意力感知特征,强化显著特征的语义信息并弱化背景干扰信息。与Faster-RCNN算法结合后,相比于通道注意力机制和空间注意力机制,在PSAVAL VOC数据集上分别提高1.24%和1.53%。与第三章算法结合后,在Vis Drone2019数据集上的精度提高了0.04%。因此,可变形感知注意力机制能有效辅助网络提取特定区域的重要信息,提高了注意力感知特征的辨识度,提高检测精度。3.提出了一种基于深度扩张卷积与层级监督的目标检测网络。为了从网络设计方面来提高多尺度特征表达能力,基于特征金字塔网络FPN设计了感受野拓展模块,通过多分支的扩张卷积和标准卷积结合的方式构成的感受野拓展模块,能够使得到的特征既具有全局信息又包含局部细节。通过在每层上增加感受野拓展模块,在PSAVAL VOC数据集的精度逐步提升,最高可以提升1.04%。在Vis Drone2019数据集上与FPN算法相比提高了0.27%,与第三章算法相比降低了0.39%。
其他文献
汽车企业在进行新车型白车身试制时除了会引入新的工艺方法,更多的体现在引进新材料。目前高强钢板以其明显的成本优势和优良的成型工艺性成为汽车厂商目前最为青睐的新型材料。更多的采用高强钢板使三层板搭接头点焊比以往比例更高,可达全车焊点的1/2。与二层板点焊相较而言,三层板搭接头实际点焊生产中更容易出现熔核过小、熔核偏移、烧穿、飞溅等焊接质量问题。保证三层钢板焊点强度质量对提高车身质量很重要。实际试制车身
煤矿地下开采的前提是查明主要可采煤层顶底板工程地质特征,正确地将煤矿巷道围岩质量分类可以很好地反映井巷工程地质类型和煤矿开采技术条件,可为指导后期煤矿开采设计和支护设计提供重要依据,为煤矿的安全高效生产提供技术支持。鉴于上述背景,本文采用数值分析、工程验证及数值模拟等研究方法,基于机器学习高效率、可塑性、普适性等优点,建立了基于支持向量机(SVM)的煤矿巷道围岩质量分类模型并与BP神经网络和随机森
近年来,国际经济环境逆全球化思潮盛行、新兴市场尾部风险逐步积累。当前人口结构失去优势,经济内生动力不足。金融支持实体经济的政策要求、宽货币向宽信用的转变、降低实体企业融资成本等一系列因素,导致银行业的息差收入逐年降低。银行业在不利的外部环境下,竞争更加激烈。银行管理者越来越认识到人才在激烈的竞争中所起到的关键作用。绩效考核是衡量员工态度、业绩、综合素质的重要抓手。如何进一步优化现行的绩效考核制度,
背景:多囊卵巢综合征(PCOS)是育龄妇女常见的内分泌疾病。PCOS的病因与胰岛素抵抗和高雄激素血症有关,胰岛素抵抗加剧了高雄激素血症,进而导致PCOS患者月经紊乱和高雄激素血症的临床表现。生长分化因子-15(GDF-15)被认为是一种营养应激的信号分子。既往研究发现GDF-15与胰岛素抵抗密切相关,然而该因子与PCOS患者胰岛素抵抗以及临床表现的关系未得到充分研究。方法:我们分别纳入了在同济医院
新中国初期,在毛主席“发展体育运动,增强人民体质”的号召和“身体好,学习好,工作好”的指示下,广大青年积极参加体育锻炼,同时在中等教育会议之后,学校行政领导开始重视健康教育,树立全面发展的教育思想,改变由体文组独立地搞体育工作的状况,加强有关部门的相互配合,积极推行“劳动与卫国体制”(以下简称“劳卫制”)一系列工作。“劳卫制”是新中国实行的第一个体育制度,是中国学校体育、群众体育的基础。它是一种科
北魏是中国古代第一个统一北方且统治时间超过百年的少数民族政权,汉族士人在其政权的建立、发展中发挥了重要作用。汉族士人按地域可分为河北、江南和河西士人。他们入魏后的政治境遇不尽相同。从官职来看,河北士人人数最多,所任官职以中央官为主,多有升迁,多人出将入相,进入政权的核心圈。江南士人境遇次之,司马氏因其宗室身份多获官职爵位,其他士人也得任用,总体上以武职、地方官居多。河西士人境遇最差,除西凉皇室后裔
小学科学教科书作为实施科学教育的媒介,其质量的高低会直接影响学生学习科学的效果,而比较研究则可以知己知彼、有的放矢。本文选取中国冀人版和加拿大安大略省PBC版小学科学教科书进行比较。本文采用内容分析法、比较研究法等对两版教科书比较分析。首先介绍中加两国小学科学课程改革的概况。其次,分析中加两国小学科学课程标准的目标以及课标中对“地球与宇宙”领域内容的要求,发现两国课程标准在课程目标的设置和课程内容
随着半导体工艺的发展,电路的复杂度和运行速度快速提升,导致功率密度显著增大,功耗问题也日益突出。处理器功耗问题已经成为了继速度和面积后又一衡量指标。本文对一款基于RISC-V的处理器进行低功耗设计,主要工作如下:首先,就集成电路中产生的功耗进行分析,并介绍了几种低功耗的设计方法及使用中应该注意的事项,再介绍了三种功耗分析的策略。其次,本文通过前端仿真控制指令的类型使得处理器分别处于三种功耗模式,分
中华绒螯蟹(Eriocheir sinensis)俗称大闸蟹、河蟹、毛蟹,由于营养丰富味道鲜美而著名,在我国的淡水养殖甲壳类动物中占有重要地位。中华绒螯蟹的市场需求巨大,据统计2017年我国成蟹养殖产量高达75.09万吨。中华绒螯蟹鲜美的味道以及丰富的营养深受消费者的喜爱,作为水产动物类产品,腥味是影响它的品质主要因素之一。腥味的形成方式复杂多样,水产动物类产品固有的腥味以及在加工、运输、贮藏等过
本论文以煤矿井下风水管路系统为主要研究对象,介绍了结合风水管路的特点和需求设计的煤矿井下风水管路环境参数监测系统。系统的关键点监测分站通过传感器采集环境参数数据,将采集的模拟量转换为数字量,并经过一定的比例换算得到真实环境参数的数据。液晶屏将同时显示监测分站地址、温度、湿度、流量、风压力、水压力、参数单位和日历时钟等信息。操作按键可对报警值进行修改,报警值存储在掉电可保存的存储电路中。关键点监测分