自适应的轻量化目标检测模型研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:kingstarKS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉技术快速发展和无人机逐渐得到广泛应用的大背景下,对无人机拍摄的图像资料进行目标检测的需求不断增加。首先,这类图像或视频是典型的小目标;其次,在实际的信息采集过程中会受到光照、天气、视角等影响,导致域间分布差异,模型精度下降;最后,受无人机硬件资源限制,要求模型在保证准确率的前提下,尽可能轻量化。为了解决上述问题,本文从小目标检测、领域自适应和知识蒸馏三个角度,对无人机复杂场景下的目标检测问题进行研究,主要研究内容包含以下三部分:(1)提出了复杂场景下基于特征金字塔的小目标检测模型。在特征提取阶段通过特征金字塔垂直和旁支两条支线,实现多尺度特征图的提取和融合,并从空间维度和通道维度,对特征图进行处理得到相对更全面的信息。基于实验对比,在两个数据集的验证下m AP均有提升,最高分别提升14.3%和23.3%。(2)提出了基于关联对齐距离的领域自适应目标检测算法。以Faster R-CNN网络为基础添加一个自适应层,将其应用与特征提取模块之后,来学习源域和目标域之间弱特征表示,最后基于关联对齐距离设计域间损失函数,减少域间分布差异,提升模型的自适应能力。在实验结果的佐证下,本方法与其他2种目标检测方法相比,约有0.34%~12.88%的性能提升。(3)提出了基于知识蒸馏的自适应轻量化目标检测模型。将设计的小目标检测模型作为教师模型,选取Mobile Net作学生模型。将参数量大的教师模型知识,迁移到参数量小的模型上,达到模型精度和模型大小及计算时间的平衡。实验结果表明,经过知识蒸馏算法后,模型的大小得到了显著的压缩,压缩百分比为83.7%。经实验验证,本文所提出的方法,能够在无人机复杂场景下,对空中采集的小目标数据进行检测;解决域间漂移问题,实现对共性特征的对齐效果;解决无人机算力、存储有限的问题,更好地满足未来无人机在目标检测任务场景下的应用。
其他文献
城市化的发展带来生活便利的同时也带来了很多噪声问题。使用吸声材料是控制噪声的一种有效手段,但在吸收中低频噪声时往往需要厚重的多孔吸声材料才能达到理想的吸声效果,部分纤维类吸声材料还可能损害人体健康。微穿孔板作为一种绿色、轻质、高效的共振型吸声材料,在控制中低频噪声方面有非常大的优势,其吸声效果不受自身材料的限制,且结构轻薄,应用前景广泛。但传统的微穿孔板吸声结构存在吸声频带较窄的问题,且吸收中低频
学位
可充电水系锌离子电池因为其安全环保的电解质,对大规模储能技术具有广泛的吸引力。但这并不代表锌离子电池不存在安全隐患,电池剩余使用寿命(Remaining Useful Life,RUL)预测是保障其进一步安全使用的关键技术。随着机器学习的兴起,越来越多的研究开始用机器学习预测电池的RUL,但是准确地预测每一个电池RUL仍然是困难的事情,这是因为电池的退化过程很复杂,其内部的化学反应具有很大的随机性
学位
祥瑞图像源于汉代儒家思想中的天人感应学说,是汉代墓室画像中常见的题材。梳理现今研究成果,发现目前学者对祥瑞图像的界定不统一,对准确理解祥瑞的功用等造成了一定的影响。本文通过梳理文献材料、考古资料,结合前人的研究成果,总结归纳出三个判定标准,据此标准,将汉代祥瑞图像分为标准祥瑞图、祥瑞装饰图两大类。标准祥瑞图发现数量少,有固定的格式与范本,呈“图录式”排列。整幅图有若干单元组成,每个单元内绘制祥瑞物
学位
随着工业化的发展,能源损耗与环境的污染使得人们急需开发新的清洁能源。光催化剂可以通过一系列氧化还原反应可以将广泛而又丰富的太阳能转化为氢能这种新的绿色清洁能源,因此越来越多的科学家致力于可见光催化分解水产氢的研究中。此外,在发光领域,白光发光二极管这一新型固态照明方式因其卓越的发光效率、低功耗、可靠性和环境友好性而备受关注。而在追求发光效率更高性能更好的白光发光二极管过程中,稀土掺杂荧光粉对其发展
学位
作者归属指通过测量一些文本特征用以区分不同作者写的文本,是自然语言处理的一个重要分支。随着信息技术的显著增长,作者归属的实际应用数量已经在几个不同的领域增长,如刑法,民法,以及计算机安全。每个作者都拥有影响其书面作品形式和内容的特殊习惯,这些特点往往可以用机器学习算法来量化和测量。早期的研究中主要针对这些特点手工设计特征,但是手工设计的特征往往只能提取一部分特征作为写作风格特征。由于深度学习方法能
学位
近年来,随着人工智能技术的不断发展,对定位的效率和精度的要求也在不断提高,而基于视觉SLAM的集中式多机器人协同定位系统可以明显提升定位精度与效率,因此,越来越多的科研工作者投身于对多机器人协同定位的研究。同时,构建实时稠密地图是多机器人协同定位系统需要解决的问题之一。目前大多数多机系统构建的地图是稀疏点云地图,但是稀疏点云地图无法为导航任务提供帮助,因此实现自主定位的同时构建可用于导航的地图是多
学位
指纹用于辨认个体身份的历史已久,尤其是在法医学中,指纹已成为个体独一无二的身份认证。指纹学研究表明:男女的指纹嵴线密度差异显著,使用指纹嵴线密度测量来区分成年男女,准确率达80%—90%。目前的考古学研究中,除体质人类学能够根据人骨的特征对古人身份作出解释外,我们很难从其他途径获得古代居民的身份信息。指纹分析技术则为这一认识提供了一种新方法,留在陶器上的指纹作为过去的陶工和他们身份之间为数不多的联
学位
目的:明确硫酸乙酰肝素(Heparan Sulfate,HS)对NLRP3炎性小体的激活作用并阐明其确切机制,为HS相关疾病的发生发展机制的阐释提供新的思路,并为其药物治疗提供新的靶点。方法:(1)经PMA诱导的人单核细胞THP-1经HS单独处理或与其它信号二诱导剂共处理后,通过ELISA法检测细胞IL-1β的分泌量来初步明确HS对NLRP3炎性小体的激活作用;(2)以MCC950为对照药,THP
学位
蒲家寨墓地位于陕西咸阳,共发掘墓葬335座,在发掘区域内罕见打破关系,排列有序,是一处经过规划的墓地。该墓地存续时代包含整个战国时期,是研究关中地区秦人体质健康、种族成分等信息的宝贵材料。本文在人类骨骼考古学的研究理念与方法指导下,对采集自蒲家寨墓地的123例人骨进行了人口学、古病理学、颅面形态、种族类型等方面的分析,意在最大限度地提取人骨信息,结合考古学文化信息,研究蒲家寨古代居民的体质特征、人
学位
视觉描述生成是一项跨模态的任务,同时结合了自然语言处理与计算机视觉的领域,视觉描述生成任务会将输入的视觉信息转换为语言描述。作为一个跨模态任务,视觉语言描述生成任务最大的难点在于视觉与语言之间存在的语义鸿沟,但是对视觉描述生成的研究是有重要意义的,有助于推动人工智能从感知智能向认知智能转变。视觉描述生成算法有多种处理视觉特征的方式,如基于卷积神经网络提取全局特征、基于目标检测模型提取区域特征、基于
学位