复杂环境下透明目标两阶段检测方法研究

被引量 : 0次 | 上传用户:mzhao79
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
透明目标检测旨在从图像中检测出玻璃杯、玻璃门等透明物体,其在智能家居、无人物流等领域有着广泛的应用。然而,由于透明物体材质的特殊性,其成像特别容易受到背景、光照等环境因素的影响,这导致了现有的目标检测算法在复杂环境下检测透明目标容易出现漏检与误检。对于透明目标,人类视觉的感知过程可分为以下2个阶段:1)结合待检测对象的整体信息及四周局部细节信息,综合判断是否为透明目标;2)根据透明目标的特征判断透明目标的具体类别。基于上述人类视觉感知机制,本文设计了一种两阶段检测算法,以实现复杂环境下透明目标的高性能检测。本文的主要贡献如下:(1)本文分析影响透明目标检测模型效果的因素,并基于此建立自有透明目标检测数据集。(2)本文首先设计了一种主从二分网络结构以增强基干网络的特征提取能力。随后,参照人类视觉感知透明目标第一阶段,设计了一种基于细粒度特征增强与感受野增强的特征金字塔结构,并结合自注意力机制,进一步对基干网络所提取的特征进行增强与融合,用于扩大视野感受范围和增强目标细节。(3)参照人类视觉感知的第二阶段,本文设计一种基于可变形感兴趣区域池化的双分支检测网络结构,通过可变形感兴趣区域池化提升目标特征表达能力,并结合边框回归和目标识别双分支网络结构,提高透明目标在变形、遮挡或重叠等情况下边框的精准度。为了验证提出算法的有效性,本文基于自有透明目标检测数据集开展实验。实验结果表明相比基线模型,本文提出的两阶段透明目标检测方法获得了3.6%AP提升。与其他主流目标检测算法相比,本文方法也展现出更优的性能。图34幅,表8个,参考文献99篇。
其他文献
新型数字社会形态的构建及其持续崛起,为智能化舆情资源的流通提供了庞大市场。同时,智能化舆情因其对政治系统的作用力、对社会价值取向的影响力而与意识形态安全息息相关,可能会削弱主流意识形态的影响力、增加不良意识形态的社会显示度并可能诱发数字殖民风险、在微舆论场中导致群体情感的极化效应并容易冲击主流意识形态安全等风险。然而,智能化舆情对意识形态安全的影响过程呈现出较为鲜明的资本逻辑、技术逻辑和情感逻辑,
期刊
主题出版工作是意识形态建设的主阵地,也是传播社会主义核心价值观的重要平台。文章从主题出版的视角探索社会主义意识形态建设这一重大议题,厘清主题出版与意识形态建设之间的关系,在历史的必然性和现实的必要性双重语境中论述主题出版对社会主义意识形态建设具有的实践意义和传播价值;首次系统地提出了主题出版构建社会主义意识形态的三个维度,即政治上立魂、理论上创新、情感上凝聚;最后探讨“两个大局”背景下主题出版建构
期刊
地方党媒作为地方主流媒体,在巩固意识形态主阵地、牢牢把握意识形态话语权上,担负着重大使命,发挥着重要作用。2022年5月,贵港市委宣传部和贵港日报社共同打造了贵港市意识形态教育基地,积极探索地方党媒“纸媒+新媒体+基地”体验式全方位意识形态宣传教育新路径。贵港日报社的实践说明,主流媒体要不断创新突破,守住意识形态主阵地,拓展占领新阵地,纵深推进媒体融合发展。
期刊
5G技术作为当下主流的移动通讯手段,对于社会主体经济的恢复、复工复产、居家办公等方面提供了强而有力的帮助。随着由微波介质材料制备的器件在通讯设备中所占有的比例越来越高,具有高性能低损耗的微波介质材料所受到的关注也越来越多。本文选择具有K2Ni F4结构的CaSmAlO4基陶瓷作为研究对象,详细研究了陶瓷材料在固相法制备过程中出现的水化作用机理和物相结构演变过程。同时,通过固相法掺杂不同离子,进一步
学位
偶氮染料是印染工业中最常用且应用范围最广的一类染料,是印染废水的主要组成部分。其中活性黑5(RB5)是最具有代表性的一种偶氮染料,偶氮染料废水具有色度高、毒性大等特点,如果处理不当排放到环境中,将会对周围生态环境和人体造成严重危害。近年来以过硫酸盐(PS)为基础的高级氧化技术因其反应速率快,p H适用范围广等优点不断应用于印染废水的处理。以废弃生物质制备的生物炭作为一种绿色经济的催化材料已证实可有
学位
伴随人工智能技术在辅助医疗上的日益普及,许多临床医学上的问题得到较好的解决。其中,临床疾病诊断是临床医学中非常重要的任务。早期凭借医生临床经验的诊断方式存在较高的误诊率和漏诊率,导致病人承担较高治疗费用和不必要的痛苦。因此,将人工智能技术用于辅助医学疾病诊断是一个很好的解决方式。人工智能在某些疾病的分类上取得了很大的突破。然而,对于临床和组织学特征的既有较高相似性的疾病分类问题,一直没有得到很好的
学位
突发公共卫生事件的治理对于人工智能技术有强烈需求。本文为科技类文本英译中实践报告,以《机器和深度学习在COVID-19诊断和治疗中的应用:调查、挑战和未来方向》英译中为例,以纽马克文本类型理论为指导,探究科技类文本的具体翻译方法。根据纽马克文本类型理论,文本可根据其语言功能划分为信息型文本、表达型文本和呼唤型文本。他进而提出交际翻译和语义翻译两种翻译方法,不同的文本类型应采用不同的翻译方法。《机器
学位
报纸
报纸
报纸