【摘 要】
:
行人检测作为计算机视觉领域中的一个重点研究方向,在无人驾驶和高级驾驶辅助系统等人工智能应用中起着关键的技术支撑作用。然而在复杂的道路交通场景下,行人检测仍然面临着以下难题:(1)易受拍摄角度、遮挡、光照等复杂背景信息的干扰,造成对模糊行人检测效果不佳;(2)输入图像分辨率过大容易导致模型收敛速度慢,且对小目标行人检测效果较差。这些都给当前行人检测方法带来了一定挑战。而本文则针对上述问题,从YOLO
论文部分内容阅读
行人检测作为计算机视觉领域中的一个重点研究方向,在无人驾驶和高级驾驶辅助系统等人工智能应用中起着关键的技术支撑作用。然而在复杂的道路交通场景下,行人检测仍然面临着以下难题:(1)易受拍摄角度、遮挡、光照等复杂背景信息的干扰,造成对模糊行人检测效果不佳;(2)输入图像分辨率过大容易导致模型收敛速度慢,且对小目标行人检测效果较差。这些都给当前行人检测方法带来了一定挑战。而本文则针对上述问题,从YOLOv4和DETR两种不同的框架入手,设计了不同的检测方法并通过实验验证了模型效果,具体研究工作如下:(1)针对道路交通场景下当前检测模型在特征提取的过程中易受复杂背景信息导致的噪声所干扰的问题,本文提出了基于YOLOv4的MGA-YOLOv4(Mask-Guided Attention YOLOv4)方法,主要工作是在YOLOv4的每个检测分支上生成带注意力的掩膜特征,实现对不同尺度行人关键特征的增强。首先,在原模型的每个检测分支中设计语义分割编码-解码模块生成像素级别的细粒度掩膜特征。其次,基于掩膜特征生成在通道维度和空间维度上的注意力权重,从而突出特定尺度下的行人和被遮挡行人的关键特征,避免背景干扰信息。最后,通过实验验证了当通道注意力特征与空间注意力特征以拼接的方式相结合的时候,模型效果达到了最优。实验表明,提出的改进措施在提高YOLOv4检测精度的同时能够保持较好的实时性。(2)针对普遍模型中存在的由于输入图像分辨率过大导致的计算复杂度高、收敛速度慢以及对小目标行人检测困难的问题,提出了改进的Sparse DETR(Sparse DEtection TRansformer)方法。首先,结合可变形注意力设计了一种评分网络对DETR(DEtection TRansformer)进行稀疏化,将模型由原本的密集计算转化为稀疏计算,极大地提升了收敛速度和对小目标行人的检测效果。其次,由于长距离视频片段中的时间信息容易丢失,本文结合Transformer能够对长距离特征进行建模的能力,将Sparse DETR从静态行人检测进一步扩展到视频行人检测,构建了能够联系时空上下文关系的行人视频检测模型Sparse V-DETR。最后实验证明,在更复杂的视频场景下,提出的方法在测试数据集上显示了更低的误检率和漏检率。
其他文献
本文主要讨论信息工具对欺诈的规制以及信息规制下欺诈的认定。本文第二章介绍民法框架下对欺诈行为进行规制的规则群。本文梳理了法律行为制度下不同规则的体系关系,认为民法概念下的欺诈涵义狭窄,仅规制行为虚假性明显、行为人主观恶性明显、且实际造成了错误认识及后续意思表示的行为。而相应的带有歧义的误导行为以及行为人主观上过失造成表意人错误认识的,则交由错误制度处理。此外,道德责难性不如前述规则明显,但一方利用
扩散张量成像(diffusion tensor imaging,DTI)是一种非侵入式活体大脑成像技术,其丰富了描述人脑微观解剖结构及功能特征的表示方法。扩散张量图谱在脑科学研究中扮演着重要角色,高质量的扩散张量图谱不仅能极大地促进大脑结构-功能关系的研究、临床医学研究和神经解剖学研究,还能推动人工智能、智慧医疗等领域的发展。目前基于迭代平均的传统扩散张量图谱构建算法耗时长且所构建的图谱难以捕获全
新冠疫情增加了风险社会中的不确定性。主流新媒体对以钟南山院士为代表的医学专家的社会信任的建构,既是公众在认识论层面简化风险社会不确定性的知识来源,也是政府在价值论层面动员新冠疫情防控的情感资源。那么,新冠疫情期间,主流新媒体在“实然层面”是如何建构医学专家的社会信任的?在“应然层面”又须如何进一步优化对医学专家社会信任的建构呢?论文以“信任”为理论视角,采用参与式观察法等研究方法,选择新浪微博平台
数据可以用来分析和挖掘,但数据直接发布存在隐私泄露的风险。本文针对基于交互式框架的差分隐私算法进行问题研究和分析,就差分隐私保护技术应用于交互式框架中,隐私预算消耗过快、查询结果的不一致性带来隐私泄露的风险;没有考虑数据集中元组间的相关性带来的隐私问题;底层噪声扰动机制添加的噪声过大,导致数据可用性低,分别提出解决方案。具体方案研究内容如下:(1)将区块链技术应用到差分隐私交互式框架中,用于节约和
汽车发动机是汽车的心脏,它决定了汽车是否能正常运行,对发动机状况识别中一般是检测振动信号,而采用声学信号进行检测较少。从人工维修发动机的实际情况出发,往往采用听声音是否正常来判断发动机是否有异常,随着近年来声学技术和人工智能技术的迅速发展,为采用音频信号来分析辨别发动机状况打下一定基础,因此本文将通过分析汽车音频信号来辨别发动机工况和异常响声。首先,本文提出基于Android智能手机的音频信号采集
对星载SAR天线方向图进行在轨测量,是进行星载SAR定标、性能调优以及指标测试必不可少的环节。实际测试中通常将SAR天线方向图分为距离向和方位向分别测量。天绘二号卫星组由两颗卫星构成,在轨测试初期,两颗卫星采用一前一后间隔约40 km的跟飞模式,并各自工作于SAR模式以便于分别进行单颗卫星的定标、调优与测试。在进行方位向SAR天线方向图测试时,出现了地面接收机中两星信号交叠在一起的情况,导致现有的
近年来,高校教师性骚扰出现屡禁不止、屡治不力的现象,究其本质是因为其蕴含着性别差异和权力差异两种属性。现有的师德师风规制方式在某种意义上将其纳入道德规制范围内,但基于道德属于应然范畴,缺乏强制执行性和惩罚性,难以直接有效地遏制并改善该问题。所以关于高校教师性骚扰的规制应当从德治走向德法兼治,以法律的明确规定对该问题进行直接有效的干预。通过对法律法规进行分析后发现其关于性骚扰方面的规定存在着分布零散
对上市公司的敌意收购旨在获取目标公司的控制权。被收购的上市公司面临更换董事会、被“掏空”资产等风险。敌意收购侵害股东、利益相关者的利益,挤压公司长远利益,甚至扰乱行业秩序,因此,上市公司大都会采取反收购措施来抵御敌意收购。上市公司反收购的研究中,反收购决策权的归属、反收购决策主体的行为规范以及具体反收购措施的合法性是最基本、最重要的问题。目前我国的立法尚未明确界定这些问题,仍有讨论和研究的必要。本
卫星编队构形是影响分布式InSAR系统DEM性能的关键因素,本文针对天绘二号卫星系统需求提出了一种基于多个约束条件的分布式InSAR编队构形工程优化设计方法。该方法结合工程实际,首先分析并确定了构形设计的多约束条件;然后通过引入了编队相对运动学模型,实现了设计约束的数学描述;最后以构形被动安全性最优为目标,借助蚁群算法对相对运动构形参数进行优化设计。仿真试验表明,文中方法寻优得到的构形设计结果满足
破产法所具有的综合性,使其成为市场经济中重要的法律制度。同时,也使得一个企业的破产所带来的不仅仅是关于如何保障破产利害关系人合法权益的法律问题,还会产生一系列诸如企业税收调整、信用修复以及职工就业安置等社会衍生问题。但是,由于相关市场发育不成熟以及破产配套制度的缺失,法院只能通过“紧紧依靠政府力量”来回应此类问题,故积极探索出了用于政府和法院沟通协商的府院联动机制,实现对破产案件处理的提质增效。虽