基于前景背景深度区分的行人检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:w119127594
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测旨在从图片或者视频中自动定位行人。在研究领域,行人检测是行人分析任务如行人跟踪、行人重识别等的前置环节。在应用领域,行人检测是自动驾驶、智能安防等系统的重要组成部分。相比人类发达的视觉能力,行人检测算法的错误率还需要进一步降低。行人检测存在两个问题,一是夜间场景下行人置信度低而背景置信度高。二是大规模场景下行人的外观差异性巨大。现有的行人检测算法简单地一对一学习正负样本,缺乏对前景背景的深度区分。针对夜间场景下行人置信度低和背景置信度高的问题,提出了基于置信度回正的行人检测算法。该算法利用行人区别于背景的特征如人体轮廓或者腿部特征来解决行人置信度低而背景区域置信度高的问题。具体地,引入了人体轮廓评估和腿部评估分支来预估建议区域存在人体轮廓或者腿部特征的比例,每次训练以检测框架生成的正负样本为分支的输入,在推断时将该评估比例与原有检测输出的置信度进行加权求和来回正置信度。针对大规模场景下行人巨大的外观差异性的问题,提出了基于特征转换的行人检测算法。该算法主要引入特征空间转换的思想。原始的特征空间没有显式地适应不同外观行人之间的差异,行人外观多样性影响了模型决策边界逼近能力。对比学习能够通过在特征空间中最小化正样本对的距离和最大化负样本对的之间距离来指导特征学习,因此通过对比学习构建一个新的特征空间。在新的特征空间中行人外观差异被消除同时行人与背景的差异被扩大,从而达到前景背景深度区分。具体地,通过对大规模行人数据集的行人特征进行聚类,得到了能够表征大规模行人多样性的标本字典。新的特征空间的训练以标本字典为导向,通过把标本字典与检测网络在训练过程中产生的正负样本进行配对,产生训练对比学习的正负样本对。为了提高对比学习的训练效能,引入了离线在线对比学习训练策略。最后,在推断时还利用标本字典与建议区域的语义距离参与修正建议区域的置信分数。实验结果表明,基于置信度回正的行人检测算法在更有难度的夜间场景下的错误率低于现有的行人检测算法;基于特征转换的的行人检测算法在全天候场景下的错误率低于现有的行人检测算法。
其他文献
目的1.探讨不同B7-H3表达水平肺腺癌患者对EGFR-TKI靶向治疗应答率的影响2.探讨共信号分子B7-H3与肺腺癌(EGFR-TKI)靶向治疗继发性耐药的相关性方法1.采用免疫组化方法检测56例肺腺癌组织B7-H3表达,将其分为低表达和高表达两个水平,并分析了B7-H3高/低表达与一线抗EGFR治疗的临床结局之间的关系。分析的主要标准为总缓解率(ORR)、疾病控制率(DCR)和无进展生存期(P
学位
如今,人工智能正在深刻影响和改变着我们的世界,智能人机交互的发展及应用极大程度上提高了我们的生活质量。语音合成技术能赋予机器像人一样自如说话的能力,是智能人机交互中非常重要的一环。近十年,基于神经网络的语音合成系统可以更快速地合成高质量音频,逐渐成为了主流。在汉语作为母语的同时,英语也逐渐成为我们的第二语言,中英文混读现象日益常见,中英文跨语言语音合成需求越发迫切。然而,主流的语音合成模型往往仅支
学位
近些年来,数据隐私泄露事件频发,隐私泄露造成的危害越来越大,数据隐私保护变得尤为重要。联邦学习可以在保护数据隐私的同时,挖掘数据价值。然而,标签噪声数据严重影响联邦学习模型效果,阻碍联邦学习的应用。目前联邦学习场景下的标签噪声调试研究主要是通过选择数据质量高的联邦节点或者标签正确的样本数据,来减少标签噪声对联邦模型的影响。但是,上述方法难以兼顾过滤数据集的纯度和丰度。节点选择方法没有真正识别噪声数
学位
会话推荐算法根据已知的会话数据,对用户下一时刻可能的行为进行预测,其中会话数据指用户在Web应用上的多个点击等交互行为组成的序列数据。会话推荐算法可以使用用户的单个会话或多个历史会话来进行推荐,一般而言,都需要从用户行为信息中建模出其长期偏好(静态意图)和短期偏好(动态意图)再进行推荐。基于图神经网络的会话推荐将会话转化为会话图,并从中捕获交互项之间的复杂转移关系,从而更全面地建模用户意图。不过当
学位
随着物联网技术的发展和全景成像技术的成熟,全景相机在商场和会展中心迅速普及,涌现出越来越多依托全景图像的视觉应用需求,例如物联网设备可以通过分析视线信息来理解人的行为和意图。目前视线方向识别的研究主要是基于眼球或人脸特征的视线估计方法,面对的大多是受控场景下的视线估计。当面对全景相机所应用的复杂非受控环境时,传统方法视线方向识别精度低,因此本文将研究面向全景图像的多行人视线方向识别,先对多行人目标
学位
背景肺炎克雷伯菌(Klebsiella pneumoniae,KP)是在社区和医院感染中获得的最常见的革兰阴性菌,近年来,高毒力肺炎克雷伯菌(hypervirulent K.pneumoniae,hv KP)感染的发病率和死亡率持续增加。肺上皮细胞针对入侵的病原体有复杂的防御机制,其中Toll样受体(Toll like receptors TLRs)的表达可诱导激活肺上皮抗菌途径及气道炎症反应。有
学位
目的:研究右半结肠癌淋巴结转移的相关规律,探讨淋巴结转移与右半结肠癌分化程度、肿瘤位置、浸润深度等相关因素的关系,并进行相关统计学分析,从而指导临床中右半结肠癌淋巴结相关清扫范围。方法:收集2018年9月至2021年10月在安徽医科大学第二附属医院胃肠外科就诊并实施CME右半结肠癌D3根治术手术共52例患者的临床相关资料,如年龄、性别、肿瘤大体分型、肿瘤浸润深度(T分期)、术前血CEA(carin
学位
人机对话是人类与计算机之间进行交互的主要方式之一。其中,任务型对话系统通过与用户进行对话帮助用户完成预定任务,以其简单便捷的特点被广泛应用。自然语言理解是任务型对话系统的关键模块,其包含意图检测和语义槽填充两个任务,为后续模块提供语义理解支持。现有的对话语言理解方法大多需要收集大量领域特定的标注数据进行训练,才能达到较好的性能。然而随着对话任务场景的快速增加,往往在新领域难以获取到如此庞大的训练数
学位
目的:研究胃肠间质瘤患者血浆外泌体mi RNA和正常人血浆外泌体mi RNA表达差异谱,筛选出间质瘤患者血浆外泌体中特异mi RNA,为进一步研究间质瘤血浆外泌体mi RNA生物学特性提供理论基础。方法:选取2020年6月~2021年6月本院收治的5例间质瘤患者和5名体检的健康人作为研究对象,提取间质瘤患者和健康人血浆外泌体中的mi RNA,采用高通量RNA测序法检测外泌体中的mi RNA,与RN
学位
区块链是一个去中心化的分布式账本,具有去中心化、数据不可篡改、数据透明可追溯等特性,与传统的中心化数据库相比,其具有不可比拟的优势。研究者利用区块链的特性,将区块链应用到其它领域。在研究者利用区块链解决其它领域问题时,忽视了区块链存在的问题。区块链本身查询能力不足,目前仅仅支持查询少数键值的查询,难以支撑区块链作为数据库的高效性。同时,由于区块链上数据是透明的,每个节点都可以访问区块链上的数据,因
学位