监控场景下的行人检测研究与系统设计

来源 :东北石油大学 | 被引量 : 0次 | 上传用户:tecra1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为计算机视觉领域的具有挑战性的课题,行人检测是利用相关算法对图像或视频中的行人目标进行定位及识别的技术,是行人重识别、行人步态分析、行人姿态分析等技术的研究基础,在工业界拥有众多的应用场景。在自然场景下进行行人检测较为容易,不同于自然场景,监控场景受到分布式的前端摄像头部署、监控视角、背景杂乱和行人目标身体非刚性的影响,出现行人区域遮挡、行人姿态和尺度多变等复杂现象,极大增加了行人检测的难度,其中,作为行人检测领域中的关键性问题,行人区域遮挡具有一定的挑战性。本文首先设计了融合多尺度注意力的特征增强模块(Multi-scale Attention Feature Enhancement Block,MAFEB),其次构建了基于MAFEB的中心点与尺度预测行人检测方法,最后基于以上理论基础设计并开发了智能视频监控系统,完成在监控场景下对行人目标的精准检测。本文主要研究工作具体如下:1.设计融合多尺度注意力的特征增强模块针对监控场景下的遮挡问题,本文设计了融合多尺度注意力的特征增强模块,该模块利用预处理的行人目标可见区域标注作为外部监督信息,对不同尺度特征图的注意力特征进行空间域的调制,使特征提取网络将注意力主要聚焦于遮挡行人目标的可见区域,进一步充分提取有限的行人特征,对无用的遮挡区域特征表达进行抑制,最终提高边界框预测的精确性。2.构建基于MAFEB的中心点与尺度预测行人检测模型本文将MAFEB作为附加组件嵌入到中心点与尺度预测行人检测模型中,构建了基于MAFEB的中心点与尺度预测行人检测模型。该模型在特征提取阶段后,利用MAFEB对不同尺度特征图进行注意力特征调制,增强特征图中目标可见区域特征表现力,引导网络模型重点关注遮挡行人目标的可见区域,削弱遮挡部分对网络模型特征提取过程的抑制作用,促进行人特征的抽取与表征,为后续边界框预测部分生成行人目标中心位置,高度以及中心位置偏移量提供更为准确的分类引导。3.设计并开发智能视频监控系统基于上述监控场景下针对遮档问题的行人检测方法的研究成果,本文设计并开发了智能视频监控系统。系统设计遵循服务层、用户层、消息层、算法层和流媒体层的业务分离架构模式,实现了实时视频监控、图片/视频行人目标检测和行人目标裁剪存库等功能,能够满足监控场景中遮挡行人检测与系统功能性扩展的需求。
其他文献
随着载人航天技术的日益发展,中国空间站顺利拿到通往太空的通行证,空间站运行期间需要灵活的机械臂配合末端执行器提供在轨维护、在轨装配及性能升级等在轨服务。末端执行器作为在轨服务的关键环节,投入成本巨大,风险系数高,为了确保太空服役时捕获可靠性,地面捕获性能测试是必经阶段。为了地面模拟末端执行器空间捕获过程,检测末端执行器在工作环境中的捕获容差性能,本文基于半物理仿真的方法研制了一套末端执行器捕获容差
学位
根据油气生产过程中的套管损坏影响因素众多、数据复杂等特点,通过数据预处理、随机森林重要性分析等技术对现场数据进行分析与整合,采用特征工程的方法处理缺失值并选取特征参数。针对传统机器学习模型对套损预测不佳的问题,提出基于Stacking思想的集成学习预测模型;该模型采用随机森林、支持向量机、梯度提升决策树和K近邻算法为基模型,逻辑回归为元模型,以此构建泛化能力更强的套损预测模型。结果表明,该模型较于
学位
目的:探讨吞咽口肌生物反馈训练结合吞咽低频电刺激对脑卒中后吞咽困难患者的治疗效果。方法:选取2020年10月1日—2021年10月1日暨南大学附属广州红十字医院昌岗康复二区收治的107例脑卒中后吞咽困难患者作为研究对象,对患者进行吞咽口肌生物反馈训练结合吞咽低频电刺激。比较治疗前后患者洼田饮水试验结果、吞咽功能评分、生活质量评分。结果:治疗后,107例患者治疗后洼田饮水试验结果Ⅲ级占比低于治疗前,
期刊
仿人灵巧手能够模拟人手的抓取操作,是一种通用的末端执行器。目前的灵巧手根据驱动器布置主要可以分为驱动器外置式和驱动器内置式,驱动器外置式灵巧手手部结构轻便,驱动器布置在前臂,通过绳索机构传动,但存在预紧标定困难,维护不便等问题;内置式灵巧手集成度高,但自由度数目受空间限制,通常以耦合机构连接手指末端两关节。这种设计适应抓取物外形的能力较弱,拟人性较为一般;部分全驱动灵巧手保证了灵巧性,但牺牲了部分
学位
目的 分析针灸联合康复疗法对脑卒中患者吞咽困难及流涎症状的影响。方法 选取我院收治的脑卒中90例,随机分为对照组和观察组,各45例。两组患者均行常规药物治疗、健康指导及康复疗法,观察组在常规治疗基础上再予以针灸治疗,两组患者均连续治疗1个月。比较两组患者治疗前后行洼田饮水实验测试、Frenchay构音障碍测评量表中的流涎维度测评,根据测评结果评估吞咽困难及流涎症状临床疗效。结果 治疗前,两组患者洼
期刊
目的 探讨九步口腔操锻炼对改善脑血管病后吞咽困难患者饮水进食及全身营养状况的临床价值。方法 选择2017年1月至2021年4月本院收治的脑血管病后吞咽障碍患者80例,按照随机数字表法分为两组,各40例。对照组实施常规护理,如加强患者营养支持、早期康复训练等,观察组在对照组基础上联合九步口腔操干预,比较两组干预后主动参与功能锻炼及康复学习得分、两组吞咽功能相关指标;比较干预1个月后随访两组能量代谢指
期刊
随着时代不断发展,人工智能技术愈发重要,知识图谱是人工智能技术的重要组成部分。知识图谱作为一种全新的知识组织与表示方式,企业和组织对其格外关注,企业和组织将知识图谱作为底层数据的表示和组织方式,充分利用知识图谱的优势,将知识图谱用于问答系统、推荐系统、信息检索系统,石油领域的企业也不例外,利用知识图谱相关技术已经成为当前数字化变革的新方向。但是,当前对于知识图谱的研究主要是在构建和使用这两方面,在
学位
感官信息反馈可以实现灵巧假手的闭环控制,提高患者的假肢操作性能及体验感。然而,由于残肢患者缺少残肢端的感受器,对外界信息的感知通路较窄。传统侵入式模态匹配假手感知方法存在个体差异性较大、有手术风险等缺点,而传统跨模态匹配感知方法也存在患者认知负荷高及延迟和脱敏等问题,难以被广泛应用。基于视觉反馈模式,本文提出了一种基于增强现实技术的手部感知反馈方法,旨在建立直观便捷的感知反馈通路,减轻患者的认知负
学位
当前“人工智能”已经开始逐步走向实验室,并开始商品化、规模化的应用。以人工智能、物联网、大数据等高科技技术为基础的智慧油田是目前石油领域的发展方向。石油相关企业和组织都对其格外关注,石油企业充分利用新技术的优势,将其普遍用于油气开采、员工培训、井下作业等方面。在此基础上,认知图谱应运而生。认知图谱是集认知心理学、脑科学等学科于一体的新型认知引擎。它运用认知表征、提取、推理和计算等新理论和新方法,形
学位
准确表征致密砂岩储层的孔隙结构特征,对于提高致密砂岩储层的勘探开发水平、增加致密砂岩油气产量等实际问题具有重要意义。在此基础上,开展了致密砂岩储层的孔隙研究。在致密砂岩CT图像研究中,由于复杂的沉积作用和成岩作用,致密砂岩储层孔隙结构复杂,设计一个性能优异的孔隙分割系统尤为重要。为此,本文通过研究孔隙区域的特性,结合传统机器学习和图像处理方法,对致密砂岩的孔隙区域进行分割,从而科学地协助油田开发人
学位