基于深度学习的行人检测技术研究

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:fengzhongyun22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现今科学技术与人工智能的发展,行人检测技术在计算机视觉领域受到各研究学者的青睐。行人检测技术是步态分析、行人追踪、人体动作识别等研究的基础,在监控安防、车辆辅助驾驶、虚拟现实以及智能机器人等场景都有着广泛的应用。近几年深度学习各方面都取得了突破性的进展,包括更准确快速的目标检测,并且在行人检测方面很大程度上提高了检测性能。相比较传统的行人检测方法,深度学习具有更强的鲁棒性,但是目前仍然存在着在遮挡、多尺度等环境下行人检测准确率较低的问题。本文主要在深度学习的基础上构建更精确的行人检测模型。本文首先构建了基于更快的区域卷积神经网络的行人检测模型。考虑到静态图像在拍摄过程中存在较多低分辨的样本,本文通过直方图均衡化算法进行预处理,增强图像效果;由于Faster R-CNN模型是针对多目标检测,本文则针对行人这一目标,通过修改RPN锚框窗口设置,提取更适合行人的候选区域;针对行人遮挡问题,通过融合卷积多层特征、设置排斥损失函数以及改进非极大值抑制算法辅助Faster R-CNN模型进行行人检测。通过对比实验研究了更快的区域卷积神经网络中各因素对检测性能的影响,并在INRIA数据集和部分Caltech数据集上进行了验证,达到了比较理想的检测效果。然后,为了能够解决在复杂的背景环境中行人多尺度的问题,本文给出上下文细化算法,并与RPN结合,使RPN生成更精确的行人候选区域。另外,利用特征金字塔网络原理,通过上采样的方式将高层信息传给低层,与低层特征融合,并采用在不同特征层独立进行预测,将其分别融入RPN以及Fast R-CNN网络中,有效解决行人多尺度问题。在INRIA、Caltech以及部分补充数据集中的实验表明,本文算法取得了较高的准确率,证明了本文方法的有效性。
其他文献
长期以来,如何更加有效地教授一个单元的核心内容Reading部分,困扰了许多老师。该文以牛津初中英语8B Unit1 Past and present Reading为例,通过在公开课上看到的教学案例,分
马云枝教授系首届河南省名中医、主任医师、教授、博士研究生导师,从事中西医神经系统疾病的临床、科研和教学工作20余a,对帕金森病有较全面、深入的研究。本文依据大量临床
【目的】筛选出对黄瓜花叶病毒(CMV)具有抑制作用的真菌多糖。【方法】采用半叶枯斑法和盆栽试验,测定了猴头菇多糖、云芝多糖、安络小皮伞多糖、灰树花多糖、灵芝多糖、猪苓
<正>噬血细胞综合征(hemophagocytic syndrome,HPS)又称噬血细胞性淋巴组织细胞增多症(hemophagocytic lymphohistio-cytosis,HLH),是由于淋巴细胞和组织细胞非恶性增生分泌
通过氮磷肥效反应二次多项式求得土壤氮磷养分当量(土壤养分供应量相当的肥料量),并得到土壤氮磷养分当量与作物不施肥产量之间极显著的指数回归关系,以估测土壤养分当量。以养分
坏账是指企业无法收回或收回可能性较小的应收账款。由于坏账而发生的损失称为坏账损失。本文主要论述的是坏账准备确认与核算方法以及在会计及税法方面的区别,并通过某上市
VoIP系统中使用SIP协议进行多媒体会话,存在很多不安全因素。文中主要针对SIP协议的身份认证问题,提出采用基于JFK的SIP身份认证机制,以解决使用SIP协议进行呼叫控制时的身份
音乐自然观是我国先民认识自然世界过程中形成的一种独特音乐观念。本文集中讨论了它形成的前提条件,划分了这种观念在先秦时期所经过的三个发展阶段,并在此基础上指出了进行这
张店油田主要以大斜度注水井为主,受井斜、压力、水质等因素的影响,大斜度井分层注水钢丝投捞测试的问题日益突出。现有工艺技术在大斜度井分注中效果不理想,严重制约了大斜
个体责任意识的养成是在一定的价值情境或价值影响中完成的,语文教学有条件提供这样的情境和影响。结合教学实践,由己及人由小及大,从教育学生对自己负责、对家人负责、对社会负