基于卷积神经网络的行人检测与跟踪算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:ZYONGF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能与机器视觉技术飞速发展,行人检测和跟踪技术因其具有重要的学术研究价值和商业价值,受到人们广泛关注,基于检测的目标跟踪算法逐渐成为研究的热点,其中检测器的性能对算法最终的跟踪性能起着至关重要的作用。论文沿用基于检测的跟踪框架,对基于卷积神经网络的行人检测与跟踪算法进行了深入研究,主要研究内容如下:在行人检测方面,针对目前行人检测过程中漏检率高和检测速率慢的问题,在YOLOv3算法的基础上做了如下改进:首先采用K-means++算法,针对实时场景下的行人数据集,聚类出符合行人特点的锚框;其次从改进网络实时性考虑,在YOLOv3网络模型中引入深度可分离卷积,先将通道进行分离,再用逐点卷积扩充通道,最终在保持卷积前后输入输出特征图尺寸不变的情况下,减小计算量;最后引入SENet模块,为了克服由于多尺度预测带来的无效特征增多,导致分类物体相近时误检率较高的缺陷,将SENet模块嵌入到YOLOv3网络预测层中,以增加整个网络对特征的选择和捕捉能力。在行人跟踪方面,采用基于检测的跟踪框架,检测部分采用改进的YOLOv3算法,跟踪部分采用改进的DeepSORT算法。DeepSORT算法对目标的运动和外观信息分别使用不同特征维度的马氏距离和包含深度特征向量的余弦距离进行描述,在此基础上,引入空间距离模型,与马氏距离及余弦距离融合形成新的外观模型作为目标关联依据。实验结果表明,所提出的算法可有效地降低漏检率,同时兼顾了算法的检测精度和实时性。在系统设计方面,根据实际应用的需求,利用Pycharm和Py QT5平台,设计并实现了行人监测系统,并且对系统进行了多种场景下的实验。实验表明,该系统具有较好的鲁棒性,检测效果良好,可以满足实际的应用需求。
其他文献
大数据时代的到来,涌现出大量蕴含丰富语义信息的非结构化文本数据。为了应对海量数据的挑战,关系提取与知识图谱成为自然语言处理领域的重要研究话题。通过关系提取辅助知识图谱的构建,从而实现海量数据的重构,具有重要的现实意义。本文针对关系提取网络中存在的不足,进行了相关研究工作。第一,由于句子结构复杂多样,现有的关系提取网络抽取句子特征的能力明显不足,因此,在特征抽取阶段如何充分学习句子中潜在的关系特征是
随着电子商务的快速发展,为了降低成本,商家将物流业务转交给第三方物流(3PL)公司进行服务。然而随着物流市场的不断拓展,3PL逐渐展现出局限性,存在服务项目单一、信息化程度不高、企业间缺乏合作等问题,难以实现社会资源的优化配置。针对这些不足,第四方物流(4PL)应运而生,它通过整合3PL物流资源,进而满足了复杂的实际运输需求。4PL是一种崭新的物流运作模式,如何利用4PL的资源整合能力降低成本、碳
随着科技的不断发展,各种以生物特征为基础的身份鉴别技术已经逐步民用化、商业化,指纹解锁、虹膜打卡和人脸支付等新型身份认证技术已与人们的生活息息相关。人脸识别技术凭借其无接触、生物特征明显和容易获取等优势而成为当前主流的生物特征识别方法,带来了巨大的社会效益和经济效益,但是另一方面,人脸识别系统遭到攻击的案例也让其安全问题受到重视。在人脸识别系统中,攻击者可以通过伪造用户的面部信息进行攻击,比如通过
在现代工业生产中,随着传感器、PLC和DCS系统的普及与应用,数据和数据处理技术逐渐受到重视。基于数据驱动的多元统计过程监控方法能够在线评估过程运行状态,保障系统的可靠性和稳定性,对提高产品产量和质量具有重大意义。然而实际过程中大量存在的异常值和缺失数据现象,给基于数据驱动模型的过程监控带来挑战。论文研究基于改进潜结构投影(Modified Projection to Latent Structu
在传统系统辨识和状态估计方法的研究中,噪声经常被假设满足一定的概率分布条件,但是随着被研究系统的复杂度越来越高,满足概率分布的噪声往往难以获取,这时假设噪声在一定区间内更能满足实际生产需求.为了减少计算量,加快参数可行集收缩速率,提高参数辨识效率,本文以凸空间结构收缩分析为基础,研究了基于凸空间结构参数可行集滤波的系统参数辨识和状态估计研究算法,这对丰富和发展参数的集员滤波方法具有前瞻的理论意义和
在体验经济时代下,博物馆正从单一的文化收藏展示机构转型为文化交流、社会教育、展览娱乐等功能为一体的综合性场所,并不断丰富人们的精神文化生活。随着移动互联网的深入发展,以智能手机为载体的移动导览系统正成为博物馆文化信息传播的主流媒介,扮演着辅助观众寻求个性化游览体验的智能助手角色。但是,目前多数博物馆移动端导览系统常关注新媒体技术的应用而忽视了用户情感需求的满足,导致在人性化功能和情感化体验建设方面
无线传感器网络(Wireless Sensor Network,WSN)由大量成本低廉、可收集数据的传感器构成,在环境、健康监测和入侵检测等领域得到广泛应用。由于传感器部署的随机性会影响网络的整体性能,且优化的前提是要获取WSN的整体概况,本文研究的边界和瓶颈就是其中最重要的整体信息。根据中介中心性可衡量节点在节点对间的重要性的特点,发现WSN中不同节点对间的最短路径较少经过边界节点,即边界的中介
受贸易政策变化、大流行疫情等因素影响我国针织童装行业发展增速放缓,但行业总体仍处于上升转型阶段,既有着国家“一带一路”倡议、互联网信息化、行业智能化的发展机遇,又有着缺乏创新性、品牌影响力小、消费者需求升级等挑战。今后几年针织童装行业即将迎来发展的黄金期,但对标国外成熟的针织童装市场以及国际头部童装品牌,中国针织童装行业仍处于成长期,针织童装要朝着柔软舒适、健康安全、时尚创新、多功能化、绿色可持续
由于第四次工业革命对工业智能化的需求逐渐增加,多智能体系统的分布式协同控制问题在近年来逐渐受到越来越多的研究者的关注。在多智能体系统的研究领域中,一致性问题是一个研究热点。在过去的许多研究中,研究者们假设多智能体系统所处的环境是理想的,即多智能体系统不会受到网络攻击的影响。然而,多智能体系统对于通信网络的依赖性使其暴露在了网络攻击的威胁中。因此在设计多智能体系统时,考虑网络攻击所带来的影响非常有必
人体行为识别是人工智能、模式识别以及机器学习等领域中最重要的研究方向之一,是计算机视觉和多媒体分析领域的热点研究课题,在安全监控、人机交互、医疗诊断、视频分类等领域都有着重要的学术意义和巨大的应用价值。虽然人体行为识别方法在早期的研究过程中已经取得了较大的进步,但是在实际应用中人体行为识别数据常受到光照变化、复杂背景、遮挡和人体自身等因素的影响。这使得人体行为识别研究始终是十分具有挑战性的课题。现