面向智能视频监控的Shape Context算法的研究与应用

来源 :东华大学 | 被引量 : 2次 | 上传用户:yidao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向人的视频理解尤其是对人脸进行分析,是计算机视觉技术研究中的一个热点与难点。对于视频监控系统来说,大多数应用情况下主要的监控目标是人。因此面向人、尤其是人脸的视频理解技术也是视频监控系统实现智能化的基础。本文对智能视频监控的相关技术进行了探索和研究,重点对于视频监控中的目标识别和人脸匹配进行了研究和探讨。形状匹配是计算机视觉和模式识别的一个基本问题,它被应用到很多领域,如目标识别、基于内容的图像检索等。传统的Shape Context算法用于对简单图形进行形状匹配。本文从人脸这一低层视觉角度以智能化视频监控应用为背景对形状匹配进行研究,将Shape Context的形状匹配技术,运用到人脸形状匹配中。本文对边界提取算法进行改进,满足人脸的轮廓边界的复杂性要求。先采用扩散滤波技术进行预处理操作,模糊图像的细节,获得的边缘具有更好的光滑质量,增强、保留了重要的边缘特征信息;在此基础上,再使用改进的边缘检测和轮廓提取算法,使边界点既尽可能少地提取了轮廓特征点,又更好地保留了重要的特征点。本方法基于Shape Context算法,利用了对数极坐标变换的二维不变性,使形状匹配算法具有二维不变性,克服了传统形状匹配算法的缺点。实验证明,本方法是一种适用智能视频监控的稳定而有效的形状匹配方法。最后,将Shape Context人脸形状匹配处理算法和其他高级图像处理技术整合到诚丰公司的全IP网络智能视频监控系统中。其中的人脸检测跟踪及报警模块能够获取运动的人脸目标,跟踪并记录人脸目标信息。在人脸检测目标判断之后,能够使用高速球进行PTZ跟踪,对可疑目标进行高清晰特写拍摄,离线使用Shape Context进行人脸形状匹配。
其他文献
近年来,国内电信运营商的盈利点已经由传统的单一的语音业务转变为以语音业务为主,数据业务和增值业务并重的多元化趋势。区别于话音业务,数据业务种类多,业务划分复杂,数据
在信息时代的今天,手写数字识别技术在文献检索、办公自动化、邮政系统、银行票据处理、表格录入等方面有着广阔的应用,因此手写数字识别技术的研究具有重大的现实意义。由于识
面向服务的体系结构(Service Oriented Architecture,SOA)是新一代的框架思想,由于它具有良好的松耦合、与平台无关等特性,很好的解决了系统的灵活性和互操作性。同时,作为SOA的一
随着因特网和电子商务的推广,信息交换的安全性日益重要。保证信息安全的最方便的办法是密码学。经典密码学分为公钥密码和私钥密码两大体系。私钥密码长期存在如何在通信双方
语音识别技术目前在嵌入式系统中的应用主要为基于小词汇量的孤立词语音识别。语音命令控制,广泛用于家电语音遥控、玩具、智能仪器及移动电话等便携设备中。人们期待着连续
聚类分析是数据挖掘领域一项重要的研究课题。近年来,数据流在很多领域得到应用,数据流聚类也成为了一项意义深远而且很有挑战性的技术。与传统的静态数掘相比,这些数据是高
逆向工程是目前CAD/CAM领域内的研究热点之一,而数据分块是逆向工程技术中的关键环节和难点问题。数据分块是指曲面重构中按点云分布形状特征对点云数据进行区域分割的基础过程
PSO是一种基于群体智能的随机启发式优化算法,作为群体智能的典型代表,它具有原理简单、参数少、收敛速度较快等特点,并且算法程序实现简单,已被证明是一种行之有效的全局优
本文分别对电力通信网MPLS网络和变电站IEC61850网络进行研究。论文针对Linux内核中的流量控制机制进行分析,结合区分服务模型,通过分析区分服务(DiffServ)模型的体系结构,研
MUD的全称为Multiple User Dimension(多用户层面),即由计算机程序实现的多用户参与活动和交互的环境。也有人称之为Multiple User Domain(多用户虚拟空间游戏),因为就目前来