【摘 要】
:
针对普通光照条件下的彩色唇读图像,提出了一种结合多种颜色空间及Fisher变换的多级唇部检测定位方法.首先在CbCr空间建立肤色模型进行人脸检测和定位并由人脸几何特征得到唇部大致区域;然后结合唇色特征对该区域进行Fisher变换以使肤、唇色区别明显化;进而根据亮度信息对Fisher变换结果进行预处理后再用Otsu法自动确定二值化阈值,实验结果表明在唇读图像分割中本文方法较经验阈值法更有效;继而在r
【机 构】
:
东南大学生物电子学国家重点实验室,南京,210096
论文部分内容阅读
针对普通光照条件下的彩色唇读图像,提出了一种结合多种颜色空间及Fisher变换的多级唇部检测定位方法.首先在CbCr空间建立肤色模型进行人脸检测和定位并由人脸几何特征得到唇部大致区域;然后结合唇色特征对该区域进行Fisher变换以使肤、唇色区别明显化;进而根据亮度信息对Fisher变换结果进行预处理后再用Otsu法自动确定二值化阈值,实验结果表明在唇读图像分割中本文方法较经验阈值法更有效;继而在rg空间建立唇色模型对二值化结果进行验证以减少虚检;最后,针对低光照肤色部位可能被误识为唇色的情况使用HSV空间中的H分量来进行验证.本文中rg唇色模型和H分量的计算仅在尺寸很小的唇部大致区域进行,其好处是以有限增加的计算量换来了更准确的唇部定位结果。
其他文献
统计了大庆油田近五年应用的4123套潜油电泵机组,针对248件失效泵轴的寿命进行分布检验分析,验证了其符合威布尔分布规律,并进行了可靠性评定.应用编制的工程软件可计算不同样本下泵轴寿命的概率分布规律,确定其可靠性指标,实现对泵轴使用可靠性的定性分析和定量评定,为进一步开展潜油电泵机组可靠性研究提供必要的基础数据和数据处理手段.
针对激光三角测量中物距、像距及系统结构参数间的非线性关系,提出了一种新的激光三角测量的标定方法.通过构建数学模型及图像处理,可得到激光条中心成像在CCD里的图像坐标(r,c)和其对应的世界坐标(y,z)的映射关系,不需推导物像之间的几何关系,并且考虑到镜头畸变的影响.x方向由精密移动测量平台决定,这样就得到了物体的三维世界坐标,可进行三维重构.实验结果证明此方法准确可靠。
使用区分真实照片与人工图片的算法进行图像的预分类与识别,对于提高基于内容的图像和影片检索的成功率有着较大的现实意义.区别于目前大部分相近的侧重于图片宏观特性的研究,本文主要考虑了图片的微观特性,包括纹理的粗细、能量、走向、信息量,以及纹理的颜色、亮度分布等特征,并使用支持向量机(SVM)的算法,对这些指标进行整理,达到了对图像进行分类的效果。
随着光电传感器在舰载武器系统中的大量应用,光电目标的信息处理技术也越来越重要.特别是光电目标自动检测与识别技术,已成为光电目标信息处理中的一项十分关键的技术,对"发射后不管型"的导弹末制导具有重要的意义.传统的最大对比度和模型匹配目标检测与跟踪方法难以满足复杂背景下目标自动检测的需要,寻找新的目标检测与识别方法仍然是一项迫切而艰巨的工作.近30年来,出现的分形理论为光电目标的自动检测与识别提供了新
关节角度的变化能够有效反映人体运动的主要特性.该文提出了一种基于关节角度信息的步态识别方法.首先对运动人体腿部建模,采用最小二乘法拟合边界,获取大腿和小腿关节角度的时序信息;根据步态运动的准周期性,将关节角度时序信息按傅立叶级数形式展开,采用遗传算法搜索各次谐波的系数并进行尺度变换,生成特征向量;最后使用KNN分类器进行分类识别.该文在CMU库上进行实验,得到了令人满意的识别结果,而且当步态发生遮
基于国标中晶粒度的定义,提出一种自动进行晶粒度测量评级的方法.推导了通用的尺寸标定公式,论述了应用该方法过程中进行二值化变换、消除噪声、提取晶界和通过连通区域成分标记及链码表示判断闭合计算晶粒个数,最终进行评级的算法及实现.给出了典型实验结果,并对该方法与国标定义的其它方法作比较.结果表明,该评级方法避免了晶粒度测量评级中人为因素和晶粒大小均匀性的影响,比其他方法如截点法、截圆法等具有更高的准确性
本文将机器视觉系统引入到连续运动的布匹表面色差检测中,并用CCD相机取代传统的分光光度计进行颜色测量.在色差检测的过程中,首先利用异常点检测的方法剔除图像中的奇异点,提取出布匹的颜色特征值,再将该特征值与标准样本比较即可得到色差值.然而,布匹在线检测通常比较的是前后色差,CCD成像系统在实际应用中又往往会受到各种干扰,因此其测量结果在时间上前后并不完全一致.为了克服CCD相机这一缺陷,对标样物颜色
Earth Movers Distance(EMD)算法用计算最小代价的方法来进行相似度度量,具有速度快准确性高的优点.但它度量准确的前提是描述图象的概率模型被合适地建立,传统的直方图方法或矢量量化器(VQ)建立的概率模型不能较好地描述图片包含的信息.本文提出使用高斯混合的期望最大(GMEM)算法进行图象描述,为EMD算法提供更恰当的概率模型(简称为GMEM+EMD算法).实验结果表明这种GMEM
图像盲复原是在降质过程的所有信息或部分信息未知的情况下,利用降质图像的特征来估计原始图像和降质点扩散函数(PSF)的过程,对降质PSF的类型和参数进行识别称为模糊辨识技术,它是图像盲复原的关键.本文设计了一种基于频域零值的散焦与运动模糊模型参数求解的详细流程,利用由散焦模糊与运动模糊造成的降质图像对本文算法的性能进行了验证,实验结果表明本文算法是可行且有效的。
针对数字图象稳定应用对于实时性的要求,本文提出了一种基于下采样和亚象素相位相关性的全局运动估计算法.该算法能够有效降低运动估计的计算负担,并且与基于子图象的相位相关方法相比,本算法在运动估计范围和抗干扰能力方面都有着明显的优势。