步态特征精密提取与身份认证(英文)

来源 :纳米技术与精密工程 | 被引量 : 3次 | 上传用户:xiangqi520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为更有效地检测人体目标,弥补单一模型在步态特征提取中的不足,提出了基于双模型的步态特征精密提取方法,且构建了基于步态特征进行身份认证的门禁监控实验平台.首先从摄像机捕获步态视频输入计算机,发现人体目标后对其进行检测与跟踪;然后分割人体轮廓并将其规格化叠加处理获取步态特征图;为精确提取步态特征,将人体整体模型与简化模型相结合,提取步态参数作为识别参量输入支持向量机(SVM)进行分类识别,正确识别率(PCR)为77%~80%.结果表明该方法有助于步态特征的精密提取,且实验平台能较好地自动监控人体目标并进
其他文献
提出一种无失真图像逐步传输法,该方法改进了Chang等人的早期PIT方法。原方法由于没有考虑到各图像区域的意义,解码初期的图像质量不够理想。为此,提出以"优先位图"表示区域的复杂度,利用这种优先位图可在传输的初期就将图像的重要特征发送给接收方。实验结果表明,该方法在峰值信噪比和视觉质量两方面均优于过去的无失真图像逐步传输方法。
期刊
将商空间粒度计算理论引入到了图像检索领域,提出了一种新的图像检索方法。首先针对彩色图像在不同粒度下的表现得到不同粒度下的颜色特征,获得不同的商空间,然后根据商空间粒度合成原理对已得到的商空间进行合成,进而以合成后的属性函数来完成图像检索。与采用单一颜色特征的图像检索方法相比,采用多粒度颜色特征的图像检索方法能够在更大程度上利用图像自身所提供的信息,实验结果验证了该方法的可行性和有效性。
期刊
羊绒与细羊毛的主要辨识依据是两者的表皮鳞片模式。该领域内常用的一项技术是分析纤维的SEM图像,通过鳞片边缘高度来区分两类纤维,但其成本高昂,且有8%的误差。该文提出区分两类纤维的新方法,首先将显微摄像系统获取的纤维图像处理成单像素宽度的二值骨架图,通过该二值骨架图提取纤维鳞片的4个相对形状参数,构建贝叶斯分类模型。数值实验表明,尽管该模型是基于光学显微镜的,但其分类性能却相似于基于扫描电镜的模型,
期刊
二值图像恢复往往按灰度图像恢复和阈值分割两步来处理,效果不佳。该文利用二值图像的特有性质,提出一种二值图像恢复的非线性正则化方法。同Tikhonov正则化方法不同,该文提出的方法最终归结为一个非线性最优化问题,并采用全局Barzilai和Borwein梯度算法求解此优化问题。实验结果表明,该文的二值图像恢复算法是可行的、有效的。
期刊
In radio frequency identification (RFID) systems,tag collision arbitration is a significant issue for fast tag identification. This article proposes a novel tag anti-collision algorithm called framed
期刊
该文分析讨论了连续语音识别系统中的快速高斯计算问题。语音信号的短时平稳特性,使得相邻语音帧可能共享相似的分布。最大概率增量估计算法利用该特性,估计当前帧与基准帧间似然值增量的最大值,以减少似然值的精确计算量。该文针对该算法中增量上界被高估的问题,在增量上界平滑、最优G auss候选、风险因子设定等方面进行了改进。实验结果表明,在几乎不损失识别率的情况下,改进后的M P IE算法可节约40%的维数计
期刊
为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接
传统的语音识别置信度方法基于各种静态特征进行分类判决,而忽略了词与周围环境之间的关系所携带的信息。为了进一步提高置信度特征的分类性能,该文提出了上下文环境、动态环境、句全局环境共3类5种环境特征,从空间与时间角度较全面地描述了词与环境之间的关系。实验结果表明:静态特征与环境特征联合分类的性能与只用静态特征相比有不同程度的提高,其中,静态环境与环境特征的二元联合最高有5.02%的相对改进,三元联合最
期刊
该文介绍了面向普通话情感变化检测的情感语音数据库CESD。该数据库的语音以对话形式录制,包括男女声情感对话语音1 200段。以生气、着急、中性、愉悦、高兴为基本情感,共包含20种情感变化模式。除语音文件外,还包含带有静音段/有效语音段、情感类别、情感变化段、情感质量等内容的标注文件。为了使更多的研究人员可以使用该数据库,利用P raat工具提取出67维常用声学特征,作为特征文件一同存储在该数据库中
期刊
本文提出了一种新的RGB图像掩密算法。该算法引进了在每个像素的三个色通道(R、G、B)分别存储可变位数的概念,这个可变位数(Bit)是由像素的实际颜色值决定的,即较低颜色值的色通道可存储较大的位数量。与其他现有算法相比,该算法能够为掩护媒体提供一个相对大的存储量。本实验结果证明了该算法的优越性,同时还给出了与其他图像掩密算法的对比结果。
期刊