【摘 要】
:
针对目前服务机器人手势交互方法在输入方式自然性和识别方法可靠性方面的不足,提出采用结合人脸和人手的姿态作为输入方式,实现了一个基于最优有向无环图支持向量机(DAGSVM)的手
【基金项目】
:
基金项目:国家重点基础研究发展计划(973)项目(2002CB312200),国家高技术研究发展计划(863)项目(2004AA420110)
论文部分内容阅读
针对目前服务机器人手势交互方法在输入方式自然性和识别方法可靠性方面的不足,提出采用结合人脸和人手的姿态作为输入方式,实现了一个基于最优有向无环图支持向量机(DAGSVM)的手势识别系统。系统采用分步细化特征检测过程,即先粗检肤色,然后分别利用人眼Gabor特征和人手边缘小波矩特征检测脸和手部,可克服背景中的肤色干扰,并显著提高特征提取的可靠性;综合利用脸手区域不变矩和手的位置信息组成混合特征向量,采用优化拓扑排序策略组织多个两分类支持向量机(SVM),构成最优DAGSVM多分类器,达到比普通DAGSVM更
其他文献
对军事目标进行分类是整个SAR ATR过程中最困难的任务。为了进一步提高MSTAR SAR目标的识别效果,在分析了MSTAR SAR图像特点的基础上,提出了一种利用离散小波分解提取目标特征的方法。由于小波分解后的低通近似系数虽然是一种较低分辨率的SAR图像,但是它仍然包含了SAR目标回波的能量,而高通细节系数则包含了目标的细节成份和噪声,因此,可将小波分解后的低通近似系数作为特征,并利用由决策导向
在基于块的帧速率上转换算法中,块尺寸直接影响运动估计的准确性及插值帧的视觉效果。为此,提出了一种运动自适应的帧速率上转换算法。通过引入STGS图对视频内容进行预分析,根据运动特性自适应选取适合每一帧图像的块尺寸,进行重叠的块运动估计。并针对失真易产生在块边缘的特点,对块边缘的运动矢量进行插值细化处理,平滑运动矢量场,减轻人眼敏感的块效应。实验结果表明,该算法整体性能优于传统的固定块尺寸运动估计的帧
通过分析ROF(Rudin,Osherand Fatemi)模型和LLT(lysaker,lundervold and Tai)模型在处理噪声图像时存在的缺陷,以及纹理部分和噪声部分之间的差异,将图像分解思想和ROF模型与LLT模型相结合,提出了一种新的分解去噪模型:DD(decomposition and denoising)模型。该模型在处理噪声图像时,将噪声图像分解为结构、纹理和噪声3部分,
肝脏是结直肠癌最常见也最重要的转移部位,而肝转移是结直肠癌治疗失败最重要的因素之一.手术切除治疗结直肠癌肝转移(CRLM)疗效确切,但手术切除率低且复发率高,化疗、放疗副作
胆囊癌是胆道系统最常见的恶性肿瘤,发病隐匿,早期诊断困难,预后极差。近年来,对胆囊良性病变癌变的研究成为热点,胆囊结石和慢性胆囊炎被公认为胆囊癌的发病因素,但是对于引起胆囊
鉴于2维张量积小波已被证实不能为分片光滑图像提供理想表达,从而促使了近年来各种"超越小波"的变换理论和方法的出现。其中轮廓波变换因其理论新颖、技术思想先进、实效显著而具有深入研究的前景和潜力。为了使人们对轮廓波变换有一概略了解,首先以轮廓波变换原理及变换域隐马尔可夫模型为主线,并对关键点给出了详细论述;然后从宏观角度对轮廓波变换进行了深入浅出的综述;最后通过与小波变换的应用对比、分析,指出了轮廓波
针对近邻关系保持嵌入(NPE)算法易于受到降低后的维数影响,而且性能依赖于正确的维数估计的问题,提出了一种正交化的近邻关系保持的嵌入降维方法——ONPE。ONPE方法是使用数据点间的近邻关系来构造邻接图,假设每个数据点都能由其近邻点的线性组合表示,则可以通过提取数据点的局部几何信息,并在降维中保持提取的局部几何信息,迭代地计算正交基来得到数据的低维嵌入坐标。同时,在ONPE算法的基础上,利用局部几
概率图模型及其应用作为一个具有挑战性的研究领域目前已成为一个新的研究热点。概率图模型为解决智能信息领域的不确定性问题提供了重要途径。尽管目前概率图模型还处于不断发展之中,但近年来基于概率图模型的图像和视频智能信息处理的应用研究受到人们的关注,出现了许多有效的算法,这些算法为解决一些传统的图像和视频智能信息处理问题提供了新的途径。本文首先对概率图模型的3种重要表现形式、特性和主要技术进行了分析和讨论
AVS是我国具备自主知识产权的第2代信源编码标准,是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,在未来中国数字音视频产业中有广阔的应用前景。设计并实现了一套基于AVS视频编解码技术的视频监控系统,可以对AVS视频流自动进行处理。该系统结合AVS视频编解码、背景/非背景分类、人脸检测与识别等技术,可输入文本、图片和视频段对出现在监控视频中的人物进行身份的自动识别,并引入两级索引结构以达
在可视化技术中,人们常试图从3维图像中抽取特定的等值面,以近似表示3维图像中所包含目标的边界曲面。考虑到实际的3维图像中,某些目标的边界曲面可以被特定的等值面很好地逼近,但是由于许多目标的边界曲面事实上难以被任何等值面很好地逼近,因此,识别3维图像中哪些边界曲面可以被特定的等值面很好地逼近就成为可视化技术中一个非常重要的研究问题。为了准确地判定哪些边界曲面可以被特定的等值面很好地逼近,特提供了一个