【摘 要】
:
手势是人机交互中最自然和直观的沟通方式之一,基于计算机视觉的手势识别已经成为主流。但此类方法存在人手分割不准确和旧手势识别模型不能快速迁移于新用户等问题。本文采用并行工作的双深度摄像头进行手势识别,提出了双深度摄像头的对齐方法和基于球体模型的人手分割方法,实现了人手的准确分割:同时,提出了一种自适应自迭代的在线增量式极速学习机,使得系统能够在记忆原有手势识别模型的基础上,实现新增手势对旧模型的修正
【机 构】
:
中国科学院计算技术研究所,北京 100190 中国科学院研究生院,北京 100190 中国科学院计
【出 处】
:
第九届中国计算机图形学大会(Chinagraph‘2012)
论文部分内容阅读
手势是人机交互中最自然和直观的沟通方式之一,基于计算机视觉的手势识别已经成为主流。但此类方法存在人手分割不准确和旧手势识别模型不能快速迁移于新用户等问题。本文采用并行工作的双深度摄像头进行手势识别,提出了双深度摄像头的对齐方法和基于球体模型的人手分割方法,实现了人手的准确分割:同时,提出了一种自适应自迭代的在线增量式极速学习机,使得系统能够在记忆原有手势识别模型的基础上,实现新增手势对旧模型的修正,并加以自适应时效机制,以最大化新增手势对旧模型的贡献。使旧模型快速迁移于新用户。实验表明,本文提出的基于双通道深度融合的自适应手势识别方法能够识别用户在自然姿态下的手势,并能够在短时间内自动适应新用户,对新用户达到更高的手势识别准确率。
其他文献
本工作针对卷烟加香产品,采用大颗粒(40~60目)ZC-305型高孔容SiO2,通过超临界萃取一负载一体化装置,以其制备薄荷醇/SiO2负载型产品.研究表明,大颗粒高孔容SiO2对薄荷醇的负载量为1.10g/g.采用25.0℃、低压氮气对大颗粒的负载样品进行吹扫结果表明薄荷醇的保留率较高(达到84.3%);采用40.0℃、低压氮气对大颗粒负载样品进行短时间吹扫(10min),薄荷醇保留66.2%,
白炭黑是一种人工化学合成白色无定形二氧化硅总称,主要是指沉淀二氧化硅、气相二氧化硅。白炭黑作为一种重要的橡胶工业补强填料,广泛用做橡胶及橡塑制品的补强剂,硅橡胶制品中的补强剂,化妆品中的抗紫外剂,牙膏中的增稠剂和摩擦剂,涂料和不饱和树脂增稠剂。本文介绍了2011年国内白炭黑的产能状况,然后分析了市场消费和科技进步的影响,最后总结了发展趋势。
多维形式常用于有效地表达图像信号特征,在移动估计中,多维将降低运算效率。运算时间与准确性是信号移动估计中两个重要问题,平衡时间与准确性相当重要。 移动估计中,减少空间分配维数与提高估计运算效能是重要环节。实际系统应用中,为提高参考图与对比图中匹配块窗口内各元素信息的相关性描述,常选择较大窗口,大窗口意味着计算复杂度增加。本文首先分析内存分配与运算中数据维数与时间关系。并扩展和表思想,构建绝对差和
运动捕获数据是虚拟人仿真与动画的重要数据来源,随着运动捕获设备的普及,人们积累了大量的运动捕获数据,这些数据包含了丰富的人体运动,形成了较大规模的运动数据库。本文提出一种方法。能够比较不同运动数据之间相似程度,这种方法基于主成分分析方法,对运动数据进行PCA计算,得到表示该运动数据主轴方向的特征向量和对应的特征值,将运动数据之间的相似性比较转换为对其主轴方向重合程度的比较,给出了基于四元数表达的运
针对两个刚体之间的三维几何约束求解问题,依据几何约束的参数结构分析了角度约束和距离约束的解耦性。给出了角度约束和距离约束可解耦求解的条件:然后对两个刚体之间的几何约束进行组合分析,总结出约束度不小于2的几何约束构成的组合只有几十种,且均可采用几何推理方法进行求解:最后阐述了附加方向约束、冗余约束和矛盾约束对数值求解的不利影响,提出了三维几何约束组合的分类求解策略,并用实例验证了该求解策略的有效性。
脑血管疾病是人类致死的第一大疾病,极大地威胁着人类的健康。 通过医学影像以非入侵的方式实现脑血管的提取具有无创、高效的特点,可被病患广泛地接受。文章提出一种脑血管层次粗分割方法,逐层递进地提取备选血管体素及与之灰度相近的脂肪体素,降低非血管体素干扰,提高精度。算法首先应用DwM滤波和各向异性扩散滤波,在去除脑图像噪声的同时保存血管边缘信息。融合血管灰度空间和形变模型信息,提出层次化粗分割模型。实
本文针对工程图中的平行、相切、垂直、轴对称、共线、竖直对齐、水平对齐以及等圆共八种几何约束提出了一种约束识别算法。算法先使用一系列与约束类型相关的聚类来构造一个初始约束集合,该集合能够保证其部分子集内部没有约束冗余:对此集合进一步筛选即能得到完全无冗余的目标约束集合。文章展示了算法对实际工程图纸的约束识别结果,以及基于这些约束进行约束求解的效果。
图元装配是图形流水线中的关键环节,为了提高图形流水线的渲染效率和质量,快速准确地产生图元成为重要因素之一。本文立足当前图形流水线的要求,兼容OPENGL中的图元类型,采用verilog语言完成图元装配单元的硬件实现:同时采用SystemVerilog语言进行行为建模,使用BFM(BUSFunctionalModels,总线功能模型)构造层次化的验证环境,实现模块的复用性,完成图元装配单元的功能验证
本文提出一种图像分存方案,将秘密图像分存到n份分存图像中,其中需要至少k份分存图像才可以重构出原始秘密图像。本文所提出的方案不需要置乱操作,且依然可以保证分存方案的安全性。本文方案生成的分存图像不暴露秘密图像的任何信息。为了实现无损重构且不需要牺牲额外像素,本文选择有限域GF(28)代替GF(251)。另外,本文使用辅助表预先存储有限域GF(28)上的计算结果,以提高方案的计算效率。在重构过程中,
地面全景图的用途十分广泛,但是由于其对视觉效果和地理参考意义的要求,使得用低空地面图像来自动生成地面全景图面临诸多挑战。这些挑战主要来源于两点: 拍摄高度较低,地表和地物不能看作在同一平面;使用低空无人飞行器或者人工拍摄时照相机可能存在不同程度的倾斜。为此,我们提出将双目立体视觉引入地面全景图的生成中,在无任何辅助传感器的情况下克服它们带来的不利影响。我们首先使用已标定的双目摄像头拍摄地面图像,