【摘 要】
:
人机交互自其诞生以来极大地丰富了用户体验。在人机交互领域,对人体骨骼的追踪已经变得越来越重要,这主要是由于它们在医疗,生物医学,人机界面,虚拟现实,机器人技术等领域的应用。手作为人体骨骼中最灵活的关节,被认为是最方便,最有效的交流工具,因此基于手部运动的人机交互一直是人机交互领域中极为重要的一部分。深度传感器Kinect的问世为基于手部运动的人机交互技术注入了新鲜血液,带来了更为便捷的用户体验,但
论文部分内容阅读
人机交互自其诞生以来极大地丰富了用户体验。在人机交互领域,对人体骨骼的追踪已经变得越来越重要,这主要是由于它们在医疗,生物医学,人机界面,虚拟现实,机器人技术等领域的应用。手作为人体骨骼中最灵活的关节,被认为是最方便,最有效的交流工具,因此基于手部运动的人机交互一直是人机交互领域中极为重要的一部分。深度传感器Kinect的问世为基于手部运动的人机交互技术注入了新鲜血液,带来了更为便捷的用户体验,但是在人机交互的实际应用场景中,该项技术在实时性、准确性、鲁棒性等方面还存在许多挑战。为应对这些挑战,本文研究了真实应用场景中基于Kinect的手部运动追踪,主要研究的是手部运动时手的方向和指尖的位置这两大特征,其主要研究内容如下:针对手方向估计时的实时性差以及准确率低问题,本文设计了一种基于欧拉角的手方向估计方法。首先利用Holt双指数平滑滤波算法来平滑Kinect的骨骼数据,并根据骨骼数据定位到手腕点,然后将四元数转换为代表手方向的欧拉角。由于欧拉角存在噪声且不稳定,本文采用了一种将卡尔曼滤波和中值滤波结合的方法对欧拉角进行滤波。实验结果表明,该方法对Roll,Pitch,Yaw三个欧拉角原始数据的方差的减小程度更大,分别比卡尔曼滤波多减小11%,14%,15%,从而使欧拉角的稳定性更好。通过在彩色图像对手方向进行估计以及运用Open GL构建一个3D手模型来实时地模仿手的运动,验证了本文设计的基于欧拉角的手方向估计方法能够实现实时、准确地估计手方向。针对指尖检测准确率不高的问题,本文设计了一种将测地线距离和凸包结合的方法。首先利用手指合并和分开时手的凸包缺陷最大深度值的不同来区分手指是合并还是分开的状态,并利用标志位对这两种状态进行标记,然后根据标志位的不同确定不同的指尖检测算法。实验结果表明,该方法在手指合并包括四指合并或者两指合并、手指分开,手弯曲、旋转、张闭等多种情况下都能够准确识别指尖的位置,准确度较高,且在手掌反对着Kinect和昏暗环境下也有较好的效果,鲁棒性较强。
其他文献
目标跟踪技术当前是计算机视觉领域的一个重要的研究方向,在智能交通、视频监控、人机交互和自动驾驶等系统中广泛的运用。人为给定跟踪目标的初始信息,视觉目标跟踪算法能够准确地预测在接下来连续视频帧序列中跟踪目标的具体位置、尺度变化和行动轨迹等动态信息。跟踪场景种类繁多,背景环境复杂且多变,并且目标运动必然会产生形变、遮挡、模糊等问题,因此建立一个既准确鲁棒又满足实时性的视觉目标跟踪系统一直被认为是极富有
X射线计算机断层成像技术(X-ray Computed Tomography,CT)是一种临床常见、可提供清晰人体解剖结构图像的诊断工具。虽然限制CT设备扫描角度可有效降低患者所受电离辐射,但会导致在某些扫描角度上投影数据的部分缺失,最终使得重建出的CT图像质量大幅下降。因此,如何在CT投影数据不完整情况下重建出符合临床诊断需要、高质量的CT图像具有重要的社会价值和理论研究价值。为了提高部分扫描角
作为口腔临床诊断的重要工具,X线头影测量分析技术首先需要定位投影测量图像中的解剖特征点。由此可见,特征点的定位精度会对后续的口腔临床诊断产生重要影响。目前临床上仍然主要采用人工方式对特征点进行标记,定位速度慢、精度上受到主观因素影响较大,无法应对目前国内口腔临床日益剧增的门急诊量。因此,发展X线头影测量图像解剖特征点自动定位技术有重要理论价值和临床应用前景。为了提高X线头影测量图像解剖特征点定位速
随着深度学习的再度兴起,深度神经网络尤其是卷积神经网络在计算机视觉、自然语言处理等领域展现出极大的优势,广泛地应用于图像分类、目标检测、语义分割、语音信号处理、医学图像分析、遥感图像分析等实际应用及许多边缘计算场景。本文的主要研究内容如下:(1)在检测起重机表面锈蚀缺陷的各类方法中,人工巡检效率低下、传统手工设计特征的目标检测方法检测准确率较差。YOLOv3是一种更适用于边缘计算场景的快速目标检测
水彩画由于丰富的艺术表现力,在非真实感绘制领域备受关注。传统的水彩风格化算法能实现对水彩艺术效果的真实渲染,但算法复杂度较高,仅适用于高性能的台式设备。本文提出基于智能手机的水彩风格化绘制技术的研究,从绘制效果和算法效率的角度出发,在智能手机上实现对水彩画艺术效果的真实、高效模拟。本文的主要工作包括提出了一种水彩风格化绘制算法框架,研究了风格化绘制算法的优化方法,实现了一个基于Android手机平
JavaScript是Web前端开发中最主要的程序设计语言之一,在TIOBE发布的程序设计语言排行榜中长期居于前列。作为一种解释型语言,JavaScript的代码经内嵌在Web浏览器中的JavaScript引擎解析后执行。目前已存在诸多JavaScript引擎,其中V8、SpiderMonkey和Chakra的使用最为广泛,三者的市场占有率之和高达84%。被正确实现的JavaScript引擎是Ja
卷积神经网络在通用目标检测任务中取得了优异的表现,但在解决小目标检测这类任务时仍面临较大的挑战。作为自动驾驶、智能安防等重要任务的下游基础,小目标检测的难点主要在于待检目标的尺寸小、分辨率低、携带信息不足,对网络的特征提取和融合能力的要求更高,因此面向常规任务的通用目标检测网络在小目标检测中的效果不够理想。对此,本文分析小目标任务下的通用网络在多级特征的提取与融合方面的不足,分别对模型的主干网络和
近年来,生物质热解已成为热解领域的研究热点。作为固体有机物,生物质的化学组成复杂,而生物质的化学组成对其热解行为影响显著。传统的木质生物质研究通常将其组成分为纤维素、半纤维素和木质素三大类,但是这种分类方法不具有普遍的适用性。在部分草本生物质、农林业废弃物以及海洋生物质中,除上述“三素”以外,还包含大量其他组分。为了解决上述问题,本课题组借鉴了石油研究领域“化学族”的概念,提出了一种具有广泛适用性
本研究以巴林左旗笤帚苗产业的本土知识为研究对象。在《国家的视角》中阐述了国家推行的大型项目由于外部资本合理化导致项目的最终失败。而本研究中笤帚苗产业的成功之处在与对当地的本土知识给予了重视,在项目的实施过程中充分利用了有关笤帚苗的本土知识。所以本研究通过实地研究法和文献研究法。聚焦于本土知识在笤帚苗产业扶贫中作用。通过研究发现,基于本土知识的产业扶贫项目能持续的包容的发展,实现普遍参与普遍受益,避
一直以来,研究人员在图像增强领域创新的技术方案和算法基本都是针对暗光图像,很少有针对过曝图像,因此造成了该类图像增强技术的严重稀缺,也就意味着图像增强领域依旧存有众多的挑战和亟待解决的难点。本文针对过曝图像增强进行了相关技术研究,提出较为有效的增强技术方案,并通过高动态范围(High Dynamic Range,HDR)图像解决低动态范围(Low Dynamic Range,LDR)图像细节采集不