基于卷积神经网络的第一视角手势交互研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:hiketty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着虚拟现实技术(Virtual Reality,VR)和增强现实技术(Augmenting Reality,AR)的兴起,第一视角(Egocentric Vision)手势交互技术受到学术界和工业界的广泛关注。手势交互是将手势信息转化为用户指令的一种交互方式,主要是利用计算机视觉和计算机图形学等技术对人的肢体语言进行识别。通过手势进行交流是人的本能。在学会语言和文字之前,人与人之间就是用肢体语言来交流。正因为手势在日常生活中最为频繁且便于识别,手势交互是继鼠标、键盘和触屏之后新的人机交互方式,尤其是智能眼镜等头戴式设备的出现,急需新的算法来帮助设备理解人的交互需要。手势交互技术,尤其是第一视角的手势交互,有着广泛的应用场景,使得本文的研究有着重要的意义。基于上述观点,本文提出了基于深度卷积神经网络的第一视角手势交互算法研究和应用设计这一课题,主要的工作和贡献包括:1.调研计算机视觉方面的最新进展,调研深度学习在目标检测和物体分类方面的研究,调研手势交互方面包括手部检测和指尖检测等方面的前人研究,然后在调研的基础上,对手部检测等课题作进一步研究。2.在调研后确定利用卷积神经网络作为算法基础,根据第一视角手势交互这一课题的特性,建立两个数据集EgoFinger和EgoGesture,分别为第一视角的单指手势数据集,和第一视角多类别手势数据集。本文对这两个数据集进行了颜色分布,空间分布等评估,考虑两个数据集的合理性以及对手势交互领域研究的作用。3.在建立的两个第一视角数据集上,本文研究了手部检测,指尖检测和手势识别三个任务,皆是在卷积神经网络进行特征提取的基础上进行。手部检测器和手势分类器是基于SSD(Single Shot Multi-box Detector)框架来搭建,而指尖检测器则是基于CNN(Convolutional Neural Network)坐标回归来搭建。4.基于上述算法的输出,本文搭建一个第一视角空中手写的示例应用。该示例应用利用指尖检测的时序输出得到的轨迹作为字符识别引擎的输入,同时利用手势分类作为控制信号,共同构成该交互系统。
其他文献
近年来,肿瘤疾病已经严重威胁到人类的生命健康,与此同时生物信息技术也在快速发展,利用基因表达谱数据在基因水平上研究肿瘤的发生发展机理,有助于肿瘤的诊断和治疗。基因芯
提出了ASP适用的两类应用服务方向和相关价值链构成.通过对价值链的分析,指出提高价值链整体竞争力和保障ASP产业平衡发展的解决方案.构建了一种基于电信运营商的ASP平台构架
【摘要】情感教育是一种以情感引导为基础,再在此基础上对学生进行熏陶和感染的教育方法。将其运用在初中英语教学中主要是为了使学生在学习英语知识外,还能收获更多的情感体验。文章基于此,首先就从‘情感体验、情绪状态和教师的教学态度’这三个方面分析了初中英语教学中情感因素的影响,然后又从三个层面阐述了情感教育在初中英语教学中的具体运用,包括‘适当地给予鼓励和支持、建立和谐的师生关系以及将情感教学策略与各项教
2007年10月11日,陕鼓与河北首钢迁安钢铁有限责任公司在北京签定了4000m^3/h高炉AV100-18轴流压缩机项目商务合同。标志着陕鼓在4000m^3/h高炉大型鼓风机市场拓展方面取得了实质
研究背景肾综合征出血热(Hemorrhagic fever with renal syndrome,HFRS)是由布尼亚病毒科汉坦病毒属中不同病毒引起的以发热、出血、充血、低血压休克及肾脏损害为主要临床表现
近年来,随着电力电子技术的飞速发展,由变频器供电的变频电机以其灵活性与低能耗在各领域得到广泛应用。本文所研究的高温气冷堆氦气驱动电机(下文简称驱动电机)为高温气冷核反应堆的冷却氦气提供循环动力,要求其无故障工作至少40年。因此,研究变频器供电时谐波对电机电磁性能与温升的影响意义重大。首先,根据该电机周向对称特点及给定参数,建立了电机1/2平面模型,作出合理假设并给出边界条件,采用有限元法进行剖分并
有机磷农药中毒在基层医院是常见病,病情一般较危重,病死率高。对中毒病人在没有血液灌流开展以前,一般常规洗胃,应用解毒药物、拮抗药,予生命支持营养等治疗。对于吸收入血液内的
近年来,随着工业和农业的发展,河道底泥污染和由底泥导致的水体的二次污染受到越来越多的关注。双酚A是常见的环境内分泌干扰物,对人和其他生物体的生殖系统、神经系统和胚胎
【摘要】初中阶段是学生学习英语知识的第二个黄金时期,经过小学阶段的学习,学生对于英语这门课程已经有了一定的认识,而且初中生的求知欲和好奇心都比较重,这些也为英语知识的学习奠定了良好的基础。但是,在当前的初中英语教学中也存在有较多的问题,在教学中,由于受到传统教学观念的影响,教师过于注重学生知识的获取,而忽视了对学生个人能力的培养,导致学生学习的英语知识沦为“哑巴英语”这对于英语教学工作的开展实际是
近年来,信息诈骗类安全事件数量快速增长。一方面,钓鱼网站传播范围更广泛;另一方面,攻击手段更趋于多样化。如何全面准确地监测钓鱼网站成了挑战性的课题,受到了越来越多的关注。从钓鱼网站本质出发,钓鱼攻击者为了使网页在视觉上达到相似的效果,通常使用合法网站中的图像元素进行伪装;同时,在网页中以图片代替文字成为常见的规避检测的手段。因此基于图像相似性的钓鱼检测变得尤为重要。在图像特征提取方面,SIFT算法