冰壶机器人视觉检测与跟踪系统研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:forbook121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学技术的进步、体育运动的普及和发展,人工智能、大数据等计算机技术越来越多的应用于体育行业当中,在体育赛事、体育场馆中计算机和数字化技术发挥着越来越重要的作用。2022年冬奥会将在北京举行,奥组委达成共识将研发智能冰壶机器人在冬奥会冰壶比赛期间进行展示互动。冰壶机器人将人工智能技术与冰雪运动相结合,是我国计算机科技水平和体育运动水平的集中体现。本文依托2022北京冬奥及龙江冰雪产业的智能冰壶机器人项目,对冰壶机器人检测与跟踪系统进行了研究。首先,采集了大量真实的冰壶运动图像序列,构建了一个冰壶的多目标跟踪数据集为后续工作开展、算法研究提供了基本的数据支持。介绍了两种基于视觉的多目标检测跟踪方法分别是Deep Sort方法和Fair MOT方法。Deep Sort方法将目标检测和特征提取作为算法的两部分分别使用两个神经网络进行计算;而在Fair MOT方法中训练了一个多任务模型,同时进行目标检测和特征提取任务。使用这两种方法在所构建的数据集上进行了实验,分析了基于视觉的检测跟踪方法应用于冰壶跟踪任务中的优缺点。然后,针对冰壶外观相似且运动过程中存在碰撞、遮挡的特点,提出了基于运动过程的点目标跟踪方法。使用模拟器对冰壶运动轨迹进行了仿真,生成了大量冰壶运动轨迹。通过分析冰壶运动的特点,设计并实现了基于卷积结构的Simi Net-CNN模型和基于长短期记忆结构的Simi Net-LSTM模型,两种神经网络模型在时间维度上进行特征提取和相似度计算,进而对冰壶运动轨迹进行跟踪。两种网络模型在仿真轨迹测试样本上取得了良好的表现。最后设计了冰壶机器人检测与跟踪系统,包括硬件平台和软件系统两部分。同时提出了一种基于射影变换、适用于冰壶机器人的冰壶位置结算方法,实现了冰壶像素位置到实际冰壶赛道位置的转换。结合基于视觉的检测跟踪方法和基于运动过程的跟踪方法,设计了一种多特征结合的跟踪算法,克服了冰壶运动中碰撞、遮挡和外观相似的问题,降低了跟踪过程中ID切换的次数,提高了跟踪准确度。
其他文献
人类可以通过视觉、听觉和触摸等多种感官来察觉世界,当人类看见一个物体时,会联想到触碰它时是什么感觉。在本文的工作中,这里建立了视觉和触摸之间的跨模型连接,将视觉信号和触觉信号都以图片信号的形式,通过输入视觉图像输出触觉图像从而达到预测触觉信号的目的。这种跨域建模任务的主要挑战在于两者之间的的规模差异,可以理解为虽然我们的眼睛可以一次感知整个视觉场景,但人类只能在任何特定时刻感受一个物体的一个小区域
手势是一种人类的肢体语言,不仅包含十分丰富的信息而且在人与人之间交流时便捷且自然,因此手势识别逐渐被应用于人机交互领域。手势识别按照手势的分类分为静态手势识别和动态手势识别,由于动态手势可以反映手势的连续变化、表达更加复杂的手势信息,因此动态手势识别具有更加广阔的应用空间。本文对基于计算机视觉和深度学习的动态手势识别方法进行了研究,综合考虑识别速度、识别正确率、应用平台的显卡规格等因素,提出了两种
随着人工智能技术的不断发展,人机交互的需求日益提高。其中,手势识别技术在人机交互领域中的应用很是广泛。手势识别是指利用信号采集设备对个体的手势运动姿态进行采样,传输至计算机,使用模型算法对采样数据进行处理和分析。基于可穿戴传感器的手势识别系统具有便携高效,交互性能良好的优点,在商业方面的前景非常广阔。实际应用场景中,手势识别技术容易受到诸多因素的干扰。包括在环境因素下手势动作前后的无法控制的抖动、
近年来,随着机器人技术和人工智能的发展,智能机器人越来越多应用在生活中。同时,普遍认为相对于单个机器人工作,机器人集群的协同工作效率更高。比如在系统容错性方面,多机器人协同工作的容错率很高,不会因为单独的某个机器人的出错或损坏导致系统整体崩溃,而且利用机器人集群进行协同工作能够完成更为复杂的任务。ROS是目前机器人领域中最受欢迎的开源平台之一,可以有效地将底层机器人硬件封装起来,并提供大量开源工具
随着人工智能、大数据技术的飞速发展,数据资源愈发丰富,而对于数据资源的利用也越来越关键。一些与人类本身相关的医疗数据往往涉及到重大利益,这些数据的拥有方也因此无法随意交换数据,这阻碍了人工智能技术在医疗领域的发展。因此,生物医疗健康领域目前面临着因数据无法共享而产生的数据孤岛问题,针对这一问题,联邦学习成为了解决它的答案。而联邦学习过程中,多方通信节点需要进行数据对齐的过程,然而与人相关的数据在I
图像扫描显微(Image Scanning Microscopy,ISM)成像方法具有高分辨率成像特性,在生物医学领域具有广泛的应用前景。ISM在共焦显微的基础上使用阵列扫描方式实现高分辨率成像,可将分辨率提升至衍射极限的2倍,且实验装置简单、易于实现,成为超分辨显微成像领域的研究热点。但该方法需要采集大量图像,数据处理量大、成像速度慢,受扫描范围和物镜数值孔径的限制,无法满足大视场快速成像需求。
软件漏洞严重性可以帮助测试开发人员合理地分配有限的资源,优先修复更加严重的漏洞。然而,漏洞的发布和严重性的人工评估之间存在时间滞后,可能会导致“零日攻击”问题。因此,利用漏洞描述、源代码等信息自动、及时、准确地预测软件漏洞严重性具有一定的现实意义。现有方法存在以下问题:(1)每个项目的CVE漏洞描述数据量少,且不同项目的漏洞描述语言风格差异较大;(2)忽略了多个CVSS漏洞特征之间的共享信息;(3
随着智能设备的普及和信息技术的迅猛发展,视频已经成为人们生产生活中不可替代的信息载体。为了对抗视频数量的爆炸式增长,理解分析视频内容,并扩展应用到现实场景中,有助于提高人们的生产生活水平。本文针对发生在公园、停车场等公共场所中的危险性行为,设计实现了一个基于深度学习的视频行为动作识别模型,为设置在公园、停车场等公共场所中的监控设备添加自动识别并反馈危险性行为的功能,为监控人员提供一种智能化辅助解决
药物治疗对于人类的生命健康起着至关重要的作用。而药物研发过程复杂且漫长,需要投入巨大的人力和研发经费,高昂的研发成本最终影响到药物的价格和患者对治疗方案的选择。分子属性预测是新药发现中的一个重要环节,可以辅助研发人员发现候选药物,加快药物研发速度,从而降低研发成本。目前,深度学习技术在药物研发领域中的应用取得了一定的成果,不断地提高分子属性预测的准确性和可靠性成为了科研人员的主要追求。本文主要研究
航空发动机作为飞机的动力源,由于极高的加工技术、材料和设计能力要求,已成为中国航空工业的重点发展对象。高温高压环境对发动机转子工作性能提出了极高的要求,其中转子不平衡量是发动机转子优良性能评定的重要指标,它直接影响了转子的振动特性。本课题以多级盘片分离转子为对象,从装配工艺技术着手,研究降低转子不平衡量的装配方法,以改善航空发动机的工作性能。针对盘片分离转子不平衡量传递机理不清晰的问题,建立多级盘