多摄像头无人商店高效精准定位研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:baihuiguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人口红利的退去和社会老龄化会加剧,雇佣人力的成本越来越高,以及疫情影响带来的减少接触的必要,从需求和行业竞争的角度来看,传统便利店都需要转型。因此无人零售的正有着良好的发展前景,国内外的多家研究机构和公司正在研究无人商店的落地以及其涉及的前沿技术。现有的无人商店的主要实现是利用RFID标签技术,需要设置专门的结账台,用户手动把商品在结账区域识别RFID标签,对于用户来说这样的购物体验不够流畅,同时给每个商品都贴上标签也会增加人力和经济成本。因此现有的研究集中在将深度学习的技术应用到无人商店,实现完全基于摄像头的无人商店和基于多传感器融合的无人商店解决方案。多摄像头的行人3D定位是计算机视觉的一个重要研究课题,在基于传感器融合的无人商店的应用中,需要获得顾客的3D坐标,并且与商品的3D坐标计算距离,以此来进行商品和行人的关联。本文设计了一个基于多摄像头的行人定位系统,系统分为三个模块,分别是目标检测与追踪模块、跨视图目标关联模块、行人3D定位与轨迹连续处理模块。目标检测与追踪模块获得单视频下行人的检测框和身份ID,跨试图目标关联模块负责匹配多摄像头中同一个人的ID,由此获得同一个人在多摄像头下的2D坐标。行人3D定位与轨迹连续处理模块负责将多视图下的2D结合计算出行人的3D坐标,最后将3D坐标进行平滑去噪处理获得连续的3D坐标轨迹。最后本文将本系统运用到了基于传感器的无人商店解决方案。重量传感器检测到重量的变化,检测动作事件的类别,通知目标检测模块抓取关键帧检测行人的2D坐标,然后通过跨视图行人关联获取行人的3D坐标,最后与已知的商品3D坐标进行距离计算,将商品信息与顾客的身份关联起来,得到购物清单。本文分别在不同数据集上测试了各模块的准确率,在无人商店的数据集测试了基于传感器融合的无人商店解决方案,结果表明,各模块均满足需求,达到较高的准确率。最后对结果进行了分析,提出了未来可改进的内容。
其他文献
时序动作提名生成,输入是一段未分割的长视频,根据其内容来定位动作片段,包括其开始时间、结束时间和动作类别,可应用于视频推荐,智能安防,智慧广电等场景。现有的时序动作提名生成算法已取得了瞩目的成绩,但仍难以满足现实场景中的应用,因此是当前计算机视觉领域的热点研究问题之一。具体的说,目前的方法大多致力于生成灵活的动作边界与高质量的置信度,但是仍然受限于匮乏的视频时序依赖和动作边界建模,导致了充满噪声的
学位
随着软件产品在我们的生活中有着越来越广泛的应用,程序的规模也急剧地上升,软件错误的产生可能会导致可怕的后果,而程序修复工作消耗了大量的资源。所以,自动化程序修复不仅可以降低程序开发人员的时间开销,还可以减少浪费在程序调试上面的时间。但是,真实世界的程序规模较大,当前修复方法对其支持效果不是很好,错误的修复率较低。程序补丁中的修复成分常常来源于被修复的程序自身,并且很多人工补丁的大体模式比较类似,存
学位
软件漏洞对于软件来说具有重大危险,影响着软件系统的安全。随着当今开源软件的发展,软件开发中往往进行代码逻辑的共享以及代码库的复用,使得漏洞也在开源软件中广泛传播。在实际应用软件中功能的不断增加以及软件版本的不断迭代,使得软件的复杂度随着软件的规模不断提升,漏洞函数在版本的迭代中已经和原有的漏洞函数具有很大的差别。而对于刚修复完成的漏洞函数,其和补丁函数之间往往只具有微小差别。这种漏洞与漏洞的低相似
学位
微服务设计模式通过业务解耦将复杂业务拆分为多个小粒度的微服务,且各微服务独立进行版本迭代和部署,可有效改善复杂分布式系统的开发与运维。开发人员遵循特定的微服务设计原则进行系统设计,但后续版本迭代升级过程中,可能会向微服务系统内引入架构异味。这些架构异味通常不会对微服务系统造成功能故障,但它们的存在会影响微服务系统的可持续性、可扩展性,同时可能对微服务系统运行态的数据表现产生影响。但现有研究缺少对架
学位
如何提高软件开发效率一直是软件工程领域的一个核心问题。在软件行业快速发展的今天,为了提高软件开发的效率,开发者往往采用代码复用的方式,如调用现有的应用程序编程接口(API)。现有的检索API知识的方法或工具都只实现了单个API或API子图的搜索。但是,单个API往往难以实现完整的功能,而API子图中包含的信息较为冗余和复杂难以被直接应用于实际的软件开发过程中。实际上,在利用大量使用API的编程语言
学位
通过识别软件仓库中执行的维护操作,可以降低软件的维护成本,从而确定资源分配,提高维护效率。在大多数软件系统中,软件仓库中的问题跟踪系统可以对错误进行跟踪,代码更改可以被集成到代码管理仓库的表示中。了解在源代码存储库中执行的维护活动可以帮助软件开发人员减少不确定性,并通过提前计划和为源代码维护预先分配资源来提高成本效益。针对软件开发过程中的提交日志涉及的代码更改主要使用3种分类标签:bug修复的正确
学位
随着互联网的普及以及智能设备的迅速发展,虚拟个人助手(Virtual Personal Assistant,VPA),也称软服务机器人,逐渐进入人们的生活的方方面面,提供便利。同时,会话推荐系统,也即基于对话的服务推荐系统,以VPA作为载体,也逐渐成为研究热点。会话推荐系统以其可及时获得用户反馈的特点,能够更加精准的命中用户的需求。同时也带来以下几个挑战:如何捕捉用户偏好并对其建模?面对海量服务如
学位
伴随着智慧教育产业的不断发展,师生对于作文自动评分(AES)的需求不断涌现。一套完整的作文评分系统需要实现从文字识别到文本评分的全流程,但现有研究成果忽略了识别和评分之间的关联性,也忽略了书写质量等视觉特征对于作文评分的影响,在这其中也隐含了如何将多模态特征进行融合建模的科学问题。另一方面,现有的研究多是针对扫描的高质量图像,一套可用的评分系统还需要解决自然拍摄场景下含噪图像的文本识别问题。因此,
学位
报纸
随着服务业的高速发展,大量的服务涌入互联网,人们逐渐步入了服务互联网时代。在服务互联网中,万物都可以被服务化,也推动了物联网以及云计算等领域的发展。这些研究领域的发展对服务系统的设计与建模提出了新的要求,如使用微服务架构作为系统的实现架构、在系统设计时要考虑到资源位置的约束以及服务价值质量的约束等等。与此同时,随着用户需求的不断变化,服务系统的设计也需要不断进行演化。所以如何更好的设计与构建满足用
学位