【摘 要】
:
近年来,随着移动支付、人工智能、边缘计算等技术的快速发展,传统零售模式发生了巨大变革。在阿里巴巴提出“新零售”的背景下,基于计算机视觉的智能售货柜受到了广泛关注。智能售货柜需要快速准确的识别目标商品,获得顾客拿取的商品信息并进行结算。但目前大多数商品识别系统部署在服务器,随着智能售货柜设备的增多使得服务器的压力增大,不能达到商品实时检测的效果,影响顾客购物体验。本文设计并实现了一种轻量化的商品识别
论文部分内容阅读
近年来,随着移动支付、人工智能、边缘计算等技术的快速发展,传统零售模式发生了巨大变革。在阿里巴巴提出“新零售”的背景下,基于计算机视觉的智能售货柜受到了广泛关注。智能售货柜需要快速准确的识别目标商品,获得顾客拿取的商品信息并进行结算。但目前大多数商品识别系统部署在服务器,随着智能售货柜设备的增多使得服务器的压力增大,不能达到商品实时检测的效果,影响顾客购物体验。本文设计并实现了一种轻量化的商品识别算法,将其部署于嵌入式平台。主要工作如下:针对售货柜商品识别算法对准确率和识别速度的需求,本文采用了YOLOv3算法。首先收集了8512张商品图像,共有9个类别,使用标注工具将商品图像标注为PASCAL VOC数据格式用于模型训练和测试。其次使用Mobile Netv2模型中深度可分离卷积与倒置残差结构重构YOLOv3模型,提出一种轻量化网络模型DS_YOLOv3。然后针对YOLOv3算法使用k-means聚类算法生成先验框鲁棒性不强的问题,采用了k-means++算法对商品数据集进行聚类得到先验框。实验结果显示DS_YOLOv3算法的m AP为94.69%,检测速度为20.34F/s,在检测速度上满足了智能售货柜的要求。针对DS_YOLOv3算法边框回归损失函数定位精度不高的问题,本文选择CIo U作为边框回归损失函数以提高目标定位精度。另外针对DS_YOLOv3算法在预处理和多尺度检测时会造成局部信息丢失的问题,采用SPP模块提取了不同感受野下的多尺度特征,并且融合局部特征和全局特征,从而获得了更丰富的语义信息。实验结果表明对DS_YOLOv3改进后的算法,m AP达到了97.93%,检测速度为19.51F/s,在不影响检测速度的情况下,提高了智能售货柜的商品识别精度。本文改进了YOLOv3算法,提出了一种适用于嵌入式平台部署的商品识别算法,并在商品数据集进行实验,结果表明改进后的算法在检测速度和精度上均取得了较好的效果,满足智能售货柜的需求。
其他文献
近年来,基于深度卷积神经网络的目标检测算法与嵌入式平台相结合的技术已经在诸多领域得到广泛应用。但在如今的国内教育领域,目标检测与嵌入式平台相结合的应用基本局限于考场的人脸识别系统,在基层的教学工作中并未得到更有深度的应用。本论文对初中物理电路实验教学工作进行调研,开发出以YOLOv3-Tiny目标检测算法为理论基础、以嵌入式RK3399Pro为应用平台的软件系统,该系统可以代替老师或学生完成电路实
无线Mesh网络(Wireless Mesh Network,WMN)是近年来逐渐成熟的一种新型无线网状网络,有着很好的自组织性能,在可扩展性,组网速度等方面表现优秀,被视为下一代无线网络的重要组成部分。随着网络信息技术的发展进步,无线Mesh网络相关应用场景开发不断拓展,其中,将其作为灾后应急网络基础架构的相关研究是目前世界范围内的研究热点。信道分配算法决定了无线Mesh网络的网络表现,以WMN
医学图像配准的主要目的是对相同设备拍摄的不同场景或者不同设备拍摄的相同场景下一系列图像进行适当的空间变换,使得两幅或多幅图像间的对应点在空间位置上对齐。把医学图像配准技术应用于医学影像分析,可以辅助进行疾病诊断和手术治疗。但是由于成像技术的不同,产生很多不同模态的医学图像。若能够有效结合多种模态图像的成像优势,提供更加准确和互补的信息,从而为医生在疾病诊断和手术治疗中提供更全面的依据。解决上述问题
光热转换智能水凝胶可以将光能转化为热能,再通过热能引发水凝胶材料的响应行为。这种具备光热转换功能的智能水凝胶材料在药物缓释、海水淡化、光驱动器件等领域具有良好的应用前景。但是目前的光热复合水凝胶存在光热转换性能差、响应速度慢、力学性能不佳、功能单一等缺点。针对这些问题,本文以开发新型具有优良光热性能的多功能水凝胶为目标,将聚N-异丙基丙烯酰胺(PNIPAM)温敏水凝胶分别与高光热转换效率的二维MX
近年来,随着科学研究和工程技术的发展,各领域对计算能力的需求越来越大,促使了多核计算系统的快速发展,国内外主流计算平台核心数不断攀升。根据科学计算领域的二八法则,程序中20%的代码往往占据80%的执行时间,这些时间占比较大的代码块通常是程序中的循环结构。因此,利用多核并行计算资源来提升程序中核心循环的性能是一个重要的研究方向。Open MP是基于编译指示的共享存储多线程并行编程模型,由于其简单、高
随着我国可持续发展战略的实施与不断深化,建筑垃圾资源化利用的研究也在持续升温。将破碎后的建筑垃圾作为骨料制备再生混凝土,是建筑垃圾资源化利用的重要途径之一。建筑垃圾在破碎过程中会产生大量粒径小于0.16 mm的微细粉末,约占建筑垃圾总质量的15%,即再生微粉,具有一定的潜在活性。相比于再生粗骨料和再生细骨料,再生微粉的回收及应用研究并不充分。与此同时,随着我国经济的快速发展,新型工程建设项目不断涌
历史文化名镇在我国的历史文化村镇体系中有着“乡之头,城之尾”的重要地位,体现着重要的历史价值、文化价值和人文价值。我国历史文化名镇保护工作成绩显著,极大地带动了古镇的经济和社会发展,但是部分地区也出现了一些大拆大建、拆旧建新、过度商业化等问题。我国相关法律法规中明确指出应当定期对规划的实施进行监督检查,但是由于我国规划实施评价工作开展较晚,在学术层面的研究处于起步阶段,尚未形成系统的理论体系。因此
2020年新基建的发展在中国大地上形成燎原之势,为国家稳经济、稳增长助力。中国社会也正伴随着新基建的发展步入智能时代,众多互联网及其相关产业发展迅猛的同时,大量的核心关键技术仍然存在“受制于人”的风险。公众对我国互联网的安全性存在一定疑虑,最具有代表性的质疑莫过于“美国能否按下中国互联网的暂停键?”之类的言论。作为互联网中最关键的基础设施,DNS(Domain Name System,域名系统)的
云计算凭借其强大的计算能力和存储能力得到了用户的认可,服务上云已成为行业应用发展的趋势。然而,云计算在给我们的生活带来了极大便利的同时也引入了新的问题,如云上的虚拟机容易受到攻击者影响、云资源分配不合理等。分析当前的云计算安全与资源分配研究现状,仍存在以下三个方面的不足:1)为了便于运维和管理,当前的云环境大多采用静态同质架构,然而静态同质的云计算环境容易成为攻击者的目标,增大了云平台被攻击的可能
语音是人们交流沟通的主要方式,随着计算机和智能电子设备的使用越来越广泛,人机交互成为了人们的必然需求,为了更加便利地使用智能电子产品,可以使用语音来实现人机交互。语音实现人机交互需要两个过程,一是智能电子设备“听懂”人类发出的语音信息,即语音识别;二是智能电子设备将文本转换为语音“说出来”,即语音合成。一般在人机交互的过程中,人们只需要听到智能电子设备发出的语音即可,但随着基于深度学习的语音合成技