基于YOLO v4的婴幼儿踢被状态检测技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:mint_z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
婴幼儿在睡眠过程中容易出现踢被而未能及时发现的情况,这容易造成着凉感冒,并在很大程度上影响父母的睡眠质量。故实时高质量婴幼儿踢被状态检测极为重要。目前常见的婴幼儿踢被状态检测技术有基于传感器的,如温度传感器,红外传感器、光电传感器等,虽然实现简单,但是检测精度易受到环境温度、光线影响。且需将检测器固定在身体上,因此十分不方便及存在安全隐患。此外,由于传感器响应滞后,导致检测的实时性较差。而基于视觉的踢被状态检测具有非接触、人眼可见等优势,随着检测方法的发展,使其逐渐成为了主流。目前,传统的视觉检测由容易受到光线、婴幼儿着装、被子花纹等影响,其算法鲁棒性较差。而近几年快速发展的深度学习方法可以有效地规避外界环境的干扰,具有较高的识别准确性,使其成为了目标检测研究领域中的热点。但是由于其网络模型较为复杂,需要大量的样本进行训练,故难以部署到嵌入式平台中。因此,本文针对此类问题进行了研究,主要工作如下。针对目前深度学习中样本标注规则都是采用非结构约束的,这样容易造成图像目标中结构信息丢失,从而影响检测准确度。因此,本文提出了一种基于人体结构约束的图像标注规则,该规则通过对关键部位加入人体结构约束信息,提高了各关键部位的检测精度。另外,考虑到婴幼儿踢被状态检测实际应用场景样本过少,这给YOLO v4算法的模型训练造成了困难。因此,本文提出了一种基于增量学习的小样本训练方法,该方法通过引入一个用于调节批次训练中源训练集与目标训练集比例的超参数来实现。通过实验表明所提方法可以较好地适应了本文的应用场景。另外,考虑到YOLO v4模型参数量及计算量过于庞大,难以部署到存储空间、算力有限的嵌入式平台中。本文提出了一种基于YOLO v4模型轻量化的婴幼儿踢被状态检测方法。该算法中的模型轻量化是通过控制网络深度及宽度、引入小型跨残差模块和去除冗余检测头的方式来实现的,这样可以有利于部署到嵌入式平台上。通过实验表明,该方法保持了和YOLO v4相同精度的基础上,模型权重比YOLO v4 Tiny要小1.8倍。最后,为了验证所提算法的可行性,设计并实现了婴幼儿踢被状态检测原型系统。该原型系统能够实现自定义踢被状态、实时踢被状态检测、踢被报警、保存检测结果等功能。
其他文献
在如今经济全球化,“一带一路”蓬勃发展的大背景下,不同国家地区、不同语种人群之间的文化、学术、商贸和政治等方面的交流日益频繁。而通用领域场景下的机器翻译模型已无法满足更加多元化、深层次的跨语言交流需求。为解决多领域翻译的领域适应问题和多领域多模型的成本问题,本文结合终身学习算法,进行多领域翻译任务持续学习的研究,提出了面向终身学习的机器翻译系统。在面向终身学习的机器翻译系统研究过程中,本文的主要工
学位
近几年,世界被笼罩在一种名为SARS-Co V-2(COVID-19)的新型冠状病毒阴霾下,为了阻断病毒传播,世界卫生组织(WHO)大力倡导使用个人防护设备(PPE),尤其是佩戴口罩。然而,现有的口罩、手套、防护服等仅作为人体与空气之间的一层物理屏障,并不能直接起到消杀功效。为此,本文基于绿色高铁酸钾的高氧化活性,开展了这方面的尝试。提出了制备较高纯度高铁酸钾和纳米高铁酸钾的方法,解决了高铁酸钾在
学位
随着图像处理技术在人工智能、机器视觉和工业控制领域的高速发展,图像匹配技术逐渐成为众多科研学者研究的热点之一,现如今匹配技术广泛应用于图像拼接、配准以及工业中产品的质量检测等重要场景中。其中SIFT算法成为众多学者研究的重点,因为对于SIFT算法本身具有尺度不变性、旋转不变性和光照不变性等特点。目前学者对于图像匹配系统的研究主要集中在软件层面,通过高级编程语言来提高匹配算法的效率,但是这种方式容易
学位
以波音747、空客340为代表的现代大型客机,其机载电子设备种类和数量愈加庞大,导致机载网络规模和结构的复杂程度大幅提升。本课题来源于某民机航电总体所承担的国产大飞机客舱网络仿真平台项目,开展机载网络拓扑发现研究,掌握国产大飞机客舱网络设计自主关键技术,实现对机载网络设备的高效配置和管理。本文开展了快速生成树协议和链路层拓扑发现技术的研究,设计并实现了机载网络拓扑发现系统,主要工作和特色如下:首先
学位
本论文研究了8-甲基喹啉C(sp~3)-H选择性的碘化和乙酰氧基化反应。论文共分为两章:第一章喹啉类化合物官能团化反应的研究进展喹啉是一种用途广泛的杂环化合物,是许多天然产物和药物的组成部分。在过去的几十年里,这种骨架也被广泛应用于药物、农药、功能材料以及过渡金属催化剂的配体中。因此,开发高效、区域选择性的合成方法获得官能团化的喹啉类化合物具有重要的意义。目前,过渡金属催化的C-H活化是最简便、高
学位
受限场如何调控高分子链的静态和动态性质不仅是高分子物理学中一个重要的科学问题,还是生命科学中关注的焦点之一,例如,蛋白质分子如何在体内有效折叠?尽管一些工作研究了大分子在受限场中的折叠行为,然而对于不同性质的高分子链,受限空间的几何性质和排斥体积效应如何影响单链高分子的稳定性、结构以及标度行为等仍不十分清楚。为了阐明柔性和半刚性高分子链在受限空间中的折叠行为,本论文主要开展了以下两个方面的研究工作
学位
行人重识别是一种行人图像匹配技术,用于行人搜索或多目标多摄像头跨镜追踪。由于数据集制作成本高昂,因而基于无监督学习的行人重识别方法逐渐成为研究的热点。目前,在小数据集上基于自监督学习的行人重识别研究,大多是对基于自监督学习的分类任务的简单迁移,缺少网络架构各个部分,在自监督学习的行人重识别任务中,的差异性研究,也缺少对行人重识别数据集特征的研究。针对这些问题,本文围绕常用的损失函数NT-Xent展
学位
随着人工智能技术的蓬勃发展,对于语音识别领域及图像处理领域的研究也日渐广泛与深入。为了使机器更加智能,能够捕获人类的情感以使人机之间的语音交互更加人性化,对于语音情感识别(Speech emotion recognition)领域的研究逐渐得到了人们的关注。目前,围绕语音情感识别的研究大多采用深度学习方法,这些方法只是简单地将语谱图作为卷积神经网络的输入,使用图像识别技术实现识别,使得识别效果欠佳
学位
氮杂稠环化合物具有良好的生物活性,在抗肿瘤,治疗失眠症等方面有着广泛的应用。氮杂稠环化合物还具有特殊的荧光性质,在荧光探针,有机发光材料等方面也有着重要的应用。因此,氮杂稠环化合物的合成引起了许多有机化学家的关注。从杂环的构建角度来看,该类化合物的合成主要通过单环的构建、多环同时构建合成氮杂稠环化合物。本论文第一章对前人报道的氮杂稠环化合物的合成策略进行了归纳总结。本文设计了一种以芳构化为驱动力,
学位
光催化作为一种解决能源危机和环境修复的理想策略,已广泛应用于产氢、水体中有机污染物降解和重金属离子还原等领域。金属卤化物钙钛矿,因负导带(CB)位置和易调节带隙的优势在光催化产氢领域备受研究人员关注。其中,全无机铋基卤化物钙钛矿(Cs3Bi2X9,X=I、Br、Cl)不仅避免了铅毒性,且在光照、空气条件下具有优异的稳定性。然而,此类材料在水中易发生电离,严重限制其光催化分解水产氢,因此需要在饱和氢
学位