论文部分内容阅读
奶牛躺卧、站立、行走、饮水、进食等基本运动行为,蕴含大量与奶牛健康有关的信息,实现奶牛基本运动行为的准确、快速识别对奶牛健康状态智能感知具有重要研究意义。针对人工方法成本高、实时性差、接触式传感器损害动物福利,且易受晃动、碰撞等因素产生噪声数据、现有奶牛行为识别算法精度较低、复杂度较高等问题,本研究基于深度学习技术,开展了非结构场景下奶牛基本运动行为识别方法研究,以期提高奶牛福利养殖及现代化养殖水平。其主要研究内容及结论如下:(1)针对现有奶牛目标检测算法复杂度高、检测精度较低且易受开放式牛场环境和奶牛遮挡干扰等问题,提出了一种EYOLOv5(EfficientYouOnlyLookOncev5)算法,在高效目标检测网络YOLOv5基础上,通过引入SA(ShuffleAttention)注意力模块和MSHA(Multi-HeadSelf-Attention)模块实现高维度特征的筛选和局部、全局信息汇集;引入PANet (PathAggregationNetwork )实现不同尺度语义特征交互;采用CIOULoss及加权DIOU-NMS实现对重叠目标回归框的精确筛选。试验结果表明,本研究算法检测精度可以达到98.20%,相比于YOLOv4、YOLOv4-Tiny、YOLOv5分别提高了12.70%、9.00%、2.60%。其Params为7.00M,FLOPs(Floating-pointOperationsPerSecond)为8.38G,模型大小为13.60M,FPS为100f/s。结果表明该算法可以有效应对不同天气及不同程度遮挡,具有一定的鲁棒性。(2)针对目前奶牛跟踪研究多数是基于传统算法、模型复杂、结果不稳定且需要人工干预进行关键参数选取等问题,构建了基于EYOLOv5的DeepSort多目标奶牛在线跟踪算法,通过卡尔曼滤波和深度特征匹配实现自然场景下奶牛目标框在视频帧的关联。最终在20段包含不同目标、不同复杂度的测试视频的平均精度为82.50%,平均FPS为40f/s。DeepSort算法可以有效地抑制目标ID跳变,将DeepSort应用于自然场景下多目标奶牛的高效跟踪是可行的,为奶牛基本运行行为识别系统的开发奠定了基础。(3)针对奶牛行为监测耗费大量人力物力、奶牛对穿戴式传感器易发生应激反应等问题,提出了一种基于视频分析的无接触奶牛运动行为识别算法,以期实现对奶牛躺卧、站立、行走、饮水和进食五种基本运动行为的识别。首先利用高效的特征提取网络EfficientNet实现奶牛视频帧空间特征的提取,然后,在EfficientNet的3-5层利用BiFPN实现高效的特征融合,最终送入融合Attention机制的BiLSTM模块实现在视频帧时间序列的特征聚合,从而实现基于视频分析的奶牛运动行为的准确、快速识别。该算法可以有效地区分奶牛行走、站立、躺卧、进食和饮水五类基本运动行为,最终奶牛行为识别精度为97.87%,比经典的Resnet50-LSTM提高了4.25%。表明该算法适用于自然场景下奶牛基本运动行为准确检测。此外,本研究算法可实现实时的奶牛行为检测,FPS可达134f/s。(4)针对现有奶牛行为识别研究无法有效处理时空信息及模型复杂度较高等问题,本文提出了一种E3D(Efficient3DCNN)算法,直接通过沙漏型SandGlass-3D模块实现对时空特征的抽取,其中利用深度可分离卷积减少模型的复杂度,引入ECA(EfficientChannelAttention)模块实现对特征通道信息的筛选。该算法可以有效地区分奶牛行走、站立、躺卧、进食和饮水五类基本运动行为,在自然场景下,本研究算法对五类奶牛行为的识别精度为98.17%,分别比VGG16-LSTM、C3D、MobileNetV2-3D、ShufflenetV2-3D提高了6.50%、7.92%、9.41%、5.16%。表明E3D算法可以直接、高效地处理时空特征,具有更高的识别准确率,适用于自然场景下奶牛基本运动行为的准确识别。E3D算法的Params为2.35M,FLOPs为0.98G,最终模型大小为9.38M,FPS可达205f/s,表明该算法具有较好的实时性和移植潜力。(5)利用PyQt5进行GUI设计,结合本文所提的奶牛基本运动行为识别方法,设计了非结构化环境下的奶牛基本运动行为识别系统。通过奶牛运动场的监控视频进行验证,最终结果证明该系统可实现准确、实时的多目标奶牛检测、多目标跟踪及基本运动行为识别等功能。