基于机器学习视觉目标分类识别方法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:qq1036191963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的不断发展以及人们公共安全意识的日益加深,机器视觉目标分类识别在图像与视频分析方面受到广泛关注,其智能化要求越来越受到人们重视。论文在广泛阅读与调研国内外相关研究的基础上,针对目前机器学习视觉目标分类识别存在的相关问题与不足,对视觉目标分类、运动目标表征与识别以及视频行为预测等方面开展了深入研究。论文主要特色与贡献体现在如下方面:提出了一种基于机器学习的古陶瓷无损分类识别方法。采用差分链码获取古陶瓷旋转、平移不变特征,在此基础上,确定古陶瓷边缘轮廓曲率,获取结构细节特征,并在HSI颜色空间下提取古陶瓷釉色多通道颜色特征以及反映古陶瓷纹理多样性的纹饰LBP特征。综合上述视觉特征对不同时期古陶瓷进行断代分析。实验结果表明,所提方法具有鲁棒的无损分类识别性能,可为古陶瓷科技鉴定和数字博物馆建设发挥积极作用。提出了一种基于边缘时空域轨迹的视频运动目标表征方法。为有效描述不同运动模式下视觉行为的演化过程,将具有类似时空和运动特征的各种边缘轨迹视为一组骨架,同时引入基于幅度和方向信息的编码方法对这些运动边缘轨迹进行聚类,获取时空运动骨架描述子,从而充分考虑时空轨迹对之间的运动相似性。实验结果表明,所提方法可有效表征与识别无约束条件下的视频运动行为。提出了一种用于表征长期依赖关系的叠层轨迹能量图像方法。针对全局卷积运算忽略运动目标对象的尺度或空间位置的不足,采用基于轨迹感知的分层卷积策略,将待分类视频帧分解为完整视频块、前景目标块以及精细运动块三个层次,从多个层次上对运动目标的行为进行表征,同时,将多个连续帧的轨迹映射到一幅图像上构造叠层轨迹能量图像,从而有效描述视频长期运动特征。实验结果表明,所提方法保留并丰富了运动对象的时空信息,有助于提升运动目标识别的准确性。提出了一种基于轨迹感知的多模态卷积神经网络模型。在空间卷积神经网络和时间卷积神经网络的基础上,增加全局运动卷积神经网络分别提取静态、动态和全局运动视频行为特征,通过对三模态卷积特征进行聚合连接形成视频级的基于轨迹感知多模态运动目标行为描述子。在此基础上,采用线性支持向量机对多模态卷积行为描述子进行分类识别。实验结果表明,所提多模态卷积神经网络模型能够有效识别视频人体行为,相比单一模态网络具有更高的识别准确率。提出了一种基于边界先验的前景运动目标动态增强方法。将每个输入视频帧被分割成为超级像素块集合,在每帧图像中构造一个无向加权网络,同时分别计算每个视频帧的动-静态边缘显著图,并将测地距离定义为该无向加权网络中两个超像素之间的累积加权最短路径。考虑到前景运动目标往往被具有高运动显著性的超像素包围,通过计算每个超像素块到图形边界的最短测地距离定义超像素块的运动显著性概率。引入动态对比度分割策略,获得精确的运动区域,实现视频运动目标区域的鲁棒采样。提出了一种基于注意力时间编码网络视频行为预测方法。采用基于长短时记忆网络的注意力时间编码网络模型,基于可学习权重因子加权长短时记忆网络,使输出特征更侧重于采样得到语义关键帧,在抑制视频时间冗余性的同时,对长时序视频序列进行建模。实验结果表明,所提方法不仅可在视频早期对目标行为进行预测,而且可以有效提升完整行为的预测效果。
其他文献
自20世纪八十年代以来,视频编码(Video coding)技术蓬勃发展,广泛应用于远程教育、远程医疗、可视电话、视频会议、视频点播、交互式视频游戏、安全监控、虚拟实现等领域,对整个信息产业的发展起到了巨大的推动作用。现实生活中,无处不在的视频应用更是催生出海量的视频数据;特别是近年来人们强烈追求更清晰、更流畅、更逼真的视觉体验,使得视频数据呈现爆发式增长,对视频压缩效率提出了更高的要求。高效视频
随着我国进入老龄化社会,人口老龄化问题日益严重,在2017年60岁以上老年人人口已占总人口数的17.3%,预计2050年这个比例将会达到34.9%,且老年人护理工作需要占用很大一部分医疗护理资源,所以针对老年人步行和生活起居问题的助行机器人研究得到广泛关注。此外,脑卒中等脑血管疾病的致残率较高,人口老龄化使得因脑血管疾病而残疾的人数逐年增加,且传统治疗方式存在康复效率低、理疗师费用高、训练强度大和
光场成像技术能够捕捉到环境中光线的位置和角度信息,因而可实现数字重聚焦、全景深扩展、可编辑立体成像等传统相机无法企及的创新功能。此外,由于光场图像提供了连续且细腻的运动视差,所以可为用户带来更加真实且自然的观看体验,从而降低视觉疲劳。因此,在当前公众对媒体内容新奇感及沉浸感需求迫切的背景下,光场技术将成为新一代智能视觉技术的关键支撑,同时也将推动计算摄像学领域从数字化向智能化加速跃升。然而,光场密
随着科学技术的迅速发展,人类对视觉图像质量及其应用的要求变的越来越高。由于受成像设施限制,图像质量难以满足应用需求,迫切需要应用图像增强技术与方法提高图像质量。论文在广泛阅读与调研国内外图像增强方法的基础上,针对目前图像增强方法主要存在图像细节信息易丢失、增强程度不易控制、易过增强或欠增强以及难以满足实际应用等问题开展了深入研究,提出了如下主要创新性方法:提出了基于子图像直方图均衡的图像增强方法。
聚类分析(Clustering Analysis)是机器学习和数据挖掘领域的一个重要分支,在模式识别、图像分割、特征提取等领域中得到了广泛的应用.大数据时代的到来,使得数据的种类和维度急剧增加.如何对高维数据进行聚类操作是聚类分析的重点与难点,因而子空间聚类应运而生.子空间聚类是聚类高维数据的有效途径,是对传统聚类算法的一种扩展.子空间聚类作为高维数据聚类的一种新方法,已成为聚类分析领域的核心课题
目的:心力衰竭在全球范围内都是致死和致残的主要原因之一。病理性心肌肥厚是心力衰竭的重要病理过程。延缓或逆转病理性心肌肥厚是防治心力衰竭的关键。Cathelicidin抗菌肽(小鼠/大鼠CRAMP,人LL-37)作为一种内源性抗菌肽,在心肌缺血再灌注损伤时,具有抑制心肌细胞凋亡,保护心脏功能的作用。但是,CRAMP在病理性心肌肥厚及其所致心力衰竭中的功能及其作用机制尚不明确。方法:采用ELISA法检
光学三维形貌测量在工业产品检测、逆向工程、文物保护、生物医学建模、虚拟现实等众多领域的需求日益增加。传统的接触式三维测量技术已经不能满足要求,物体的三维特征点坐标、三维几何尺寸和三维表面形貌的高精度、高效获取成为测量领域的研究热点和前沿课题。本文针对目前光学三维形貌测量研究中在测量精度和效率、测量范围以及评价标准等方面仍然存在的若干不足,采用理论分析和实验研究相结合的方法,综合机械工程、光学、电子
条纹投射技术具有非接触、高效率、高精度、全场信息获取等优点,是光学三维测量领域最具代表性的实用技术之一,在工业及民用领域的许多方面已得到广泛应用。但是,现有条纹投射技术尚存在一些问题,制约着其测量精度和测量效率的进一步提高。例如,系统标定过程复杂,且标定精度不易保证;条纹图像分析方法的精度、效率或计算复杂性有待改进等。本文围绕着条纹投射技术中的系统全参数标定、畸变校正、三维重建、相位计算和相位误差
机舱作为船舶的动力源,其安全性是船舶正常运转的基本保障,然而其火灾总数却占船舶火灾总数的75%,极大威胁着船舶航运及人身、财产安全。而机舱作为不良通风的受限空间,具有机械强气流通风、局部低氧气浓度及复杂结构布置等环境特点,对舱内油池火灾场的发展变化均具有显著的影响。但现有研究中,机舱较多的被简化成具有简单壁面通风口的单一受限空间,忽略了舱室环境对油池火的影响。因此,本文基于舱室中不同气流强度和不同
爆轰燃烧相比于爆燃燃烧具有能量释放率快、熵增小、热循环效率高等优点。旋转爆轰发动机以爆轰的形式释放推进剂含有的化学能,比传统航空航天发动机结构更简单、热循环效率更高,被认为是最具有发展前景的航空航天发动机之一。本文采取有限体积方法,针对旋转爆轰波的起爆问题,爆轰波不同传播模式形成机制和发动机推进性能优化问题,开展旋转爆轰波传播稳定性与发动机推进性能优化研究。论文的主要研究工作包含以下几个方面:(1